在资讯大爆炸的时代,大数据成为时下热门话题,人人大肆追捧,各行各业抓住先机,力求将手中的数据变成利益资产,透过数据了解市场进而拓展业务。
数据相关行业创造不少工作机会,数据专才炙手可热,在外国,大数据相关工作岗位甚至可以细分成多达65种不同工作项目。
在马来西亚,数据专才未有绝对的标准定义,但笼统而言,数据专业人士的工作内容可以简单划分成三大项:分析并总结数据、编写技术方案代码和统计建模。
而比较常见的三个职业,就是我们耳熟能详的数据分析师、数据工程师和数据科学家。此外,信息安全分析师以及机器学习工程师亦是大数据时代下所衍生的重要行业。
数据分析师
核心角色是针对现有数据进行提取和分析,找出对企业有用的数据后定下结论,并给予公司适当的解决方案。
举个简单的例子,A超市的数据分析师提取用户的消费情况,针对消费物品进行分析,了解用户的类型,比如家庭消费、学生或是单身人士,来总结和预测该用户未来的购物清单。这样就十分有利于A超市未来进行商业促销活动(设置优惠卷或为特定商品打折),吸引群众再次前来消费。
从收集、整合到分析,数据分析师会大量使用统计学常用的方法包括趋势分析、多维度分析和假设检验等来进行工作。在工作的过程中,一般都需要熟练SAS(Statistical Analysis System)的数码分析程序。
目前,我国私立与国立大学近年来所开设的数据科系(数据科学、工业统计学),基本上都已将SAS软件学习纳入教学范畴。
数据科学家
数据科学家的工作内容同样是分析数据,但区别在于数据科学家的分析目的是为了找出更多的潜在研究途径和问题,方式是较具探索性的,并不完全局限在解决当前的问题上。
另外,数据量日渐庞大,复杂程度也一直提升,很多传统的统计工具无法完成目前的分析工作。为了解决问题,数据科学家会针对现有的数据来决定使用适合的模型,通过该模型输出的结果找出对业务最有利的决策。
因此数据科学家的工作内容是更加复杂的,较倾向的的分析程序分别是R和python。
数据工程师
这项工作不太关注数据本身,属于技术管理层面,比如负责开发数据架构以及数据储存,也协助导出可供数据分析师使用的格式。
简单来说,若把海量的数据比喻成大批货物,数据工程师就是仓库建造者,架构可容纳数据的空间。他们还需要扮演数据管理员的角色,编写程序来提升查询数据的速度,在有需要的时候把相关的数据导出,转化成可分析的格式。
因此,数据工程师需要非常熟悉最新的数据库技术和数据管理系统,也得掌握数据库语言,其中SQL(Structured Query Language)是绝对必备的。
信息安全分析师
随着网络攻击的问题日渐增加,信息安全师的岗位也越来越重要。
其主要的工作职责是监控网络的安全问题,并进行安全预估,一旦发现有什么漏洞则需要立即采取修复行动。信息安全分析师也需紧随现代的趋势,不断精进和研究信息安全技术,掌握编程是最基本的要求。
由于网络攻击和骇客行动在系统中是难以检查的,因此信息安全师务必具有注重细节的能力,在关注系统性能时,就算其细微变化都需要保持敏锐的判断力和警惕性。
在整个工作系统中,他所扮演的角色就是一个保安人员,在预估风险后,建筑合适的安全围墙,并不断精进围墙的稳固性。一旦发现围墙有任何外来入侵,信息安全分析师需要立即采取行动进行修复,与内部人员协调以确保系统安全。
机器学习工程师
机器学习是人工智能的分支学科,实际上就是研究机器如何以过往的学习经验来建模,针对数据的不确定性对未来进行预测。
在数据分析的过程中,数一般上据科学家会使用机器学习来进行建模,在人工智能越来越强的情况下,使用机器学习建模的比重增加,因此即独立衍生出了机器学习工程师这样的职称。
机器学习工程师全程参与机器学习的工作,在机器学习的基础上建立算法,而这些算法无需在编程的情况下即可进行。
因此,对机器学习工程师而言,算法的理解与利用是非常重要的技能。
那么,到底在大学中,数据相关的专业是什么样的存在?
数据运用的范围十分广泛,适用于社会里的每个领域。
虽然这个行业的背景与统计学、数学和电脑科学有着非常紧密的关系,但提供商业和社会方向决策的能力也至关重要。
因此,我们可以发现网络上招聘数据专才的要求并不局限于固定科系,但企业更偏好数学、统计学、电脑科学或软件工程毕业的本科生。
针对上述的学科,实际上是与数据专业相互交叉、相互促进的。
然而在大数据时代的呼声下,数据专业成为未来趋势的热门标签,本地大专近年来也争先独立将“数据科学“设为一门全新的学科,以及衍生了其他专业如业务分析和工业统计等,以迎合庞大的市场需求。
以马大为例,去年9月份开设了为期4年的数据科学学士学位,其中两年为在校学习,而其他时间则是进入相关的领域实习。
过程中,学生们将学习数据领域所需的硬技能,包括编程、统计分析、机器学习和建模等。
另外,由于数据领域也十分注重毕业生的软技巧,例如批判性思维、企业家思维以及良好的沟通能力。因此,相关的基础训练也纳入马大的必修科目中。
和大部分的学府相同,马大与将SAS系统纳入正课,并与SAS软件研究所(SAS Institute)合作,在完成课程后将颁获世界公认的SAS联合证书。值得注意的是,数据领域是需要大量的实战经验积累,马大也和应用数据科学中心(CADS)携手合作,提供学生适合的实习机会。
一站式的专业课程,无疑是在统计学、数学和电脑科学的教学基础上,打造了一个更直接、明确和针对性的学习选择,帮助学生们迈向数据专家的领域。
由于涉略广泛,数据科学本科生除了拥有数据科学家、数据分析师和数据工程师就业前景,也有机会成为机器学习工程师、统计员、网络计量所、项目和企业家等等,拥有不少的出路选择。