编辑
请点击输入图片描述
身在坡县的你,知道身边正在发生着什么吗?知道这个地图上的小红点正在往哪个方向努力吗?
编辑
新加坡之小,Source: Maphill
众所周知,新加坡的建国史就是一部逆袭史。1965年8月,以巫统为首的马来西亚执政联盟在国会紧急通过修改宪法,以126票赞成、0票反对,将新加坡驱逐出马来西亚。时任新加坡州长的李光耀在电视台的镜头前放声大哭,宣布独立建国。
编辑
新加坡被马来西亚开除,Source: 网络
作为20世纪世界政坛上的耀眼明星,李光耀是何等坚毅人物,怎会因为新加坡的独立而悲痛哭泣?根据李的自传《风雨独立路》,原来,他是在为新加坡的未来担忧:“我们眼前困难重重,生存机会非常渺茫”。
编辑
新加坡国父李光耀,Source: 网络
独立后的新加坡只有七百多平方公里,自然资源极度匮乏,连淡水都没有。从地缘上看,新加坡的北面是翻脸不认人的马来西亚;南面是虎视眈眈想要吞并自己的印尼;临近的马六甲海峡又是兵家必争之地。彼时的新加坡,可谓危如累卵,当时的国际评论都认为新加坡将走投无路。
生存的危机感,也是创造经济奇迹的原动力。为了求存求活,新加坡政府毅然选择了走工业化的道路,利用港口贸易的优势吸引外资,顺应全球化发展的大趋势,大力发展经济。
新加坡用了四十多年,从当年风雨飘摇的小渔村,变成了今天的世界金融中心。根据最新数据,新加坡人均GDP为57714美元,是全球最富裕的国家之一。
编辑
今日新加坡,Source: 网络
然而,就算已经完成逆袭,新加坡人还是有着居安思危的忧患意识。随着计算机、互联网、大数据、人工智能等科技的发展,新加坡政府开始战略转型,开启信息化时代,不断推出相关政策,力图在全球竞争中继续立于不败之地。
编辑
Source: 新加坡政府网站
目前,新加坡政府正倾全力进行智慧国家建设。根据新加坡资讯通信发展管理局,智慧国的理念核心可以用三个C来概括:连接(Connect)、收集(Collect)和理解(Comprehend)。其中,需要收集和理解的,正是数据。
1.从数据到数据科学
数据是智慧国家建设的核心。因此,数据科学在新加坡政府眼里的地位,已经不言而喻了。而这里的潜台词,你懂得——从事数据科学相关职业的人才将在新加坡非常吃香!
市场是最灵敏的温度计。根据联合早报报道,新加坡目前数据相关的人才处于供不应求的状态。而根据Payscale的数据,目前新加坡数据科学家的年薪中位数已经达到72K,加上Bonus,最高可以达到112K!
编辑
Source: Payscale.com
BestTop整理了Glassdoor.com上一些企业的数据科学家的薪资水平供大家做进一步参考(单位:新币/月),可以看到,新加坡数据科学家的月薪基本都在5000新币以上,最高甚至能达到10000:
编辑
Source: Glassdoor.com
那么,数据科学到底是做什么的呢?
简单来说,数据科学家是一项综合了数学、统计、建模、编程,以及垂直行业知识的工作,可以从海量数据中找出最有价值的信息、洞见甚至知识,并应用于商业和研究领域。
编辑
Source: 网络
数据科学家像是探险家与侦探的结合体,有些人甚至戏称数据科学家是“手里拿着水晶球(其实是MacBook Pro),嘴里嚷嚷着令人难以理解的晦涩词汇(机器学习,随机森林,深度神经网络,贝叶斯后验等),并对未来做出精准的预测的那么一群巫师”。
关于数据科学的“办案流程”,BestTop的数据科学领域导师Allen(投行出身,2年Deutsche Bank流程优化分析师经验;前KPMG兼并收购分析师;前Uber数据分析师)是这样总结的:
问题定义:谁是你的客户?你的客户到底想要你解决什么问题?你应该如何把一个模糊的需求转化为一个具体的,界定清晰的数据问题?
数据收集:是否有现成的数据?如果是的话,哪一部分的数据对解决问题有帮助?如果不是的话,需要哪些额外的数据?收集这些额外的数据需要动用哪些资源(时间,金钱,技术)?
数据处理:在现实场景中的原始数据一般很少能够被直接使用,数据科学家在面对原始数据时通常要面临数据错误,数据损坏,数据丢失等一系列问题。数据科学家首先要做的便是将原始数据进行清洗,并将其转化成适合进一步分析的数据格式。
数据挖掘:一旦完成了数据清洗,下一步需要做的就是数据挖掘。数据挖掘指的是对数据内部隐含的规律,模式以及相关性进行探索,从中提取有价值的信息。
数据建模:数据建模通常是整个数据科学流程中最引人瞩目的一个环节,在这个步骤里,数据科学家会根据要解决的问题和现有的数据选择适用的机器学习,深度学习或是统计的相关模型,然后从模型输出的结果里提炼出能够为决策服务的内容。
成果沟通:这是最后一个也是最重要的环节,所有你之前完成的分析和建模工作将会变得一文不值,如果你不能够把你的成果有效地与你的领导进行沟通。这个环节通常是最容易被数据科学家忽略或轻视的,但事实上,沟通能力以及如何让非技术背景的受众能够非常直白地理解一个技术话题是至关重要的。
2.数据科学相关职位
由于数据科学属于计算机、数学统计和商科的交叉领域,数据科学相关的职位也有着不同的偏向和侧重。一般来说,数据科学有两个分支, 一个偏向technical,对技术的要求比较高,如数据挖掘师,数据架构师;一个偏向Business,即看重商业敏锐度,如数据分析师、商业分析师。
大数据工程师
主要工作内容:收集和存储大量数据;构建,测试和维护大规模的大数据架构,如数据库和数据处理系统;通过接触基于Hadoop的多种技术 – MapReduce,Hive MongoDB或Cassandra,参与设计大数据解决方案;负责数据库集成;使用非结构化数据集并将其转换为适合分析的格式的数据集。
数据架构师
主要工作内容:负责组织数据架构的各个方面,包括:造型、建造、实施、维护;研究企业的数据需求,并为每个部门/服务区域实施战略模型;定期更新有关计划,发展和关注领域的管理。
数据仓库经理
主要工作内容:设计,开发和维护数据仓库和数据集市;与参与数据库操作的所有专家(开发人员、管理员和经理)协作,以确保整个数据系统符合:该组织的战略目标和组织数据架构的目标。(市场上的一些仓库产品包括Microsoft SQL Server和Oracle。使用它们的企业需要雇用数据仓库管理员。)
数据建模师
主要工作内容:基于复杂的业务数据开发用户友好的计算机系统数据库;与数据架构师协作,并使用理论、逻辑和物理数据模型来创建满足组织要求的数据库解决方案;设计模型,通过以下方式提高运营效率;减少数据冗余 增加数据 – 系统兼容性,以确保在整个组织内有效地传输数据。
商业智能分析师
主要工作内容:根据要求为管理层提供基于数据的见解、研究数据趋势,检索对业务运营至关重要的信息。
3.拿下数据科学offer
想要成为一名数据科学家,就要做好学习多领域知识的准备。总的来说,数据科学相关的技能可以分为两大类:
第一大类是Hard Skills,也就是非常偏向编程、建模技术的能力,包括SQL、R和Python等数据处理分析相关程序的掌握。(文末可领取Hard Skills学习资料包)
其中,如果你想成为一名数据工程师,SQL这款数据库语言绝对是必备的。
编辑
请点击输入图片描述
而关于R和Python之争,近年来,Python已经成功上位,成为市场上的主导者(可以看这里回顾旧文:Python这次彻底上位!到底凭什么碾压C++/Java/R/PHP…?),建议把学习重点放在Python上。
而关于大数据处理,你可以选择的技术有Spark,Hadoop,Kafka,Hive。但总的来说,Spark是业内公认的应该首先学习的大数据框架。
在可视化工具方面,Tableau是所有角色的首选。
编辑
请点击输入图片描述
第二大类就是Soft Skills,包括沟通和呈现的技巧:你如何去说服别人,如何去呈现你的分析结果;以及特定的垂直领域的商业知识,比如商业模型和驱动因素。
然而,作为一名求职者,该如何准备才能顺利拿下数据科学的offer呢?BestTop数据科学领域的导师们认为,大家可以从以下几方面努力:
教育背景。如果你的教育背景是偏数理的背景,比如数学、统计、计算机,或电子工程类的,你就因该强调你的教育背景。
实习经历。如果你有数据分析相关的实习,你应该把它强调出来,特别是你如何完成一个数据分析项目的过程。
自学课程。如果也没有实习经验,你就应该在简历里强调你的相关经历是通过完成一些自学课程获得的。
数据分析比赛。如果你参加了一些数据分析的比赛,即便没有获得名次,也可以把它列在简历里,然后面试的时候和面试官分享你参加比赛的经验,以及你从中的收获。
2019春招进行时,目前是做求职准备的黄金时间。