蓝盟IT小贴士,来喽!
提出“本世纪最性感的职位”,行业内的招聘人员必须面对大量数据科学相关的求职申请,这样的热度现在看不到冷却的倾向,同时越来越多的数据科学相关的开发工具也变得容易使用。 人们对数据科学家能给我们带来什么的期待发生了变化,越来越多的公司认为,培训机器学习模式只是在数据科学领域取得成功所需要的一小部分工作。
在这里列举了作为伟大的数据科学家最有价值的四个品质
一、把重点放在业务的影响上
对于数据科学家来说,最常见的推动力之一就是发现数据模式的好奇心:探索数据特点,利用最新技术进行实验,进行系统测试,最终得到新的发现,这些工作使数据科学家们兴奋不已。 这种科学动机是数据科学家应该具备的。 但是,如果这是唯一的动力,那也会成为问题。
如果停留在数据层面,思维方式会受到限制,最终会迷惑于数据统计的细节,忽视具体的应用场景和更大的公司业务背景。 顶尖的数据科学家知道如何将他们的成果整合到整个公司的业务中,最终转变为业务价值。 在实际制定方案之前,只要技术能够简单应用,他们就不会花费太多时间追求复杂的技术实现方式,他们就会明确项目的意义,直接关注行动和程序对整个团队的影响, 与有关人员事先进行沟通的他们为新的项目和计划不断提供想法,不关心自己在他人眼中是否“大脑开阔”,他们以自己的方案帮助更多的人为荣,不使用更先进的技术。
数据科学是目前尚未规范化的行业,在学术教育与产业需求之间存在着巨大的沟通。 最先进的数据科学家即使走出“舒适的地区”,也会面对更加棘手的问题,最大限度地发挥其作用。
二、扎实的软件工程技能
考虑到数据科学家的理想形象,人们脑海中浮现出的是一流大学工作着名的AI学科教授。 如果企业需要提高模型准确度以面对更加激烈的竞争,结合这样的人才是明智的。 因为为了提高传统方法的精度,必须关注数学方法的细节,验证复杂的方案,并进一步开发针对特定问题定制的统计学技术。
然而,在实际工作中,这种场面并不多见。 对于大多数企业来说,标准模型的精确度足够高,投入大量的时间和人才来优化模型,使其成为最先进的模型,并没有那么经济高效。 更重要的是,通过尽快制作精度良好的模型并构建模型和业务系统的反馈周期,可以开始迭代,快速找到模型的最佳使用场景。 为精度的微妙差异而烦恼通常不是数据科学项目成功的关键,这也是实际业务开发中工程技能比科学技能更为重要的原因。