一些早期的开源技术采用者开发出专业知识单干,但“第二波”的公司渴望可以快速建立并运行。 它们可能没有自己员工来作做开发的工作。
引入数据科学家
目前对大数据人才确实是有巨大的需求,而且企业正意识到运行开源平台成为可以吸引到受过训练的的人才的最佳位置。开源技术,尤其是R,被广泛应用于学术界。
此外,这些数据科学家能更好地利用开源平台。Imran Ahmad是一个数据科学家,他已经开发了自己的网格计算算法,称为Bileg的Hadoop竞争对手,它是基于开源的Globus 工具箱(GT4)的。多伦多一家为云环境开发数据分析技术的Cloudanum公司总裁说,开源平台最根本的优势是,像他这样的人能看到它根本的数学依据。
“如果在开源上,您可以向下挖掘并看到为什么我得到这些结果,为什么这些结果是最优的,”Ahamad说。
专有数据分析软件大多数时候能很好地工作,他补充道。但是当一个“不寻常的场景”出现时, 让你无法信任你的结果。“它们将偏离你要找的东西,”他说。“这真是一种正可怕的情况”。
毫不意外,有统计建模背景的聪明才智也供不应求,尤其是像如金融机构这样其它领域的机构正在求贤若渴。
“他们已经聘请了大批校外的人到数据科学部门或研发部门和建模部门,” Smith说,“而他们发现这些人都学习过R,而不是所说的SAS。”
所以毫不奇怪,有统计建模背景的聪明人才被求贤若渴,尤其当像金融行业大量招聘他们的时候。
“我们提供Greenplum的咨询业务,”Davis说,“这是我们的数据科学团队, 这些人是博士, 已经是各种行业及其相关行业的专家。我有聪明而勤奋的人 ,坦白说, 这些人正与客户一起让他们的数据发挥作用。”
SAP集团营销经理Jason Kuo说,需要执行比如预测分析这样复杂任务的公司无疑正在搜寻着高校的人才。他说, SAP的新产品组合了一个友好用户界面和拖放功能,将易于数据科学家转换角色到企业的世界里。
“这些人带着他们的R专长, R的背景,并寻求和R相关的工具,”他说。“现在有趣的是,在学术环境中,不管出于什么原因,不管是它的廉价或者熟悉度,他们更有可能使用没有GUI的 R,而不用图形界面。而现在他们走进企业的世界, 在那里他们的要求更高了, 项目转变的框架更快, 也许正在追踪投资回报率(ROI)等等。
“公司能说…你需要什么才能更成功? 我们如何能使你更有效率? 和他们为这些统计师准备了在过去不会有的预算。”
如果你不能战胜他们
SAS研究公司平台开发副总裁Paul Kent,为一家经常被视为属于大数据领域的对立面的公司工作,开发了专有数据分析算法替代那些用于像R这样的开源语言。
Kens说, 在某种程度上, SAS并把开源社区作为一个并肩齐驱的竞争者。新技术可以在开源环境中非常迅速地开发,而他的公司在将技术转化成适合市场的产品功能之前可能需要更多的时间来研究它们。
“我们需要更多一点时间对技术作出反应并测试所有的不同角落和排列你可能使用它的方式。所以, 我们的响应可能有点慢。
然而,他说,SAS在大型的技术支持市场有优势,而且有使技术适用于不同机构的专业知识,无论是零售企业、银行、或医疗机构。SAS的优势在于“对特殊领域的数学应用。”Kent说。
与此同时,他说,SAS掌握趋势,并给它的客户一样的开源选项。Kent说SAS已经“修建一座到R的桥梁”就像它对Hadoop所做的那样。Kent表示,每当开源社区有了好的创意,SAS都会关注。
“从长远看,搭建桥梁或界面到这样的创意是有用的,胜过试图假装它不存在。”
原文链接:http://www.chinabi.net