当前位置: 网学 > 编程文档 > SQL SERVER > 正文

解决大数据的开源工具

来源:Http://myeducs.cn 联系QQ:点击这里给我发消息 作者: 用户投稿 来源: 网络 发布时间: 13/01/12

针对大数据的开源源代码平台变得十分流行。在过去的几个月里, 似乎几乎每个人都感觉到了影响。

低成本、灵活性和适用于受过训练的人员是开源繁荣的主要原因。Hadoop、R和NoSQL是现在许多企业大数据策略的支柱,不管他们是否用它管理非结构化数据或执行复杂的统计分析。”

几乎难以跟上它:SAP AG最近发布了一个新的产品, SAP BusinessObjects预测分析,软件整合了开源R语言的算法,该语言广泛使用在针对高级统计模型的学术社区。

几周之前, Teradata公司宣布其新的整合分析组合将包括R功能以及到GeoServer的一个连接,一个基于java的开源地理定位平台。无数其他公司正急于建立链接到Hadoop。

广泛的采用狂热的创新

James Kobielus,曾任Forrester研究公司的分析师 (他现在IBM公司大数据分析解决方案产品营销任高级项目主管),在一封电子邮件中这么写道,“开源方法有最广泛采用的势头和最狂热的创新”。

但急什么?

首先, Kobielus解释说,正如开源产品的范围从Mozilla到 Android,在诞生的阵痛之后已经在IT社区赢得广泛的接受,开源数据存储和分析软件现在已经成熟了(“不再是一两年以前高风险的赌注”,正如他所说的那样)。

其次, Kobielus写道,像Hadoop, R和NoSQL这样的平台比专门的软件享有优势, 因为它们能更快地演变。他们也在不断开发并为各种团体所改进。他预测, 开源很快将会主宰大数据市场。

“随着封闭式源码软件的足迹在很多数据/分析环境中的萎缩,许多现有的供应商将朝着开源的方向发展他们的商业模式,”他写道,“也会加大专业服务及系统整合以帮助客户走向开源的、基于云的分析,其中大部分集中在Hadoop和R。

例如,Forrester把Hadoop看作是下一代企业数据仓库 (EDW) 在云的核心,而把R看作是未来一波大数据开发工具主要的代码库。我们也期望各种开源NoSQL数据库和工具联合成为替代封闭内容分析产品的丰富选择。”

红帽(Red Hat)模型

不同的企业以不同的方式接近开源整合。有些企业,像SAP,选择使用他们自己内部的专家使用 Hadoop或R的功能开发产品,而其企业,像Teradata移交了大量的工作给像革命分析公司(Revolution Analytics Inc.)这样有些像红帽公司的大数据公司。该公司面向企业提供一种商业版的R, 就像红帽公司对Linux所做的那样。

一家小公司站在大数据巨头之间,这家公司专门为不同的业务流程的修改R,革命分析公司(Revolution Analytics)营销和社区副总裁David Smith说, “尤其是, 我们让它运行在真正的大数据集上。”

在产品中使用开源是公司在市场中突出自己的一种方式, Smith说。“根据定义, 这意味着你不做竞争对手在做的事。”

Smith说, 对于大数据分析采取先进的、科学的态度的企业,开源技术是一种自然的选择。“那些公司有一点数据科学的文化,对数据有探索和好奇心,真的已经被开源技术所吸引,因为它们如此灵活,并且向他们提供这些不同的方法思考数据并用这些数据探索不同的事情。”

革命分析的合作伙伴,Teradata实验室的总裁Scott Gnau说,大型企业将从开源技术的商业软件套装中受益最多,这样他们能持续专注于他们的特定业务线。

“在采用一些新技术中有很多价值被创造,在Hadoop和MapReduce的环境中开发,但将它们作为一种企业级的软件,有可靠的版本控制,并有可靠的可扩展性和有可得到的支持。

“它必须被打包并可靠地进入主流,因为大多数企业并不想集中去作软件开发”他说。

EMC Greenplum的产品营销经理Will Davis表示赞同。他说, 规模较大的公司需要更稳定、可靠的开源大数据平台化身,不管他们是否添加了自己的改进或依赖别人来帮他们做。

“很多企业…EMC的传统客户, 财富500强的之类的企业

网学推荐

免费论文

原创论文

浏览:
设为首页 | 加入收藏 | 论文首页 | 论文专题 | 设计下载 | 网学软件 | 论文模板 | 论文资源 | 程序设计 | 关于网学 | 站内搜索 | 网学留言 | 友情链接 | 资料中心
版权所有 QQ:3710167 邮箱:3710167@qq.com 网学网 [Myeducs.cn] 您电脑的分辨率是 像素
Copyright 2008-2015 myeducs.Cn www.myeducs.Cn All Rights Reserved
湘ICP备09003080号