随着大数据由概念到应用的过渡,大数据实际应用中面临的问题开始显现。在巨大的容量、繁冗复杂的种类、爆发性的增长速度背后是有限的数据价值,因此把有价值的数据从海量的数据中整理出来,成了大数据应用的重要所在。而价值需要通过数据分析挖掘来实现。“甲骨文认为所有的数据都需要提供实时和非实时分析能力,并非仅仅是
商业智能的能力。”甲骨文公司副总裁及大中华区技术总经理喻思成在大数据
媒体沟通会上提到了甲骨文大数据技术策略关键点。
为了得到全面、透彻、完善的市场洞察,大数据应完全覆盖传统数据、非结构化数据、流式数据和快数据,共同为企业构建全数据视图,提供全面的信息支撑。在大数据里有80%是非结构化数据,喻思成认为,大数据的应用并不代表结构化数据的末日,结构化数据和非结构化数据之间是并存、包容的关系。对结构化数据和非结构化数据都有处理方法,两者之间的整合才能成为完整的大数据。
目前,甲骨文已经能够提供完整的大数据平台。在收购SUN以后,甲骨文具备了软硬件并存的能力,从而形成软硬件的集成系统,为客户提供完整的、对整个大数据都具备处理能力的解决方案。包括Oracle大数据机、Oracle Exadata数据库云
服务器、Oracle Exalytics商务智能云服务器以及Oracle Endeca Information Discovery,依托于
ERP/
CRM等关键企业管理系统的商务智能软件一起组成了甲骨文端到端的大数据解决方案。
Oracle赖以成名的数据库,以及数据库的相关处理手段,成为构建大数据平台的基础。对于非结构化数据的处理,可通过Oracle NoSQL数据库获取,并
存储在大规模节点的廉价的存储设备上,通过MapReduce的方法进行处理和查询。在开源的Hadoop出现之后,用户可以通过Hadoop与比较廉价的X86技术和存储,自行搭起Hadoop并存储海量的数据进行处理。Oracle使用X86和存储,安装Hadoop 企业版本和Oracle NoSQL数据库,为客户提供Oracle大数据机。通过Oracle大数据机可以快速地、低成本地为用户搭建大数据处理平台。喻思成认为,将Hadoop、NoSQL和SQL变的共存且融合,甲骨文大数据技术在成熟度方面将迈入全新的一步。
甲骨文解决了结构化数据与非结构化数据的集成、处理和分析问题。甲骨文通过融合DBE、存储、服务器和光纤,形成了Oracle Exadata这一处理结构化数据的强大数据库云平台。Oracle Endeca Information Discovery则是非结构化数据处理利器,它用于对多维多变的数据进行高级、直观的探索和关联分析。信息从不同的源系统加载,存储在可动态支持变化数据的分面数据模型中。这些集成、丰富的数据可通过交互式和可配置的应用程序进行搜索、挖掘和分析。
同时,甲骨文创造性地推出了Oracle大数据连接器,作为一套内置软件,Oracle大数据连接器优化了Hadoop与Oracle数据库和Exadata之间的集成,将Hadoop系统无缝地连接到Oracle数据库系统中,实现非结构化和结构化数据的拼接。
而无论是结构化数据,还是非结构化数据处理都需要在一定的“容器”中进行处理,这就使得数据库In-Memory的处理能力变得格外重要。In-Memory、Exadata以及大数据连接器组合起来就实现了甲骨文大数据解决方案最底层进行实时数据的处理能力。
甲骨文拥有对海量数据、结构化数据、非结构化数据的处理能力。此外,Oracle Event Processing这一构建实时筛选、关联和处理事件的应用的解决方案,有助于消除、整合、关联和筛选数据,避免数据仓库杂乱不堪,从而具备实时分析大量数据流的能力。
在数据分析层面,Oracle Exalytics商务智能云服务器采用业界标准硬件、市场领先的商务智能软件和内存数据库技术而开发,可以通过超高带宽的infiniband网络从Oracle Exadata上加载和读取数据。它是全球首款专门为提供高性能分析、建模、发现和规划而设计的集成系统,能够以快捷的速度、智能性和简化性帮助企业应对各种挑战。此外,Oracle Endeca Information Discover针对Oracle Exalytics进行了优化和认证,可以快速、直观地分析任意来源组合产生的数据。
在分析大数据时,企业需要访问所有数据,使用R语言进行统计、分析和编程,甲骨文提供的Oracle R Enterprise实现了R开源统计环境与Oracle Database11g的集成,为进行更进一步的数据分析提供了一个企业就绪的、深度集成的环境。Oracle的预测工具具有自学功能,基于这一系列的产品并通过中心引擎实现完整的闭环方案,对结构化数据和非结构化数据实现完整的处理和决策能力。
“在数据拥有网络之后,可以通过Oracle Endeca Information Discover进行挖掘和发现,也可以通过自己的R编程语言进行挖掘、发现以及编程,随后通过
BI的方式表达出来,使业务人员看到业务趋势并实现非实时的BI。此外,通过RDD的产品以及工作引擎把所有的实时数据进行连接,从而形成实时的闭环方案。”喻思成透露,目前,甲骨文大数据解决方案正在丰田、汤森路透、美国国家癌症研究所、软银等企业成功运行。
本文为e-works原创投稿文章,未经e-works书面许可,任何人不得复制、转载、摘编等任何方式进行使用。如已是e-works授权合作伙伴,应在授权范围内使用。e-works内容合作伙伴申请热线:editor@e-works.net.cn tel:027-87592219/20/21。