e-works数字化企业网  »  文章频道  »  管理信息化  »  BI

商业智能——发觉数据金矿的工具

2010/8/18    来源:万方数据    作者:王森勋  陈旭东  付淑文      
关键字:商业智能  数据挖掘  ETL   OLAP  
本论文先简单地说明企业经营管理活动对商业智能的需求,从而明确实施商业智能(BI)的原因,解决Why的问题;再阐明商业智能的技术构成,如数据仓库(DW)、数据挖掘(DM),联机在线分析工具(OLAP)等进行概要的分析,大概了解如何实现商业智能,解决what和How的问题;最后列举一些实际部署的商业智能项目结果,解决What Effect的问题,明确商业智能在企业经营决策过程中的具有很高的实用价值。

一、商业智能概念提出的背景和定义

    商业智能(Business Inteligence,简称BI)的概念最早是Gartner Group于1996年提出来的。当时将商业智能定义为一类由数据仓库I或数据集市)、查询报表、数据分析、数据挖掘、数据备份和恢复等部分组成的,以帮助企业决策为目的技术及其应用。目前,商业智能通常被理解为将企业中现有的数据转化为知识,帮助企业做出明智的业务经营决策的工具。这里所谈的数据包括来自企业业务系统的订单、库存、交易账目.客户和供应商资料来自企业所处行业和竞争对手的数据,以及来自企业所处的其他外部环境中的各种数据。而商业智能能够辅助的业务经营决策,既可以是操作层的,也可以是战术层和战略层的决策。为了将数据转化为知识,需要利用数据仓库,联机分析处理(OLAP)工具和数据挖掘等技术。因此,从技术层面上讲.商业智能不是什么新技术,它只是数据仓库,OLAP和数据挖掘等技术的综合运用。

    为此,把商业智能看成是一种镪决方案应该比较恰当。BI的关键是从许多来自不同的企业运作系统的数据中.提取出有用的数据,进行清理以保证数据的正确性,然后经过抽取(Extraction),转换(Transformation)和装载(Load),即ETL过程,合并到一个企业级的数据仓库里,从而得到企业数据的一个全局视图在此基础上利用合适的查询和分析工具、数据挖掘工具。OLAP工具等对其进行分析和处理(这时信息变为辅助决策的知识),最后将知识呈现给管理者.为管理者的决策过程提供支持。因此,BI是涉及一个很宽领域的.集收集、合并、分析和提供信息存取功能为一身的解决方案,包括ETL软件,数据仓库、数据集市,数据查询和报告,多维/联机数据分析,数据挖掘和可视化工具。图1是一个典型的商业智能系统。

商业智能系统构图

图1 商业智能系统构图

二、商业智能的技术构成

    商业智能所要解决的问题不同,其应用到的技术也不尽相同一般地讲包括以下的部分(不同的体系,划分的方法可能有些差别,但本质相同)。

    1.ETL:即数据的抽取/转换/加载。也就是将原来不同形式.分布在不同地方的数据,转换到一个整理好,统一的存放数据的地方数据仓库)。ETL可以通过专门的工具来实现,也可以通过任何编程或类似的技术来实现。

    2.数据仓库:一个标准的定义是:数据仓库是一个面向主题,集成、时变、非易失的数据集合,是支持管理部门的决策过程。简单地说.数据仓库就是储存数据的地方。它既可能是原始的业务数据库,也可能是另外生成的。既可能是标准的关系型数据库,也可能是包括了一些特定面向分析特性的专门产品。

    3.查询:找出所需要的数据。由于需求的多样性和复杂程度的差异,查询可能是最简单的从一张表中找出”所有姓张的人“到基于非常复杂的条件、对关系非常复杂的数据进行查找和生成复杂的结果。

    4.报表分析:以预先定义好的或随时定义的形式查看结果和分析数据。将人工或自动查询出来的数据,以所需要的形式(包括进行各种计算、比较、生成各种展现格式、生成各种图表等)展现给用户,甚至让用户可以进一步逐层深入钻取这些数据,乃至灵活地按照各种需求进行新的分析并查看其结果。在这个领域,报表已经由原来狭义的做好固定报表发展为灵活地按业务要求随时制作各种报表、进行各种分析和数据研究处理。

    5 OLAP分析:多维数据分析,从多个不同的角度立体地同时对数据进行分析。理解OLAP分析,最简单的例子是Excel中的数据透视表。需要指出的是OLAP有广义与狭义之分,广义的OLAP是相对OLTP而言,可以说包括了查询、报表分析。OLAP分析和数据挖掘,但真正大家所讲的实际是狭义的OLAP,即多维数据分析。OLAP分析一般讲应该是通过建模和建立立方体(CUBE)来实现.但现在也有一些简单的OLAP工具可以不建模即进行小数据量,低复杂度的分析(EXCEL的数据透视表即是一例)。

    6,数据挖掘:一种在大型数据库中寻找你感兴趣或是有值信息的过程。相比于上面几个部分,数据挖掘是最不确定的。如果理解它与查询的区别,似乎是数据如果容易查出来,就是查询。如果费很大劲才能找出来,就是挖掘。上面这若干部分,并不是每一部分都必不可少,而是要根据应用的实际情况.具体问题具体分析。一般地讲,数据仓库(这里是广义的,其中相当一部分情况就是指标准的关系型数据库)和查询,报表分析是必不可少的,而其他一些功能则视应用的需要可能有不同程度的应用。

    除了上面所讲的这些实质性、技术性的组成部分外,与商业智能相关的还有很多应用层面的概念,如EPM(企业绩效管理),DashBoard(仪表盘),预警、决策支持等等。这些概念在应用上有很大意义,也有一些相关的辅助技术,但本质上还是基于上述的几个组成部分。

责任编辑:袁琴桃
本文为授权转载文章,任何人未经原授权方同意,不得复制、转载、摘编等任何方式进行使用,e-works不承担由此而产生的任何法律责任! 如有异议请及时告之,以便进行及时处理。联系方式:editor@e-works.net.cn tel:027-87592219/20/21。
e-works
官方微信
掌上
信息化
编辑推荐
新闻推荐
博客推荐
视频推荐