您所在的位置:e-works首页 > 管理信息化 > BI

应用商业智能技术实现DSS

发表时间:2008-10-27 钟辉新 胡勇 来源:万方数据
综述了商业智能技术(BI)的体系结构和核心技术,包括数据仓库、OLAP、数据挖掘等。然后,就商业智能的一个典型应用——客户关系管理作以全面的讨论。
    近年来,商业智能技术(BusinessIntelligence,BI)的兴起给信息社会带来新的契机,逐渐成为Internet之后的又一技术热点。目前,在美国30%~40%的公司已经或正在建造数据仓库。以数据仓库技术为基础,以联机分析处理和数据挖掘工具为手段的决策支持系统日渐成熟。根据Gartner Group调查显示,数据挖掘和人工智能是未来3~5年内将对工业产生深远影响的五大关键技术之一,并且将数据挖掘列为未来5年内投资焦点的十大新兴技术之一。根据Gartner的HPC研究表明,“随着数据捕获、传输和存储技术的快速发展,用户将更多地需要采用新技术来挖掘市场价值”。数据挖掘技术将在未来的数据计算中扮演越来越重要的角色。

1 商业智能的体系结构和核心技术

    商业智能实质上是数据转化为信息的过程,其逻辑过程如图1所示。这一过程也可称为信息供应链,其目的是把初始的操作型数据变成决策所使用的商务信息。在这一过程中,数据集成工具执行源数据的清洗、格式转化和合并计算等功能;数据存储过程建立数据存储模型,存储企业统一的数据视图,为商业智能系统的应用提供基础数据;数据分析工具一般包括OLAP(联机分析处理)、数据挖掘工具、统计分析工具、其他人工智能工具等,这些工具结合商业处理规则为决策者提供决策辅助信息。


图1 商业智能的逻辑过程


    构建一个完整的商业智能系统其体系结构如图2所示。在系统结构中,底层为数据源,包括联系历史、交易历史、客户数据库、产品数据库及其他外部数据,通过提取数据形成数据仓库和数据集市,以形成面向全局的数据视图,从而形成整个系统的数据基础;在此基础上,通过OLAP和OLAM服务器支持数据分析处理,包括查询/报表、OLAP/EIS分析和数据挖掘分析;将分析结果用于实现企业客户关系管理中的商业智能和决策支持。它包括如下核心技术:


图2 BI的体系结构


    1.1 数据仓库技术

    数据仓库技术出现在20世纪80年代中期,数据仓库创始人之一W.H.Inmon将其定义为:“数据仓库是一个面向主题的、集成的、稳定的、包含历史数据的数据集合,它用于支持管理中的决策制定过程。”

    它从多个同构或异构的传统数据库中获取原始数据,先按辅助决策的主题要求形成当前基本数据层,再按综合决策的要求形成综合数据层。其数据组织形式可分为虚拟存储方式、关系数据库存储方式和多维数据库存储方式,以多维数据库形式存储比较适合。数据仓库中的数据大体分为四级:远期基本数据、近期基本数据、轻度综合数据和高度综合数据。还有一部分重要数据是元数据。元数据是“关于数据的数据”,如关系数据库中的数据字典就是一种元数据。在数据仓库中用来与终端用户的多维商业模型/前端工具之间建立映射的元数据称为DSS元数据。

    1.2 联机分析处理(OLAP)

    联机分析处理是对多维数据进行分析的技术,它从多视角分析途径获取用户所需的辅助决策的分析数据。如果说数据仓库侧重于存储和管理面向决策主题的数据,那么联机分析处理则侧重于把数据仓库中的数据进行分析,转换成辅助决策信息。OLAP的一个重要特点是多维数据分析,这与数据仓库的多维数据组织相辅相成,比较典型的应用是将多维数据进行切片、细剖、统览和旋转等操作,令用户可以从不同角度提取有关数据,从而直接为决策服务。

    1.3 数据挖掘(Datamining)

    该技术就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的,但又是潜在有用的信息和知识的过程。如在我们下面所说的CRM中,数据挖掘就是从大量的有关客户的数据中,收集顾客的信息,借助各种分析方法,透过无序的、表层的信息挖出内在的知识和规律,企业就可以根据这些规律或用这些信息设计数学模型,对未发生行为作出结果预测,为企业的综合经营决策、市场策划提供依据。

    数据挖掘的技术主要包括关联规则、分类、聚类和决策树。a.关联规则分为横向关联和次序关联。横向关联是挖掘表面看似独立的事件间的相互关系;次序关联这种分析的侧重点在于分析事件的前后序列关系。b.分类。分类分析就是通过分析样本客户数据库中的数据,为每个类别作出准确的描述或建立分析模型或挖掘出分类规则,然后用这个分类规则对其他客户的记录进行分类。c.聚类。这是分类的逆向方法。聚类把没有分类的记录,在不知道应分成几类的情况下,按照数据内在的差异性大小,合理地划分成几类,并确定每个记录所属类别。d.决策树。本质上是导致做出某项决策的问题或数据点的流程图。数据挖掘融合了数据库、人工智能、机器学习、统计学等多个领域的理论和技术,对数据进行标准化、抽象化、规范化分类或分析,从而淘出所需要的“金”。在技术上,客户关系管理系统采用嵌入数据挖掘系统的方式,可以自动地产生一些所需要的信息。深度的数据挖掘还需要企业有统计学、决策科学、计算机科学方面的专业人才,制定出相应的挖掘规则,才能发挥出挖掘系统的优势。

本文为授权转载文章,任何人未经原授权方同意,不得复制、转载、摘编等任何方式进行使用,e-works不承担由此而产生的任何法律责任! 如有异议请及时告之,以便进行及时处理。联系方式:editor@e-works.net.cn tel:027-87592219/20/21。

责任编辑:殷爽
2
;