e-works数字化企业网  »  文章频道  »  管理信息化  »  CRM

数据挖掘技术在客户关系管理中应用的研究与探索

2014/4/16    来源:万方数据    作者:郑茵      
关键字:CRM应用  客户关系管理  数据挖掘技术  
数据挖掘技术能对大量的数据及信息进行挖掘,从中发现潜在的关系,并利用模型对客户需求进行预测,帮助企业做出决策,使企业获得高额的投资回报。

    客户关系管理(CRM)的核心思想是将企业的客户作为最重要的企业资源,通过完善的客户服务和对客户的行为方式进行深入分析,寻找其中的规律,满足客户的需求,提高服务水平,保证实现客户的终生价值。同时CRM也是一种管理软件和技术,它将最佳的商业实践与数据挖掘、数据仓库、OLAP以及其他信息技术紧密结合在一起,为企业的销售、客户服务和决策支持等领域提供解决方案,使企业能有一个基于电子商务的面向客户的平台,从而顺利实现由传统企业模式到以电子商务为基础的现代企业模式的转化。数据挖掘技术能对大量的数据及信息进行挖掘,从中发现潜在的关系,并利用模型对客户需求进行预测,帮助企业做出决策,使企业获得高额的投资回报。

1 数据挖掘的概念

    数据挖掘(DM),又称数据库中的知识发现(KDD),是指从大型数据库或数据仓库中提取隐含的、未知的、非平凡的及有潜在应用价值的信息或模式。它是数据库研究中的一个很有应用价值的新领域,融合了数据库、人工智能、机器学习、统计学等多个领域的理论和技术。从商业角度看,数据挖掘是一种崭新的商业信息处理技术,其主要特点是对商业数据库中的大量业务数据进行抽取、转化、分析和模式化处理,提取辅助商业决策的关键知识,即从一个数据库中自动发现相关商业模式:按企业既定业务目标,对大量的企业数据进行探索和分析,揭示隐藏的、未知的或验证已知的商业规律,并进一步模式化的数据处理方法。数据挖掘工具能够对将来趋势和行为进行预测,从而很好地支持人们的决策。

2 常用的数据挖掘方法

    2.1 分类

    分类在数据挖掘中是一项非常重要的任务。分类的目的是通过统计方法、机器学习方法(包括决策树法和规则归纳法)、神经网络方法等构造一个分类模型,然后把数据库中的数据映射到给定类别中的某一个。

    2.2 聚类

    聚类是把一组个体按照相似性归成若干类别,即“物以类聚”。它的目的是使同一类别之内的相似性尽可能大,而类别之间的相似性尽可能小。这种方法可以用来对客户进行细分,根据客户的特征和属性把客户分成不同客户群,根据其不同需求,制订针对不同客户群的营销策略。

    2.3 关联规则

    它是描述数据库中数据项之间存在关联的规则,即根据一个事物中某些项的出现可导出另一项在同一事物中也出现,即隐藏在数据间的关联或相互关系。在客户关系管理中,通过对企业客户数据库里大量数据进行挖掘,可以从中发现有趣的关联关系,例如,买过A 商品的客户以后会购买B商品。通过对这些数据进行挖掘,获得对顾客购买行为极有价值的信息,从而可以帮助企业及时把握客户需求,对客户实行交叉销售,为企业决策提供参考。

3 客户关系管理(CRM)中数据挖掘的过程

    为使CRM系统建立良好的模型,在实施数据挖掘之前,先确定采取什么样的步骤,每一步都做什么,达到什么样的目标是必要的,有了好的计划才能保证数据挖掘有条不紊地实施并取得成功。虽然把各个步骤按顺序排列,但要注意数据挖掘过程并不是线性的,要取得好的结果就要不断重复这些步骤。比如在“分析数据”时可能会发现在“建立数据挖掘数据库”时做的不够好,需要添加一些新的数据。有效的CRM中的数据挖掘的基本步骤为:

    3.1 定义商业问题

    每一个CRM应用程序都有一个或多个商业目标,要想充分发挥数据挖掘的价值,必须要对目标有一个清晰明确的定义,即决定到底想干什么。

    3.2 建立数据挖掘库

    连同下面的两个步骤,这三步构成了数据预处理的核心。这三步比其他所有的步骤加在一起所花的时间和精力还多。数据准备和模型建立之间可能反复进行,因为从模型中会学到新的东西,而这又需要修改数据。数据准备阶段也要占去全部数据采集过程的80%到90%的时间和努力。应该把要挖掘的数据都收集到一个数据库中。注意这并不是说一定要使用一个数据库管理系统。根据要挖掘的数据量的大小、数据的复杂程度、使用方式的不同,有时一个简单的平面文件或电子表格就足够了。需要建立独立的数据挖掘库的另一个理由是,数据仓库可能不支持对数据进行各种复杂分析所需的数据结构,包括对数据进行统计查询,多维分析和各种复杂的图表及其可视化。

    建立数据挖掘库可分成下面几个部分:(1)数据收集。确定要挖掘的数据源。(2)数据描述。描述每个文件和数据库表的内容。(3)数据提取。把一些冗余或无关的数据除去,选择用于数据挖掘的数据。在数据提取过程中,可以利用数据库的查询功能以加快数据的提取速度。(4)数据清理。了解数据库中字段的含义及其与其他字段的关系。对提取出的数据进行合法性检查并清理含有错误的数据。(5)合并与整合。大部分情况下需要的所有数据是分布在不同的数据库中的。数据合并与整合把来自不同数据源的数据合并到同一个数据挖掘库中,并且要使那些本来存在冲突和不一致的数据一致化。

    3.3 为建模准备数据

    这是建立模型之前的最后一步数据准备工作。可以把此步骤划分成4个部分:(1)选择变量。理想情况下,可选择所拥有的全部变量,输入到数据挖掘工具中,找出哪些是最好的预测变量。实际上这样做并不是很好,其中一个原因是建立模型的时间随着变量的增加而增加;另一个原因就是盲目性,包括无关紧要的数据列被加入,却很少甚至不能提高预测能力。(2)构建新的预测依据。例如,预测信用风险时,使用债务- 收入的比率而不是单独使用债务或收入作为预测变量,可以产生更准确的结果,并且更容易理解。(3)选取一个子集或标本来建立模型。建立数据挖掘模型时,要从大量数据中取出一个与问题相关的样板数据子集,而不是动用全部数据。使用恰当的随机挑选的子集并不会引起信息不足,反而能减少数据处理量,节省系统资源,而且能通过数据的筛选,使规律性更容易凸现出来。(4)转换变量。使之和建立模型的运算法则一致。

    3.4 建立模型

    建立模型是一个反复的过程。需要仔细考察不同的模型以判断哪个模型更有用。在寻找好的模型的过程中学到的东西,会启发用户修改数据,甚至改变最初对问题的定义。为保证得到的模型具有较好的精确度和健全性,需要一个定义完善的训练- 验证协议,也称为指导性学习。主要思想就是先用一部分数据建立模型,然后再用剩下的数据来测试和验证这个得到的模型。

    3.5 评价模型

    对模型的评价依赖于需要解决的问题,由领域专家对模型的精确性和有效性进行评价。

    3.6 实施

    把数据挖掘模型所发现的知识应用到实际工作中,为决策提供支持。如根据得到的知识可以设置某些触发器,当满足条件时进行特殊处理。

4 结论

    本文在探讨CRM的基础上引入数据挖掘技术,详细阐述了该技术在客户关系管理的重要应用及其实现过程。数据挖掘技术在以客户为中心的客户关系管理中扮演着越来越重要的角色,随着理论的进一步发展和神话,必然会带给CRM更为广泛的应用前景和市场价值,提高企业的竞争力。

责任编辑:卢玉琴
本文为授权转载文章,任何人未经原授权方同意,不得复制、转载、摘编等任何方式进行使用,e-works不承担由此而产生的任何法律责任! 如有异议请及时告之,以便进行及时处理。联系方式:editor@e-works.net.cn tel:027-87592219/20/21。
e-works
官方微信
掌上
信息化
编辑推荐
新闻推荐
博客推荐
视频推荐