石油化工企业客户关系管理是为适应企业从“以产品为中心”到“以客户为中心”经营模式的战略转移而发展起来的一种新的管理技术,它已经成为企业获得竞争优势的一种手段,以客户为中心的CRM(Customer Relationship Management,即客户关系管理)成为信息时代环境下企业取胜的关键因素之。其中,如何把海量的客户数据转化为适用的客户知识,是决定CRM绩效的关键。基于数据挖掘技术的石油化工企业CRM,能够有效地帮助企业从海量的数据中发现潜在的知识,支持企业制定高效的CRM策略,从而大幅提升石油化工企业CRM的运行效率。
1 数据挖掘技术
数据挖掘(data mining)是从大量的、不完全的、有噪声的、模糊的、随机的数据中提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。随着信息技术的高速发展,人们积累的数据量急剧增长,如何从海量的数据中提取有用的知识成为当务之急。数据挖掘是知识发现(knowledge discovery in database)的关键步骤。数据挖掘的系统结构包括用户界面、数据准备、挖掘、模式的解释和评价4个模块,如图1所示。
数据挖掘的主要任务是关联分析、聚类分析、分类、预测、时序模式和偏差分析等。
1.1 聚类分析
聚类分析是数据挖掘领域中的一个重要研究课题,它是根据数据间的相似程度自动地进行分类,使得各个类间的相似性尽量小,而类内的相似性尽量大。经典的聚类方法包括分层算法、划分算法如K均值法、模糊C-均值算法、图论聚类法、神经网络法以及基于统计的方法等。近来随着数据挖掘研究的深入,涌现了大量新的聚类算法,包括基于遗传算法和蚁群算法的聚类方法。
1.2 分类
分类是数据挖掘中应用最多的任务。分类就是找出一个类别的概念描述,它代表了这类数据的整体信息,即该类的内涵描述,并用这种描述来构造模型,一般用规则或决策树模式表示。主要的分类方法包括决策树、KNN法(即K最近邻法)、SVM法(支持向量机法)、VSM法(向量空间模型法)、Bayes法和神经网络算法。