e-works数字化企业网  »  文章频道  »  管理信息化  »  BI

“知识发现”和“数据挖掘”之间的区别

2017/10/17    来源:中国商业智能网    作者:佚名      
关键字:知识发现  数据挖掘  
数据库知识发现是从数据集中识别出有效的、新颖的、潜在有用的,以及最终可理解的模式的非平凡过程,数据挖掘是其中的一个步骤。

    数据库知识发现(KDD)是从数据集中识别出有效的、新颖的、潜在有用的,以及最终可理解的模式的非平凡过程。它由九个步骤组成,从开发与理解应用领域开始到知识发现的行动。数据挖掘是其中的一个步骤(第七步),而数据库知识发现(KDD)过程主要是在一种特定的表现形式或一套这种表征中寻找有趣的模式。

数据库知识发现(KDD)应用的领域

    天文学:SKICAT,一种被天文学家用来分析图像,对所研究的天空中的对象的图像进行分类和编目的一种系统。

    市场:分析客户的数据库来识别不同类别的客户和预测其行为。 

    投资:使用专家系统、神经网络和遗传算法来管理文件夹、欺诈检测。HNC和Nestor Falcon PRISMA监控信用卡欺诈和CASSIOPEE的应用,在三大欧洲航空公司利用聚类推导出失败的种类,以诊断和预测波音737的问题。

    金融业:FAIS被用来识别金融交易中可能出现的洗钱活动。

    电信业:评估用以从警报流中定位频繁发生警报的事件,并作为一种规则显现它们,提供一种工具,进行分组和整理。

    数据清洗:合并-清除被用来识别社交帮助的请求;而高级人才选拔是一种专门进行数据挖掘帮助NBA教练整理和解释来自NBA比赛的数据。

    互联网上FIREFLY帮助个人音乐推荐,CRAYON允许用户创造他们自己的免费报纸,而Farcast从各种各样的来源中自动寻找用户信息,等等。

什么是数据仓库以及它有哪些阶段?

    数据的收集和清洗的流行趋势是为了将数据转换成可用于在线分析和对决策制定的支持。数据仓库在两个重要的方面帮助数据库知识发现(KDD):

    数据清洗:在某种程度上,企业认知到企业内各种书据统一的数据逻辑视图的重要性,开始在把各类数据反射到唯一呈现时要作的数据清洗。

    数据访问:你必须创造统一的、明确定义的方法去访问数据并提供过去是很难获得的数据路径(如,数据离线存储)。

定义联机分析处理(OLAP)

    它是一种用于商业智能BI)的解决方案,包括对来自大型数据库或交易系统的汇总数据的多维结构的咨询。联机分析处理(OLAP)工具专注于提供多维的数据分析,优于SQL的计算总计和径直穿过多维度的控制。联机分析处理(OLAP)工具是趋向于简化,并支持交互式数据分析,但数据库知识发现(KDD)工具的目标是尽可能的过程自动化。

数据库知识发现(KDD)过程的阶段

    对应用领域的开发和认识,并有相关的经验知识和从客户的角度识别数据库知识发现(KDD)过程的目标。

    创设一个数据集的目标:选择数据集,或者聚焦于一组用于发现的变量或数据样本。

    数据清洗和预处理。基本操作包括去除错误数据(如果有的话),收集必要的信息建模或负责错误数据,决定处理缺失数据的策略以及负责信息的时间顺序和已知的变化。

    数据压缩和投影:根据任务的目的寻找有用的特征呈现数据。通过降维的方法或转换,考虑到的有效的变量数目可能减少或可以找到不变量数据的表示。

    匹配过程目标:特别数据挖掘方法(步骤1)的数据库知识发现(KDD)。例如,总计、分类、回归、聚类和其它。

    建模和探索性分析与假设的选择:选择算法和数据挖掘,并选择用于寻找数据模式的方式方法。这个过程包括决定哪一种模型和参数可能是适当的(如,分类数据模型不同于在真实矢量模型)并与数据挖掘方法相匹配,尤其与数据库知识发现(KDD)过程的一般方法相匹配(例如,最终用户也许会更有兴趣了解模型的预测能力)。

    数据挖掘:寻找一种特定的表现形式或一组这些表征的兴趣模式,包括分类规则或树型、回归与聚类。用户可以大大帮助数据挖掘方法以正确执行前面的步骤。

    解释挖掘模式,可能为另外的迭代再回到步骤1至7之间的有些步骤。这一步可能也包含了提取模式的可视化和模型或给予绘制模型的可视化数据。

    知识发现的行动:直接利用知识,结合另一个系统的知识更进一步地行动,或简单地记录并向利益相关者报告。这个过程还包括检查和分辨出与先前所相信的知识之间潜在的冲突。

责任编辑:程玥
本文来源于互联网,e-works本着传播知识、有益学习和研究的目的进行的转载,为网友免费提供,并以尽力标明作者与出处,如有著作权人或出版方提出异议,本站将立即删除。如果您对文章转载有任何疑问请告之我们,以便我们及时纠正。联系方式:editor@e-works.net.cn tel:027-87592219/20/21。
e-works
官方微信
掌上
信息化
编辑推荐
新闻推荐
博客推荐
视频推荐