e-works数字化企业网  »  文章频道  »  基础信息化  »  大数据

数据分析师的基本功:学会系统地认识工业过程

2017/9/14    来源:e-works    专家:郭朝晖      
关键字:数据分析  数据分析师  
做工业过程数据分析,前提就是理解现场、理解工业过程。但是,做数据分析的人,有谁肯花几年的时间去理解工业对象?这是一个大的障碍。
   从事工业生产的人都知道:经验和经历特别重要。我的同事有这样一个观点:熟悉一个车间,大概要花三年的时间。这种说法一点都不夸张,甚至有专家告诉我:他在厂子二十年了,每次到车间还会有新的发现和长进。
 
   经验不足就会脱离实际:有些知名学者也常到厂里走走,却总是会是会犯不接地气的毛病,这就是因为深入理解是很困难的事。厂子里的人说:“目标不清决心大、条件不明办法多”,就是讽刺这种现象。
 
   做工业过程数据分析,前提就是理解现场、理解工业过程。但是,做数据分析的人,有谁肯花几年的时间去理解工业对象?这是一个大的障碍。
 
   现在,软件工具已经很发达了,几秒钟就可能出一个分析结果。这样,分析师的主要精力,就转移到对分析结果的认识和判断上去了。为了分辨结果的真伪,知识不足时,可能需要请教专业领域的专家。请教是难免的,但是,如果分析师每隔几个小时、乃至几分钟就去请教一次专家,是不是件很头疼的事呢?如果不去请教,就有可能越陷越深,浪费自己大量的时间。
 
   要解决这个矛盾,必须找到一种方法,让分析师尽快、尽量深入地理解工业对象。
 
   一般来说,分析师进入一个行当之前,会有一定的机会专门请教业务专家。分析师应该抓住这个机会,从业务专家那里得到更多的知识。要做到这一点,关键是“会问”:知道自己该问些什么问题。否则,专家要讲的内容很快就讲完了,很多该了解的知识都没有了解到。所以,需要带着问题请教专家,也需要自己多去阅读一些材料,对工业过程的宏观体系有所理解,这样与专家交流的效率就可以得到提高。
 
   下面是几年前我琢磨出来的土办法,就是理清宏观体系。体系整理出来以后,不懂、不清楚的地方,就是要请教专家的地方。我把认识工业系统的过程,抽象成七个内容。
 
   1、识别功能
 
   任何一个工业系统(生产、产品、服务)都是为了特定功能而存在的。我们要避免的是:对功能的肤浅理解。为此就要知道:工业过程的功能往往不是唯一的,可能会有多个功能。有需要正面发扬的功能,也可能有若干负面抑制的功能。比如,炼铁的高炉不仅生产铁水,还生产煤气、产生或者消纳污染;汽车不仅是作为交通工具,还有显示身份、满足简单娱乐的作用。识别功能,要完整深入。不仅要识别出有哪些功能,还要了解具体的要求、功能之间相互的矛盾或依托关系等。
 
   请教业务专家时,他常常只想到基本功能,无意中把次要的功能忽视了。但对于复杂的系统,次要的功能或许会成为关键。
 
   2、认识基本流程
 
   对应每个基本功能,都会有一套流程或实现逻辑。一般来说,这就是技术的基本原理。识别出来的功能越多,涉及到流程就越多。请教专家时,要提醒他介绍次要功能对应的流程或逻辑,还要提醒他介绍不同流程之间的交叉和矛盾。
 
   3、外部变化对流程的影响
 
   流程的处理方式往往不是单一的。当外部因素发生变化时,流程往往会有变化。要尽量多地去了解可能引起变化的外部因素。比如,在钢铁生产过程中,钢种、规格、用户需求变了,工艺流程可能就会变。再如,开车时,不同的季节、时段和事件,会触发新的流程,如开空调、车灯等等。总之,遇到特殊情况如何处理,也需要仔细问清楚。这里的知识点,比正常流程本身可能要多很多。
 
   4、认识流程内部的变化
 
   如果把工业看做一个系统,就会存在各种各样的变化。除了正常的功能外,很多变化是不希望发生的。比如,机械设备的磨损、性能的劣化等。这些问题虽然并不太常常发生,却是数据分析希望研究清楚的东西。要深入理解工业,需要把这些可能的变化研究清楚。越是高大上的工业,这些问题越是重要。
 
   5、防范流程
 
   系统内部和外部,会遇到各种人们不愿意发生的、不可控的事情。工业系统一般都有相对完善的防范措施。包括对意外的感知、处置。其中处置的手段包括:减少、预知、弱化影响等等。这些防范措施也可以看做一种功能、也会对应各自的流程和做法。对于高级的工业系统,用于防范意外的措施,可能比支撑正常功能的措施都要多。而防范功能与正常的功能,也会产生交叉关系。
 
   进一步,防范措施也可能会有失效的时候,如何防范防范措施的失效,有时候也是非常重要的......这个逻辑可以一直引申下去。导致问题非常复杂——越是高级的系统,越复杂。
 
   6、数字描述
 
   以上的认识清楚了,才能尝试用数字来理解过程。按照我的经验,现在的数据描述普遍是不完善的,只能有一部分现象可以从数字世界中感知到。虽然未来的条件可能会发生改变,但现在我们必须面对现实。
 
   7、数据产生流程
 
   数据不是凭空产生的,也是通过一系列的流程才能产生的。我常常把数据收集看做“数据产品”的生产过程。提出这个观点的原因是:很多错误或者不精确的分析结果,往往是由于对数据产生过程的理解不到位导致的。比如,同样是一个温度,如果仪表设定的黑度系数不同,测量出来温度就不一样。工业过程数据分析时,数据质量常常起到关键的作用,把数据采集当做一个“生产过程”来对待意味着:要用前面1~6的逻辑,认真审视数据的生产过程。
 
   按照这七个步骤去了解工业过程,工作效率会大大提高。一个月带来的收获,或许比别人几年了解到的东西还要多、还要深刻。
 
责任编辑:王慧敏
本文为e-works原创投稿文章,未经e-works书面许可,任何人不得复制、转载、摘编等任何方式进行使用。如已是e-works授权合作伙伴,应在授权范围内使用。e-works内容合作伙伴申请热线:editor@e-works.net.cn tel:027-87592219/20/21。
e-works
官方微信
掌上
信息化
编辑推荐
新闻推荐
博客推荐
视频推荐