二八定律
在一个完整的商业智能BI项目中,刨除需求分析等基本工作,20%的时间耗在前端可视化报表设计开发阶段,80%的时间都耗费在底层的数据开发包括ETL、建模、需求变更引起的底层数据调整等。
图5 一个简单的商业智能BI结构示意图
举个很简单的实际案例,这是我们在客户业务系统中看到的一张表,要做的事情是什么呢?就是计算部分操作节点(0034、0035、0036、0048等)之间的时间周期,最后做KPI统计,实际的场景比这个示例数据要更加的复杂。这里面包括了一系列的数据处理、节点回溯与去重计算等等,这些很难由业务人员自行处理,所谓由业务人员自准备数据、直接拖拉拽基本上是不可能完成的事情。
图6 数据清洗处理中的业务计算规则
图7 更详细的数据统计分析需求规则
图8 不同的用户时间节点的组合规则各不相同
图9 有的数据排列组合简单,有的复杂
类似于这样的数据处理、业务逻辑计算在实际的商业智能BI项目中非常的多,BI项目中80%的大部分时间就耗在这些地方,除此之外例如数据的增量抽取策略、维度和事实选择、分析建模等都是不如可视化报表那么直观可体现的工作。
所以,我们不能简单的认为商业智能BI就等同于可视化分析报表的开发,在一个可视化报表出来之前,实际上我们做了大量的基础数据准备工作。