近日,在2017杭州云栖大会-阿里大数据分论坛上,阿里巴巴数据技术及产品部资深技术专家姚滨晖发表了主题为《阿里巴巴数据服务和数据产品开发平台》的演讲,分享了阿里在大数据领域沉淀的技术能力和应用实践。
所以通过这两个核心的数据赋能业务的场景,我们可以发现数据服务和数据产品开发平台,之间相关依存的关系。
▊从优势角度来看,将数据服务好和数据产品开发平台组合起来,它们可以体现三个优势:
◎ 第一,通过这样的一个组合,能够打破在业务之间的数据壁垒。这里要强调的是它们打破的不是在底层的数据壁垒,而是打破在业务之间的数据壁垒,因为6大业务板块,所产生的数据形态、含义、结构都有很大差异。在底层完成了整个数据打通之后,打破壁垒就是为了在业务层上,让数据在各个业务间像水一样来流通。
◎ 第二,满足灵活多变的数据需求。
◎ 第三,全域流通和按需自助实现。这个组合可以实现所有用户可以去按需自助来完成,而不需要专业开发、产品来介入。
{ Part3 }
数据服务介绍
▊数据服务主要由四个核心能力组成:
◎ 首先,基础数据服务,它主要是提供基础数据能力,实现上万数据指标跨域获取;
◎ 其次,标签画像服务,通过这个服务,可以给用户提供上百个标签刻画;
◎ 第三,人群透视服务,这个服务其实是在标签智商最的提炼,在营销场景中,可以通过接入这个服务,来实现人群的圈选等;
◎ 第四、还有算法模型服务,通过一键服务化的方式,把算法能力通过服务透出。
图:数据服务的架构
上图展示了数据服务的架构。
从上往下看,portal是一个门户,通过它可以发现,整个阿里巴巴公共层,有多少基础的指标可以去获取,并且这些指标现在已经被哪些业务部门通过什么样的方式来获取。
用户只需要按照同样的方式,就能够获取到对应的数据,极大缩短用户发现数据、获取数据以及使用数据的路径。
中间这层是DSL,通过DSL我们把用户获取数据的标准和规范进行了统一,整个DSL之下有一些大的核心能力。QueryEngine实现所有跟查询相关的能力输出;PushEngine提供实时数据推送的能力;DAG可视化,可配置编排业务逻辑。Algorithm Engine输出算法和人工智能的能力。
图:DSL&DAG实例
▊现在,我们的数据服务的主要有三大应用场景:
◎ 第一是阿里集团内部,诸如搜索、推荐、营销等场景;
◎ 第二是数据大屏,大家在双11看到酷炫大屏,它其实就是通过数据服务来实现的;
◎ 第三是商业化数据产品,被商家熟知的生意参谋,它所展示的数据也是通过数据服务来实现的。
{ Part4 }
数据产品开发平台
我们构建数据产品开发平台最核心的目的就是,让非专业的开发人员,也可以根据自己的需求,来搭建数据产品,从而实现自己使用数据的目的。
本文为授权转载文章,任何人未经原授权方同意,不得复制、转载、摘编等任何方式进行使用,e-works不承担由此而产生的任何法律责任! 如有异议请及时告之,以便进行及时处理。联系方式:editor@e-works.net.cn tel:027-87592219/20/21。