e-works数字化企业网  »  文章频道  »  基础信息化  »  运维管理

运维团队践行的三种方式:简、智、深

2017/9/20    来源:运维派    作者:赵建春      
关键字:运维  AI  
新时代下的互联网运维正在经历了一场场风雨洗礼,当前时代下有多少运维人处在迷茫和无助之中,交流和学习所积累下来的是更清晰,还是更迷茫,腾讯社交网络运营部助理总经理赵建春在迷茫中探寻答案,寻找到了”致简”、”致智”、“致深”的几种路径。
    前言
 
    在过去三年多时间里,我因为工作的原因负责了一些和机器学习、AI推荐、自然语言处理相关的工作,系统性的学习了这块的知识。之前可能做了多年开发和运维的关系,我非常希望能把这两个东西结合在一起,所以有一些自己的感受和想法,希望把这块跟大家分享一下。
 
    其次,因为 DevOps 在这两年发展非常迅猛火爆,尤其咱们这个社区。但是也看到里面有一些紧张或者是忧虑的成分,这一块也可以讲讲,在AI智能化、自动化的大背景下,我们的同事应该怎么样来发展,也有自己的一点小观点跟大家分享。
 
    运维团队的践行之路“致简”
 
    织云(Cloud Operations Console)是腾讯的企业级运维管理平台,为了更好的运维管理我们设计了这个系统,这个系统里面非常重要的一个设计理念点:“简”,化繁为简。做产品要简单,解决这么复杂的用户环境、场景的情况下,其实“简”是非常重要的。
 
    通向致简–研发结构分析
 
    运维团队
 
    由于各个公司的组织架构不同,研发架构也不同。比如有些公司是中心型的,整个公司里非常强的中央研发机构,可以把整个公司架构都解决。有些公司是不同的小的技术团队,做一些不同的产品,可能是分散型的结构。也有一些公司整个就是散的,没有特别明显的中心化。
 
    但是对于大多数公司来讲,研发一般都是先行于运维的,系统上线之后才会考虑运维的事情,上线之后发现好多运维的工作跟不上。
 
    不同公司的结构不同,运维团队的影响力也不一样,你有很多好的想法但是苦于你的团队推动力不行或者团队技术能力储备不够,所以无法推动。
 
    通向致简–管理方式分析
 
运维团队
 
    可能的管理方式:
 
  • 第一种,全局设计整体考虑
 
    这个公司有很强的研发结构,可以从全局设计一个非常强大的研发体系,它在这个研发体系里就可以把整个运维环境里所要面对的扩展性、一致性、调度等等这样一些东西全部考虑进去。
 
  • 第二种,灵活适配效率优先
 
    公司已经发现了非常分散,针对每种情况做适配的工具,短期效率可能非常高;
 
  • 第三种,标准规范持续改进
 
    通过强制的规范和约束,以及通过模块化的规范和标准,让业务变得逐渐统一,短期可能效率低,但长远来看可能会带来长期的收益。
 
    工具可以带来效率提升,而标准和规范有时候很难感受到或者能够衡量带来的效率。兼顾全局目标与短期需求,短期可以开发满足需求的高效工具,长远可以进行系统的模块化和标准化。
 
    通向致简–环境分析
 
运维团队
 
    上面的图是以我们团队的案例给大家做一个介绍。
 
    我们团队在1999年的时候发布QQ,2002年QQ秀上线,2005年QQ音乐上线,QQ空间是在2005年6月正式发布,在2006年我们才做了D/O分离。
 
    上面几个产品都是海量的服务,每一个都是不同的团队研发的,在不同的年代全部上线了,而且每个产品都有大量的用户群体、大量的服务器,研发结构可能也会有差异,这时候运维再接过去改进它、管理它,其实有很大的挑战。
 
    2009年QQ农场上线,这是一个全民的游戏,短期内我们几个月时间布了四五千台服务器上去。
 
    多中心型研发组织,规模大、增长快、研发架构不统一、变更频繁、持续online、没有维护时间,较强的系统耦合,这些都是QQ的东西,对QQ平台的服务都有一些依赖。
 
    最后是长生命周期,上线之后,除了农场这样游戏类的东西可能慢慢淡化了,但是其他业务是多年运营的,需要长期维护它。
 
    通向致简–需求分析
 
运维团队
 
    这两年在个性化推荐这一块有个观点,从千人一面到千人千面,这块我们的做法是从千人千面到千人一面,要让运维同事全部掌握,难度是非常高的。
 
    我们做的是把这个框架全部独立出来,把 TCP/IP 通信协议里的网络层和性能相关的东西全部脱离出来,做成一个框架,包括稳定性、空中海量连接等全部放在框架里。
 
    使用SO的方式编写,这样的方式让我们编写的代码基本上都是一样的。
 
    程序编写出来之后,你要上线可能会涉及到配置文件、启动命令、启动参数、log保存路径,我们全部用包的思想把它装在包里面,对安装路径写到这个log的格式,写到log的大小,还有启动、关闭、安装、删除等等全部进行了约束,做到了程序交付千人一面,对我的环境来讲逐渐进行规范和约束。
 

责任编辑:李欢
本文为授权转载文章,任何人未经原授权方同意,不得复制、转载、摘编等任何方式进行使用,e-works不承担由此而产生的任何法律责任! 如有异议请及时告之,以便进行及时处理。联系方式:editor@e-works.net.cn tel:027-87592219/20/21。
e-works
官方微信
掌上
信息化
编辑推荐
新闻推荐
博客推荐
视频推荐