您所在的位置:e-works首页 > 基础信息化 >

云计算:体系架构与关键技术(一)

发表时间:2012/2/20 罗军舟 金嘉晖 宋爱波 东方 来源:万方数据
本文系统地分析和总结云计算的研究现状,划分云计算体系架构为核心服务、服务管理、用户访问接口等3个层次。围绕低成本、高可靠、高可用、规模可伸缩等研究目标,深入全面地介绍了云计算的关键技术及最新研究进展。在云计算基础设施方面,介绍了云计算数据中心设计与管理及资源虚拟化技术:在大规模数据处理方面,分析了海量数据处理平台及其资源管理与调度技术;在云计算服务保障方面,讨论了服务质量保证和安全与隐私保护技术。针对新型的云计算应用和云计算存在的局限性,又探讨并展望了今后的研究方向。最后,介绍了东南大学云计算平台以及云计算研究与应用方面的相关成果。

1引言

    近年来,社交网络、电子商务、数字城市、在线视频等新一代大规模互联网应用发展迅猛。这些新兴的应用具有数据存储量大、业务增长速度快等特点。据统计至2010年,社交网站Facebook己存储了15TB的数据,并且每天新增60TB数据;电子商务网站淘宝的B2C业务在2010年增长了4倍,其数据中心存储了14PB数据,并且每天需要处理SOOTB数据。与此同时,传统企业的软硬件维护成本高昂;在企业的IT投入中,仅有20%的投入用于软硬件更新与商业价值的提升,而80%则投入用于系统维护。根据2006年IDC对200家企业的统计,部分企业的信息技术人力成本达到1320美元/每人/每台服务器,而部署一个新的应用系统需要花费5.4周。

    为了解决上述问题,2006年Google、Amazon等公司提出了“云计算”的构想。根据美国国家标准与技术研究院(NIST)的定义,云计算是一种利用互联网实现随时随地、按需、便捷地访问共享资源池(如计算设施、存储设备、应用程序等)的计算模式。计算机资源服务化是云计算重要的表现形式,它为用户屏蔽了数据中心管理、大规模数据处理、应用程序部署等问题。通过云计算,用户可以根据其业务负载快速申请或释放资源,并以按需支付的方式对所使用的资源付费,在提高服务质量的同时降低运维成本。

    作为信息产业的一大创新,云计算模式一经提出便得到工业界、学术界的广泛关注。其中Amazon等公司的云计算平台提供可快速部署的虚拟服务器,实现了基础设施的按需分配。MapReduce等新型并行编程框架简化了海量数据处理模型。Google公司的App Engine云计算开发平台为应用服务提供商开发和部署云计算服务提供接口。

    Salesforce公司的客户关系管理(CRM, customerrelationship management)服务等云计算服务将桌面应用程序迁移到互联网,实现应用程序的泛在访问。同时,各国学者对云计算也展开了大量研究工作。早在2007年,斯坦福大学等多所美国高校便开始和Google, IBM合作,研究云计算关键技术。近年来,随着云计算研究的深入,众多国际会议(如SIGCOMM、OSDI, SIGMOD, CCS等)上陆续发表了云计算相关研究成果.此外,以Eucalyptus为代表的开源云计算平台的出现,加速了云计算服务的研究和普及。

    不仅如此,各国政府纷纷将云计算列为国家战略,投入了相当大的财力和物力用于云计算的部署。其中,美国政府利用云计算技术建立联邦政府网站,以降低政府信息化运行成本。英国政府建立国家级云计算平台(G-Cloud),超过2/3的英国企业开始使用云计算服务。在我国,北京、上海、深圳、杭州、无锡等城市开展了云计算服务创新发展试点示范工作;电信、石油石化、交通运输等行业也启动了相应的云计算发展计划,以促进产业信息化。

    然而,云计算本质上并非一个全新的概念。早在1961年,计算机先驱John McCarthy就预言:“未来的计算资源能像公共设施(如水、电)一样被使用。”为了实现这个目标,在之后的几十年里,学术界和工业界陆续提出了集群计算、效用计算、网格计算、服务计算等技术,而云计算正是从这些技术发展而来。

    在这些传统技术中,集群计算将大量独立的计算机通过高速局域网相连,从而提供高性能计算能力。效用计算为用户提供按需租用计算机资源的途径。网格计算整合大量异构计算机的闲置资源(如计算资源和磁盘存储等),组成虚拟组织,以解决大规模计算问题。服务计算作为连接信息技术和商业服务的桥梁,研究如何用信息技术对商业服务建模、操作和管理。

    对云计算而言,其借鉴了传统分布式计算的思想。通常情况下,云计算采用计算机集群构成数据中心,并以服务的形式交付给用户,使得用户可以像使用水、电一样按需购买云计算资源。从这个角度看,云计算与网格计算的目标非常相似。但是云计算和网格计算等传统的分布式计算也有着较明显的区别:首先云计算是弹性的,即云计算能根据工作负载大小动态分配资源,而部署于云计算平台上的应用需要适应资源的变化,并能根据变化做出响应;其次,相对于强调异构资源共享的网格计算,云计算更强调大规模资源池的分享,通过分享提高资源复用率,并利用规模经济降低运行成本:最后,云计算需要考虑经济成本,因此硬件设备、软件平台的设计不再一味追求高性能,而要综合考虑成本、可用性、可靠性等因素。

    基于上述比较并结合云计算的应用背景,云计算的特点可归纳如下。

    1)弹性服务。服务的规模可快速伸缩,以自动适应业务负载的动态变化。用户使用的资源同业务的需求相一致,避免了因为服务器性能过载或冗余而导致的服务质量下降或资源浪费。

    2)资源池化。资源以共享资源池的方式统一管理。利用虚拟化技术,将资源分享给不同用户,资源的放置、管理与分配策略对用户透明。

    3)按需服务。以服务的形式为用户提供应用程序、数据存储、基础设施等资源,并可以根据用户需求,自动分配资源,而不需要系统管理员干预。

    4)服务可计费。监控用户的资源使用量,并根据资源的使用情况对服务计费。

    5)泛在接入。用户可以利用各种终端设备(如PC电脑、笔记本电脑、智能手机等)随时随地通过互联网访问云计算服务。

    正是因为云计算具有上述5个特性,使得用户只需连上互联网就可以源源不断地使用计算机资源,实现了“互联网即计算机”的构想。

    综上所述,云计算是分布式计算、互联网技术、大规模资源管理等技术的融合与发展(如图1所示),其研究和应用是一个系统工程,涵盖了数据中心管理、资源虚拟化、海量数据处理、计算机安全等重要问题。本文通过归纳云计算特点与体系架构,总结和分析云计算各层服务的关键技术及系统实例,针对当前云计算存在的问题,提出未来研究的方向。

   云计算与相关技术的联系

    图1云计算与相关技术的联系

 

本文为授权转载文章,任何人未经原授权方同意,不得复制、转载、摘编等任何方式进行使用,e-works不承担由此而产生的任何法律责任! 如有异议请及时告之,以便进行及时处理。联系方式:editor@e-works.net.cn tel:027-87592219/20/21。

责任编辑:赵蔓