虚拟化和云计算已经成为在座各位CIO日常讨论最关心的两个话题。VMware公司在虚拟化的市场上,在国内已经有83.5%的占有率。
CIO每天可能会遇到各式各样的问题:服务器越来越多,运营成本居高不下;机房空间有限,无法容纳更多的服务器;出现灾难时,如何快速恢复业务是个难题;老操作系统在新服务器上用不了;系统迁移或升级时的应用程序兼容性问题……
图1 VMware用于混合云计算的新 IT 堆栈
VMware方案综述
VMware公司根据云计算的发展战略把我们的产品线分成三个堆栈。第一个是SaaS,主要是针对终端应用设备的虚拟化或者说是云时代的终端设备。像View,我们的桌面虚拟化产品,在杭州下沙有一个用户在三年前已经采购。View可以让用户在不同的终端访问相同应用或者数据的时候获得一致的体验。中间一层是叫PaaS层,主要是针对软件开发环境的,无论当前点net还是Java开发者,都可以做到快速的部署和升级,应对各种各样的问题。这中间除了耳熟能详的spring,还包括像GemFire这样用于提供快速、安全、可靠和可扩展的数据访问理想解决方案。最下面一层是IaaS,无论公有云还是私有云,都是云计算和虚拟化的基础,都是基于现有数据中心构造虚拟的数据中心。这是基于云计算架构的基础结构。
说到云计算肯定要从硬件的虚拟化开始说起。虚拟化有四大特点:
1、兼容性。只要不是RISC芯片,不是那些封闭大机,无论是英特尔的还是AMD的处理器芯片,我们VMware的软件都可以跑在上面。
2、隔离。同一个服务器上的虚拟机之间是相互隔离的,比如说XP蓝屏了,但是跑在同一个物理机上的WIN2008或者是其他的linux都不会受到影响。
3、封装。虚拟机都是以文件的形式存放在共享存储上。
4、相对于硬件独立。无论是从IBM的PC服务器迁移到惠普、戴尔等其他品牌的服务器,无须做修改拿来即可以使用。
传统的数据中心都是一个物理机,一个操作系统跑一个应用, PC服务器上跑的可能是以Windows居多,假如一个windows操作系统跑多个应用,带来的是操作系统稳定性的下降,会引发各种各样的问题。这时候如果我们把所有的硬件资源全都池化,把CPU池化,把内存池化之后,在一个服务器上可以跑多个操作系统多个应用,我们可以做到负载平衡,做到快速部署,做到管理的灵活性。
图2左边这张图,是早期的虚拟化架构版本。从ESXi开始,Vmware做了技术创新,在常规的OS和硬件之间增加这样的软件层。这个软件层非常小,装好之后只有90M,IO不会存在瓶颈。这90M的软件层规避了传统架构底层采用标准OS因为各种原因经常升级打补丁,整个物理机都需要重启的现象,从而导致高可用不复存在。
图2 虚拟架构实现方式
在一个真实案例里面,一个上市公司的机房跑的应用是ERP,一共有300台服务器,但是采用VMware的服务器虚拟化软件整合之后,只用有8台服务器和一个机架。现在VMware一台虚拟机最大可以支持32个虚拟CPU,1TB内存,最大可以支撑100万个IOPs,你可以想象到的大型应用,只要操作系统支持,物理硬件够强壮,VMware都可以做到。
图3 VMware 在每一个级别保证企业的业务连续性
分页
无论是云计算还是虚拟化,我们希望在每个级别都做到业务的连续性不会受到任何影响。我们的产品从设计之初就从五个维度(部件、服务器、存储、数据备份、数据中心)考量如何实现业务的连续性。在做硬件配置的时候,就会建议用户考虑网卡和HBA卡的容余。一些用户比如像杭州的某家饮料制造企业,它在萧山、下沙都有分厂,采用了VMware的SRM作为灾备软件。
1、VMware HA(意外自动保护)。关于HA已经不是一个新的话题,但是虚拟化以后的HA和传统意义上的HA还是有差异的。常规的HA是主备或者是互备,主机宕掉之后假如备机也发生故障,这种概率不是没有。在虚拟化的环境里面,一个群集最大支持32台主机,也就说32台主机里面,宕掉若干台都没有问题,上面的虚拟机都可以切换到其他的主机上面,就不会有传统HA的问题。
2、FT(容错技术)可以理解为另外一种更高级别的HA,假如有一种应用,要求可用性是非常高,怎么来实现?常规的HA主机宕掉,备机上都有应用重启的过程。但是FT除了在某一台物理机上装操作系统和应用程序外,在另外一台物理机上也有该操作系统和应用程序的影像,叫做影子VM。主节点宕机,这台影子VM会立刻生效。如果做ping包测试,它仅仅会丢掉了一个MAC地址转换的包,所以对于可用性要求很高的用户是非常实用的。
3、VMware vMotion。它操作起来非常方便,只要几步就可以完成,使用过的用户对这个功能称赞有加,说是真正做到了管理的灵活性。它与HA和FT之间最大的差别是,vMotion是因为各种各样的管理原因,主动发起的业务迁移。HA和FT是硬件或OS出现问题的时候被动响应的。
4、VMware Storage vMotion。有了Storage vMotion,可以做在线的数据扩容或者迁移。因为拷的时候按照bitmap来拷贝,拷完最后一个数据位的时候,它把IO路径切换过去。可以做到在线联机拷贝。vMotion做的是业务从这台机器飘到另外一个机器,而storage vmotion是实现存储的数据迁移。
5、DRS(分布式资源调度)可以做资源的负载平衡,假设第一台物理机上某个虚机的应用对资源要求比较高的时候,这时候DRS可以把同一台的其它虚机飘到其它的物理机上。以后负载高的虚机资源释放了,那么飘走的虚机也可以飘回来。基于这个原理,如果说这台物理机上资源利用率不是很高,没必要让这台机器加电,并且假设其他物理机负载也不高,那么可以把这台低负载物理机上的虚机直接飘到其它的物理机上,把这台机器下电。如果以后其他物理机的资源不够,也可以通过网络把这台物理机唤醒。这就是DPM(分布式电源管理)。
图4 vMotion业务负载按需流动
6、VMware Data Recovery。免费的备份软件,它是集成在vsphere中,可以做虚拟机及文件的备份。
7、VMware vStorage Thin Provisioning。精简配置,比如分配给C盘虽然有40G,但是只有25G的数据,那么在存储上看到就只有25G。
8、VMware vCenter Server heartbeat。每台物理机如果没有一个软件来管理的话,它就是一个孤岛,无法做克隆、vmotion和负载平衡,这时候我们需要一个来统一管理这些物理主机的软件,它就是vCenter Server。同时我们也可以想象到vCenter是多么重要,如果vcenter宕机会有什么后果。Heartbeat就是这样一款高可用性软件,来保证vcenter的高可用性,能保护虚拟基础架构和云计算基础架构免受与应用程序、配置、操作系统或硬件相关的停机的影响。
9、VMware vShield系列。VMware公司也有自己的安全产品线,vshield endpoint可以配合我们的友商(例如趋势)采用安全虚拟设备的方式来对虚拟机进行杀毒,这样的话就不需要给每个虚拟机安装代理,如果物理机比较多的时候,除了性能优势还会带来成本的一些下降。除了vShield endpoint之外,vshield家族还有其他的安全产品,来实现边界保护、防火墙等等。
图5 VMwar vShield家族
10、VMware SRM。在5.0之前的版本,只能通过硬件的存储复制功能来实现,我们知道,依赖存储复制功能的硬件非常昂贵。从5.0开始,也可以采用集成在SRM中的免费软件(vsphere replication)来实现数据复制。
分页
11、VMware Operations。这款自动化运营管理解决方案是VMware今年二月份推出重大更新的产品。如果说企业里跑虚拟机的物理机很多,这时候做性能监控、健康检查、容量规划、工作负载等等,你就会发现很难,通过vcenter来管理已经不能满足你的需要。VMware Operations通过工作负载、健康和容量规划这三个维度,分析各项指标,以数字化和图表的形式很清晰的呈现出来。如图6分析出系统的压力主要是网络的I/O造成的。
图6 VMware Operations智能化的深层原因分析
相关名词解释:
·VMware HA,意外自动保护,发生服务器故障是在其他的物理服务器上自动重启虚拟机。
·VMware vMotion,可以实现虚拟机的动态迁移, 而服务不中断。
·DRS,分布式资源调度,按需自动资源调配。
·DPM,分布式电源管理。
·VMware vStorage Thin Provisioning ,精简配置。
·VMware vCenter Server Heartbeat 6.4u1,可为 VMware vCenter Server 提供高可用性,保护虚拟数据中心和云计算基础架构使其能够防范由多种问题导致的停机。
·VMware vShield 5.0 ,虚拟化云计算环境中的安全解决方案 。
·VMware SRM 5.0 - Site Recovery Manager,云计算虚拟化环境中的灾难恢复解决方案 ,可为所有应用程序提供最简单可靠的灾难防护和站点迁移。
·VMware Operation Manager 5.0,VMware 的自动化运营管理解决方案。