e-works数字化企业网  »  文章频道  »  基础信息化  »  云计算和虚拟化

成功实现虚拟化基础架构管理的步骤

2017/1/1    来源:机房360    作者:佚名      
关键字:虚拟化技术  虚拟基础架构管理  
鉴于现代虚拟化技术仍然是一项相当年轻的技术,故而在虚拟基础设施管理中存在着许多的挑战,包括对物理和虚拟资源的控制、使用和访问;灾难恢复解决方案的部署等等。而在本文中,我们将为广大读者诸君分步介绍成功的虚拟化管理指南。
    鉴于现代虚拟化技术仍然是一项相当年轻的技术,故而在虚拟基础设施管理中存在着许多的挑战,包括对物理和虚拟资源的控制、使用和访问;灾难恢复解决方案的部署等等。而在本文中,我们将为广大读者诸君分步介绍成功的虚拟化管理指南。帮助大家了解如何降低虚拟平台的复杂性,并了解虚拟基础架构监控中所涉及的关键性能指标。
  
    虚拟基础设施管理——虚拟化的分步介绍
  
    在企业中采用虚拟化始终是一个多步骤的过程。第一步是识别需要虚拟化的服务器,然后仔细评估投资回报率(ROI)和容量规划。这项工作必须要在进行实际的物理到虚拟的迁移工作之前完成。迁移后,您企业将始终面临在虚拟基础设施管理中挑战。
  
    到目前为止,通过分步系列指导,您企业已经完成了迁移工作了。现在,让我们把注意力转向虚拟基础设施管理的复杂挑战方面,包括强制控制物理和虚拟资源的可用性,使用和访问;部署灾难恢复解决方案;配置新的虚拟机和其他任务;以及数据中心使用情况的监控和报告。
  
    由于现代的虚拟化技术仍然是一项非常年轻的技术,市场仍然面临着不成熟的工具和缺少解决方案的挑战。特别是,在性能分析和故障排除领域中有一个空白。
  
    流体计算的挑战
  
    对于任何一名负责一种系统管理的人员来说,无论该系统虚拟化与否,他们都需要知道如何管理现有的资源。 IT管理人员必须跟踪物理机器、操作系统和产品的许可授权、服务可用性和资产如何满足需求,当任何问题发生时, IT管理人员必须快速做好准备进行处理。
  
    即使是在小型环境中,这些责任也可能相当耗时。而且,在虚拟基础架构中甚至变得更加复杂。在虚拟基础设施中,IT管理人员必须担心一类新问题,例如虚拟机的高效和控制部署,合理的物理资源分配和问责制。
  
    您企业可以轻松的创建新的虚拟机以及这些虚拟机与底层硬件的独立性带来了流体计算(liquid computing)的理念;而其在您企业的计算环境是很难理解的。
  
    流体计算增加了所谓的“虚拟机蔓延”的风险。而为了避免虚拟机的蔓延,虚拟化管理工具提供了一套可靠的安全系统,其中的权限管理可以限制未经授权的员工创建新的虚拟机。这些工具还有一个强大的监控系统,报告已分配但未使用的资源。
  
    截至今天,大多数的虚拟化平台均可以利用虚拟基础设施访问LDAP集中的会计账务核算系统,但当数据中心管理人员们需要计算虚拟数据中心的效率时,仍然存在大麻烦。
  
    此外,当一台新的虚拟机已被创建时,虚拟基础设施管理人员所面临的问题是:需要决定该虚拟机要被托管到何处。正如我们已经看到在容量规划阶段所看到的那样,虚拟工作负载应仔细部署,充分考虑其与现有工作负载的互补性,以避免资源的超载。
  
    例如,来自微软的虚拟机管理器从,为物理机机提供了一个评级系统,能够为每台物理机进行星级打分,以便帮助管理人员立即识别一台新的虚拟机安置在何处将最为合适。这一评分系统能够适应不断发展的基础设施。
  
    但即使有这样的一款系统,在某些环境中,虚拟机的创建可能也并不容易。例如,一家大型的ISP借助虚拟化来重塑其产品,可能需要智能化的工具以根据需求在几秒钟内部署数百或甚至数千台虚拟机。
  
    当前,很少有第三方的产品能够搞定所有的虚拟化管理漏洞,故而许多企业组织选择自行开发内部的解决方案,而不是花钱才够没有太大的灵活性的工具。在这种复杂的情况下,虚拟化管理解决方案必须能够提供软件开发工具包(SDK),允许广泛的定制和不同程度的自动化。
  
    一个广泛的、开源的可编程接口和强大的支持是其关键性的卖点;到目前为止,较之其他竞争对手,VMware公司在这方面做出了相当杰出的成绩。最后,但并非最不重要的是:今天的IT管理人员们正面临着一个新的问题:问责制。在一家中等复杂程度的企业,可能会有几个部门牵扯到需要采用虚拟机来工作,并共享相同的物理服务器,在财政年度中使用不同比例的物理服务器资源。
  
    而当各个部门有自己的成本中心时,就很难跟踪哪个部门应该承担为底层硬件功能支付硬件成本的责任。甚至当成本由企业组织内部的某个单一的实体部门负责处理时,管理人员仍然面临着加强谁有权限使用物理资源,及其具体能够使用多少物理资源的控制的挑战。
  
    尽管目前只有少数的虚拟化客户面临这些问题,但这些问题将迅速在几年内成为一大常见性的问题。已然意识到这方面问题的企业组织不妨可以考虑IBM的产品;IBM公司在该领域首创的Tivoli Usage and Accounting Manager产品,有助于准确评估共享计算资源的使用情况。
  
    多种平台,多种问题
  
    而当一家大型企业组织需要处理多款虚拟化平台时,上述需求会进一步增加。
  
    在一家大型企业中,每个部门通常有选择其首选解决方案的自主权,即使只有一款产品将用于生产环境。IT管理人员可能需要同时并行管理VMware ESX服务器和Xen,希望利用一款单一的集中式工具来实现控制。
  
    随着这方面需求的上升,这些工具的市场供应也在倍增。来自IBM、Cassatt公司、BMC Software公司、Enomaly和Scalent的解决方案是最受欢迎的,但新的竞争对手如Opsware也在蓬勃发展。
  
    支持多种虚拟基础设施往往意味着IT管理人员不必担心创建一款虚拟机到底采用了什么技术,这些工具能够保持控制。在可能的情况下,利用这些工具可以执行将一款应用程序从一台虚拟的硬件设置迁移到另一台,否则有时只能用专用的P2V工具进行应用程序的迁移。
  
    当选择了这样的一款超级控制台时,至关重要的是要确保该控制台可以利用现有的虚拟化供应厂商所提供的管理工具。否则,您企业的投资回报可能永远收不回来。
  
    虚拟基础设施的监控
  
    虽然当前市场上可能有许多x86虚拟化平台,例如VMware ESX、Xen、Microsoft Virtual Server 2005 R2等等,且每一款虚拟化平台的监控几乎都是一样的。在本文中,我们将与广大读者共同讨论当进行虚拟基础架构的监控时所涉及到的内容,包括监控物理主机服务器、虚拟机监视器(VMM)/虚拟机管理程序、虚拟机(VM)和运行在虚拟机内部的应用程序。最终,我们将归结到如何分析理解企业所收集到的性能指标。
  
    物理主机服务器
  
    在虚拟基础架构中,对物理主机服务器实施监控是非常重要的。因为一台单一的物理主机服务器可以容纳数十台虚拟机,所以其必须保持健康运行,而不能出现任何状况。我们的目的并不是吓唬人们,使企业远离基础设施虚拟化,而是为了提醒大家意识到不必忘记了在其之上部署虚拟基础架构的物理硬件有多么重要。
  
    寻求服务器监控工具应该从寻求供应商开始
  
    戴尔公司提供了诸如OpenManage和IT Assistant等工具,而惠普则提供其OpenView软件。在许多情况下,硬件供应商的监控解决方案是监控硬件的最佳选择,因为这些工具显然是由制造硬件的同一家公司所设计和支持的。
  
    但您也会发现,市场上并不缺乏第三方解决方案。戴尔和惠普都为微软运营管理器(MOM)提供管理包。如果资金是一个问题的话,我们建议您企业不妨考虑Nagios产品。Nagios是一款开源的监控程序,用于主机、服务和网络。我所工作的环境之一使用的便是Nagios,而我本人对于该程序的功能相当满意。而且Nagios是免费的。
  
    在虚拟基础设施中监控物理硬件的过程与在传统服务器基础设施中监控物理硬件几乎是相同的。但由于有着大量的虚拟机取决于物理机的健康运行状况,故而维护基于x86的物理服务器的健康运行比以往任何时候都更为重要。
  
    虚拟机监控器/ 虚拟机管理程序
  
    此前曾有很多人问过我关于一款虚拟机监控器(VMM)和虚拟机管理程序之间的区别。答案便是,VMM与其名称之间没有半毛钱关系;其负责监视和管理虚拟机。“虚拟机管理程序”这一术语是关于另一款计算组件(内核)的名称。当内核尚属于一个新事物时,他们被称为“supervisors”,因为其能够监督机器;因此,虚拟机管理程序这一术语指的是监管许多机器的VMM,虽然其是虚拟的。
  
    与监控底层硬件的软件不同的是,监控虚拟机管理程序的软件取决于您企业所使用的虚拟机管理程序的类型。如果您企业使用的是VMware ESX,则有几个选项。就像监控硬件一样,寻找一款虚拟监控解决方案的最好的方式便是从寻求一家合适的供应商开始。 VMware包括了一款基于Web的对ESX实施管理/监控的接口,称为管理用户界面(MUI),除了管理ESX之外,还可以告诉您VMM当前的利用率。
  
    该MUI具有非常好的可用性报告功能。从ESX中的控制台,您可以启用另一款基于Web的报告工具,称为vmkusage。虽然MUI要求用户进行身份验证,但vmkusage提供了一个对于ESX VMM状态的只读的、匿名的视图。当您登录到控制台时,您还可以运行一款名为Esxtop的工具。 Esxtop与标准的top命令类似,但与top命令不同的是,Esxtop还将显示不同的ESX环境的实时利用率,包括VMM。
  
    VMware还推出了一款单独的管理/监控解决方案称为VirtualCenter。虽然VirtualCenter没有提供任何额外的监测信息,但其能够让您企业设置事件和警报,以便在超过资源限制时通知您。在所有第三方的ESX监控解决方案中,只有一款个脱颖而出,即NetIQ AppManager for VMware。
  
    微软Virtual Server 2005 R2 VMM的所有监控解决方案都来自微软公司。您企业可以使用标准的Windows事件日志来监视VMM,这是一款被许多Windows系统管理员所广泛使用的方法。 Virtual Server 2005 R2还安装了可以跟踪VMM利用率的Windows性能计数器。如果不想使用 Window Management Instrumentation(WMI)开发自定义的利用率监控器,Microsoft Operations Manager(MOM)已经利用Virtual Server 2005 R2的性能计数器来提供强大的监视解决方案。
  
    值得一提的是一些开源的Xen监控解决方案。Libvirt是一款开源的工具包,旨在与Xen等开源虚拟化平台进行互动。另外,Argo Xen监控是一款用于管理和监控Xen的框架。商业化的Xen解决方案提供了他们自己的监控工具。XenSource的XenEnterprise具有一款能够实时查看VMM性能的监控解决方案。VirtualIron的Xen软件包具备一款被称为VirtualizationManager的管理和监控解决方案。
  
    当前所有的VMM都需要某种主机操作系统或特权控制操作系统。对于VMware ESX和Xen,其是Linux,这意味着控制操作系统可以使用本机Linux监视工具来衡量VMM的利用率和状态。KISS方法的一个完美例子是syslog进程守护工具。您企业可以配置syslog进程将其日志复制到一台专用日志服务器,以便在发生灾难性故障时可用。我最喜欢的工具之一是一款名为splunk的产品。splunk的创造者有令人惊讶的天才思维,但其想法非常简单:即当该日志与来自各处的类似日志进行比较时,其才是更有用的。Unix / Linux系统管理工具monit也可以用来观察您的VMM进程。
  
    将您企业的虚拟机管理程序想象成是您的大脑。您的身体(虚拟机)可以是完全健康的,但如果您的大脑坏了,那么您的身体也就不知道如何运作。即使虚拟机管理程序像我们的大脑一样被设计为“只工作”,但对其实施主动的监控是必要的,以防止可能的总系统故障。
  
    虚拟机
  
    虚拟机类似于您企业的旧服务器——它们运行软件以实现业务目的。但不能因为您的服务器现在已经虚拟化了就因此而否定对于其实施充分监控的必要。幸运的是,这是很容易的,因为VMM监控解决方案几乎总是能够监控虚拟机。
  
    应用程序
  
    监控在虚拟机内运行的应用程序与监控在物理服务器上运行的应用程序没有什么不同——可以使用相同的软件,并且其也是必要的。我曾遇到过太多的IT专业人士,对于此有着错误的印象,他们认为一款虚拟托管的应用程序不受传统压力和监管的制约。虽然关于应用程序监视的理念应该保持不变,但对于应用程序和系统利用率的想法则必须改变。
  
    理解性能指标
  
    在梳理了由不同的监控软件所收集的所有数据之后,我们可以看到,在任何给定的时间,虚拟基础设施只有37%的利用率。许多工程师和IT专业人员对此的第一反应是这是一件好事;这意味着物理服务器可以增长,以满足增加的需求和处理偶尔的资源高峰需求。不幸的是,虽然这种思维方式在过去十年中符合大多数人的想法,但在处理虚拟基础设施时其已经不再适用。虚拟基础设施的目标是始终达到约80-85%的利用率。
  
    我知道上述这一利用率的数值似乎很高,几乎是有些痴人说梦,但请容我细细解释。企业部署虚拟基础设施的目标之一便是在一处既定的数据中心整合未充分利用和过度设计的物理服务器。既然如此,那么为什么您会期望虚拟服务器的运行利用率仅仅只有20%呢,这些虚拟服务器存在的原因首先就是为了解决昂贵的物理机成本及其利用率不足的问题。故而我们必须摆脱这种心态,并进一步提高利用率。
  
    如果读者中仍然有些对此不确定,也没关系。让我们看看这种方式。人们对低系统利用率(约20-35%)感到更舒适的两个原因是系统将能够处理峰值需求,并且将能够根据需要进行扩展。而使用虚拟机,这些问题都消失了。峰值需求仍然存在,但根据您的虚拟化平台,虚拟机管理程序将检测到您的虚拟机需要更多资源,并应将其他虚拟机未使用的资源分配给需要的虚拟机。将这种情况与使用率仅仅只有35%的两台物理Web服务器进行对比。其中一款Web服务器可以看到内存利用率的延长但只是有限的增加。而如果峰值需求的Web服务器可以从资源利用率仅为35%的其他Web服务器借用一些内存资源,将会是极好的。使用物理硬件,这是不可能的。虚拟化使您企业能够充分利用您的硬件,具有非常好的商业意义。
  
    此外,如果您的服务成功,那么在将来可能需要更多的资源。将更多的资源分配给服务通常需要增加单台服务器上的物理资源容量或者将服务重新构建到集群或服务器群(server farm)。这两种情况都涉及重大的流程——购买新的硬件、实施安装,并可能需要安装一个新的系统。这其中大部分的时间是可以通过虚拟化节省的。您只需为单台虚拟机分配更多资源,或者克隆虚拟机以开始在集群或服务器群上工作即可。因此,为了消除昂贵的升级成本,企业组织将资源过度分配给物理硬件不再是一个好的方法。
  
    正如您所看到的,在一款虚拟的基础设施中,对于系统的低利用率存在各种争论。那么这意味着什么呢?使用上述监控解决方案所收集的数据,以衡量您的虚拟基础设施的整体利用率是可能的。如果性能指标显示平均使用率为45%,那么您仍然可以继续增加35-40%的负载。但如果指标显示平均利用率在80-85%,那么就意味着您企业的已经充分利用了您的硬件了!
  
    总之,对您企业的虚拟基础设施实施充分的监控,以确保其健康的运行是非常重要的,这有助于确保您企业不会因为资源的未充分利用而亏损。
 
责任编辑:李欢
本文为授权转载文章,任何人未经原授权方同意,不得复制、转载、摘编等任何方式进行使用,e-works不承担由此而产生的任何法律责任! 如有异议请及时告之,以便进行及时处理。联系方式:editor@e-works.net.cn tel:027-87592219/20/21。
e-works
官方微信
掌上
信息化
编辑推荐
新闻推荐
博客推荐
视频推荐