e-works数字化企业网  »  文章频道  »  基础信息化  »  运维管理

做好灾备平台,打造自动化运维管理的最后堡垒

2017/7/2    来源:运维派    作者:战学超      
关键字:灾备平台  自动化运维管理  
运维路漫漫,风险千千万,任何系统故障或是硬件故障都有可能导致系统不可用、数据丢失、数据恶意篡改等风险。
    运维路漫漫,风险千千万,任何系统故障或是硬件故障都有可能导致系统不可用、数据丢失、数据恶意篡改等风险。风险一旦发生,会对企业造成巨大乃至无法挽回的影响。所以设计一套良好的企业IT灾备方案,是保障企业IT系统可用性和数据安全必不可少的重要途径。
 
    良好的灾备方案和有效的实施会将企业因IT故障导致的损失降至最低。那么该如何设计企业灾备方案呢?这还是要综合考虑企业的IT规模,成本和人力三个基本要素,结合企业自身情况,进行有重点的方案设计和实施。
 
做好灾备平台,打造自动化运维管理的最后堡垒
 
    一、灾备平台总体架构
 
    相对比较合理完整的灾备平台大概架构如下:
 
做好灾备平台,打造自动化运维管理的最后堡垒
 
    灾备平台在条件允许的情况下,可以采取两地三中心+云端的方式。
 
    公司所在地同城自建或是租赁两个机房,这两个机房之间的数据或是文件以实时同步的方式实现两个机房的实时热备。在另一个城市租赁或是自建机房,一般两城市间距离最少300公里。异地机房跟同城的两个机房采用延迟同步或是手动同步的方式存储IT系统、文件和数据等。一般异地机房是用作同城机房的系统冷备和备份集存储,尽量不要做与同城机房数据实时同步:避免同城机房数据、文件删除或是恶意篡改,导致异地机房实时同步数据也不可用。比较经济的方案是可以在异地机房租赁服务器,存储同城机房的备份集和核心系统的冷备。另外根据公司数据的保密程度有选择的采用云端服务器进行备份集存储或是系统冷热备。
 
    灾备平台建设总的指导思想是:高可用+备份。高可用可以是热备(即只有一台服务器提供服务,另外服务器静默,出现故障后自动切换到静默服务器)也可以是集群方式(集群中的服务器全部对外提供服务)。总之避免单点故障,出现问题后自动切换至正常的设备或是系统上。
 
    二、高可用—机房、网络和硬件
 
    建立灾备平台首先是机房、网络和硬件的高可用。总体架构中的多机房+云端可以实现机房的高可用。网络和硬件的高可用具体如下:
 
做好灾备平台,打造自动化运维管理的最后堡垒
 
    1、双电源,多链路
 
    机房除了必备的UPS备用电源之外,还必须实现接入硬件设备如:交换机、物理机等设备的双电源。这样可以避免掉电引起的故障。另外接入的双电源需要插在不同的插排,避免插排故障。
 
    多链路是指机房接入多种供应商的网络,避免光缆挖断或是供应商网络故障引起的大面积网络故障。另外不同链路的网络接入进来也可以提高系统对外在不同网络环境下的访问速度。
 
    2、防火墙
 
    防火墙一般采用不同厂商的至少2套组成防火墙的高可用,避免防火墙的单点故障,导致外网不能成功接入内网。
 
    3、存储、服务器
 
    一般大的存储厂商都有成熟的数据同步和灾备管理的方案,所以存储一定要选择大的厂商,如EMC、惠普等。另外存储一般情况下尽量避免选择多厂商。因为不同厂商之间的存储产品不太好实现存储级别的数据同步和镜像灾备等。
 
    关于服务器这里推荐企业实现虚拟化,通过虚拟化软件,实现服务器的高可用。虽然不同的服务器和操作系统厂商提供了各种各样的集群方案如RHCS、windows的WSFC等,但是实施起来比较复杂且增加IT成本。采用虚拟化既可以节省资源,也可以实现只采用虚拟化的集群解决方案就可以避免服务器的单点故障。例如采用vSphere的HA,可以实现一台物理机宕机,该物理机上的虚拟机实现自动切换到另外正常的物理机上。
 

责任编辑:李欢
本文为授权转载文章,任何人未经原授权方同意,不得复制、转载、摘编等任何方式进行使用,e-works不承担由此而产生的任何法律责任! 如有异议请及时告之,以便进行及时处理。联系方式:editor@e-works.net.cn tel:027-87592219/20/21。
兴趣阅读
相关资料
e-works
官方微信
掌上
信息化
编辑推荐
新闻推荐
博客推荐
视频推荐