现代企业正在面对着数据膨胀性增长,很多分析家都同意:数据量每6~9个月就会翻倍。这对IT部门造成非常大的经费压力,因此部分数据需要在质与量之间作选择。事实上,80%在主存储设备中的文件均为非常用数据文件,而且基本上不再作任何更改。同时,无论是业务还是国家法律要求,很多数据需要保存很长时间。因此,将这些数据从主存储设备中移至成本较低的DVD-RAM或MO二级存储设备,可以即时提升系统性能,而且更能提供数据保护作用和减低对昂贵的主存储设备的再度投资。数据归档势在必行。
金橙科技企业数据归档系统DAE整体架构

DAE系统架构说明
AC
企业应用客户端,专门为各种企业应用服务器定制的客户端,包含文件服务器、邮件服务器、报表服务器、财务服务器等,该客户端包含两种定制方式:一种是独立运行的程序,用于每日定时归档;另外一种用于主动实时归档数据,嵌入企业应用系统中,对系统提供更加高效的归档服务。
CAS
内容归档服务器,也是DAE系统的核心处理服务器,逻辑上用户可以使用多个CAS服务器,但是实际应用中我们建议用户只要做到数据库同步就可以了,至于容量方面,我们可以按照如下算法估算:假定一个大型企业有10000人,平均每人每天估计产生100个归档文件(包含电子邮件),每条归档记录占用的数据库大小为1K字节,则对于一个百年企业来说,他保存100年文件索引的数据库空间大约为1K*100*10000*365=365G,已经完全可以满足该企业的需求,即使容量部分参数有更大的空间占用,阵列和日益增长的磁盘容量也足以满足企业要求
CAS管理机
提供对CAS相关核心参数的配置和应用系统相关设置的功能
CSS
内容存储服务器,是DAE的存储服务系统,容许有多个CSS按照相关设计挂接多个存储设备,并对这些设备进行相关管理;同时容许对设备进行近线和离线的相关设置。对CSS的存储设备容量可以按照如下方式进行计算:假定一个大型企业有10000人,平均每人每天产生10M(对大型企业来说,这个数据是动态的,具体情况要实地进行分析)的归档数据,则一年后该存储设备容量到:10M*10000*365=36.5G,因为全文索引要占用和原文件大小相仿的空间,则一年后实际使用存储空间大概为73G,则该企业保存100年的数据大约要占用7.3T,我们会为企业安排不同的二级归档策略(比如超过30年的数据归档到磁带库中),这样可以保证企业使用任何时期的归档数据完全可以达到在线搜索和恢复。
CSS管理端
提供对底层存储设备的相关操作以及对存储数据的备份/恢复,近线/离线操作
其他网络存储设备
这里的网络存储设备包含NAS、iSCSI、SAN等网络设备,对于此类设备,需要单独的驱动由CSS进行管理和操作。