您所在的位置:e-works首页 > 产品创新数字化(PLM) > PLM综合

四核CPU,超前消费还是量入为出?

发表时间:2009/10/30 e-works王阳 来源:e-works
为了探寻日前多核CPU对3D CAD\CAE运算效率的提升,e-works近期策划了主题为“四核CPU,超前消费还是量入为出”的专题研讨,采访了活跃在中国市场的主流3D CAD和CAE主流厂商,了解它们提供的3D CAD\CAE软件对于多核技术的支持,并调研了部分企业的应用情况。在仔细分析大量观点、查阅相关资料的基础上,形成本报告,力求从中正、客观、全面的角度反映“四核CPU对3D CAD\CAE运算效率”的关系。

    二 多核CPU在CAE的应用呈两极分化趋势

    对于企业的CAE用户来说,目前处于两级分化状态:一方面,对于简单的分析工作,用图形工作站也勉强可以运行,即使效率并不高,但大多数企业认为只要能够得出结果,就可以接受;另一方面,真正涉及到复杂的分析、仿真工作,对于具有独立CAE研究院所或者CAE中心的企业来说,仅仅用四核CPU来运算,仍显不够,他们往往采用集群式HPC来完成。所以,四核CPU在CAE用户中的普及程度,依然不够广泛。

    1 简单分析工作仍使用图形工作站

    伴随着硬件技术的发展,CAE软件要不停的开发和更新,满足特定的功能指标,进行相应的优化设置,才能充分发挥硬件的能力。例如,一个软件不能支持并行计算(SMP or MPP),就无法同时使用多核并行求解,也就无法充分发挥多核心多CPU的作用。

    与3D CAD软件不同的是,市场上主流的CAE软件基本都具备并行版本,因此对多核处理器的支持也更加的顺其自然。

表3 主流CAE软件对多核CPU的支持情况

    经纬纺机的CAE室主任(原CAD室主任)张心忠在介绍他们企业的情况时说:CAD室主要用的是PRO\E和SolidWorks,CAE用的是PRO\E的Mechanica模块和MSC.ADAMS。因为是分开配置的电脑,所以配置并不相同。对于PRO\E来说,对硬件的配置比较高。需要用到2G以上的双核CPU。而Solidworks对硬件要求相对较低。在进行多体动力学仿真时,往往将PRO\E的模型导入至Adams中,这时候往往导入简化模型,反而没有在PRO\E中的模型大,所以对硬件的配置反而较低。

    对于诸如经纬纺机、嘉捷电梯此类的企业来说,分析工作较为简单,虽说可以使用四核CPU技术来提升仿真分析效率,但普通的工作站也基本能胜任。因此也呈现了诸多企业在做简单分析工作仍由图形工作站的现状。

    2 专业CAE分析采用高性能计算机集群

    而另一方面,对于大型的有限元、前后处理、优化等专业计算,我国制造业表现得并不落后,在很多整车、整机厂,都配有独立的CAE研究所或CAE研究中心,采用高性能计算机集群进行计算工作。

    正因为如此,多核CPU技术在这些计算机集群中就利用地淋漓尽致。从4核到64核,所得到的效率提升也非常明显。

    西安超算所的一位工程师介绍说:有限元作为一种分析方法,可以用在力学、流体等多种物理量的分析。在常用CAE软件中,做网格划分一般都是串行任务,使用CAE的串行版就足够,因此只需要用单核CPU。而对于优化、前后处理等环节,使用并行版CAE软件,可以极大提升效率。

图8 Abaqus计算相同自由度模型64核CPU比4核CPU效率提升92%

    达索系统Simulia工程师孟龙博士在介绍Abaqus在应用多核CPU说:“目前Abaqus的并行版最多已经可以支撑512个计算核心。每增加一倍的CPU核数,运行效率就得到一定的提升,但因为涉及线程的冲突、多任务的排队等待,造成并不是成倍数的增加。比如说四核CPU的运算效率是单核的三倍多,64核CPU的运算效率只是4核CPU10倍多。另外,采用多核CPU与模型的自由度也有很大关系。”

图9 在Windows Server2003下运行Simulia,不同核数CPU对应的时间关系

    赛特达的赖宇阳先生说:譬如优化计算和数据处理软件Isight,它在优化计算和数据处理方面对内存、CPU有较高要求但是跟CAD/CAE软件相比,显卡资源占用不高。Isight对双核CPU, 64bit操作系统进行过优化,提高数据处理性能和并行计算能力。主要是针对并行计算、网格计算方面,发挥硬件的计算潜力。

    而作为平台级仿真解决方案的软件来说,譬如比利时LMS公司的工程师唐昊介绍说:Virtual.lab 和Imagine.lab 本身对硬件没有什么要求。由于使用virtual.lab往往涉及到大型有限元的计算,内存大小和cpu处理速度往往决定了求解的速度。特别值得一提的是:有限元分析软件的计算速度提升非常依赖大内存的支持,只有内存足够大,才能把所有数据一次放进内存,才能最快对数据计算和得到结果,否则当物理内存不足的时候,系统就会使用虚拟内存(磁盘部分作为虚拟内存),这样降大大降低性能。CAE计算在初始化、中间结果保存和计算结果输出时都会有密集的数据IO操作,而且目前并行计算程序的IO操作大多还是串行进行的,因此IO的性能经常是并行计算程序的瓶颈所在。通过RAID进一步提升读取速度,通过多块磁盘RAID,磁盘的IO速度可以成倍提高。

    根据问题不同而定。Virtual.lab和imagine.lab均支持多种并行方式,并且支持64位系统和硬件。理论上可以调用任意多的内存和cpu以加快计算速度。Virtual.Lab完全支持四核CPU,并能实现多种并行方式(分域并行,分频并行)。

    3 运用多核CPU进行CAE分析的挑战

    Altair的技术支持经理洪清泉先生在解释Hyperworks进行多核CPU运算时介绍:HyperWorks图形界面类模块的性能主要跟显卡有关,处理大模型(100万单元以上)和超大模型(1000万单元以上)时,为了获得流畅的显示效果,需要性能良好的显卡,经过大量的测试和优化,可以为客户提供显卡推荐配置。对于求解器类模块,主要是进行数值计算,不涉及到实时的图形显示与处理,所以并不需要有专业的显卡,而主要对CPU速度、多核数目、内存带宽、硬盘速度等有关系。

    另外,洪清泉也表示:同一CAE软件下的不同功能模块,对硬件的要求也不一致,譬如以HyperWorks中的HyperMesh,Radioss和OptiStruct为例:HyperMesh具有极好的图形驱动和利用能力,200万单元的模型在普通显卡如Quadro FX 570(512M显存)上即可以非常流畅的操作和显示;Radioss显式并行计算具有业界最佳的多核加速比,计算速度与CPU核数呈良好的线性关系;OptiStruct优化计算具有极佳的内存利用效率,在普通2G内存的机器上即可求解超过20万个变量的多约束多工况优化问题,4G内存以上的机器可以处理超过50万个变量的优化问题。

    而CDAJ的工程师则说:对于一维分析软件GT-SUITE因为计算量不是很大,对计算机的要求不是很高。

    而对于计算流体动力学(CFD)分析来说,随着计算模型的复杂程度,所需要的硬件配置肯定也会有所提高。以一个工程应用中常见的规模在100~200万Polyhedral(多面体)网格的计算模型来说,推荐至少配备4GB的物理内存,显存128MB的Nvidia Quadro FX系列显卡,主频在2GHz以上的Intel酷睿系列或至强Xeon处理器。其中,对内存和显存的要求比较严格,如果物理内存不足,在网格生成或者求解计算时需要调用虚拟内存的话,工作效率就会大大降低;而显存不足会影响到计算模型的网格显示及结果后处理,易造成显示速度慢、模型无法拖动查看等问题。而CPU的内核数、主频、二级缓存等因素主要影响到计算速度的快慢,这就依据实际项目可以承受的计算时间而定。

    以CFD软件STAR-CD为例,下图是一个并行计算的测试图,测试模型是一个网格数目为600万的汽车外流分析。使用4个node,单个node的配置都是2个4核的CPU。所对比的并行测试网络环境分别为千兆以太网和InfiniBand。从测试图中的计算时间来看,使用4核CPU工作时,其计算效率约是使用双核CPU时的1.8倍,是使用单核CPU时的3.5倍。

    此外,从测试图中还可以看到,不同的网络环境对并行计算效率的提升也有着很大的影响。

图10 STAR-CD V4并行性能比较

    在众多的CAE软件新版本中,对多核技术进行优化的也不在少数。譬如在最新的HyperWorks10.0中的求解器类应用程序专门针对多核进行优化,例如:RADIOSS显式并行求解会尽量将相邻的domains(Radioss独有的对大模型进行分区并指定不同求解设置的技术)分配到同一个CPU上,减少机器和机器之间的通讯量,充分利用本机上的多核资源;Radioss隐式线性多工况求解速度在多核机器上大幅度提高,对于四核机器,速度比单核最快可提高达3.8倍,对于8核机器,速度比单核最快可提高达7倍。此外,OptiStruc优化求解过程中的灵敏度计算也针对多核机器进行了优化。

    对于图形类应用,用户从多核心技术上得到好处相对有限,主要是因为业界主流的图形引擎OpenGL尚未完全对多核进行改写。当然,用户还是可以从多核技术上得到好处,例如可以同时开启多个HyperMesh而不会出现单核心时机器响应速度慢的问题。

本文为e-works原创投稿文章,未经e-works书面许可,任何人不得复制、转载、摘编等任何方式进行使用。如已是e-works授权合作伙伴,应在授权范围内使用。e-works内容合作伙伴申请热线:editor@e-works.net.cn tel:027-87592219/20/21。

责任编辑:黄菊锋