用ANSYS结构力学仿真软件的组织机构希望获得尽快产生可靠设计所需要的精确度、效率与吞吐量。ANSYS与英特尔携手合作,确保此类公司能够利用最新Intel® Xeon® E5 v3处理器与Xeon Phi® 协处理器,以处理其仿真任务。
结构力学仿真往往需要大量计算资源,包括内存、磁盘空间和I/O。这会影响到计算所用的时间。由于CPU时钟频率的提高速度不如10年前那么快,保持这种计算速度无法依赖更快速的CPU。新的性能模式是并行计算,其可以利用每隔几年数量都会猛增的CPU内核,以便在每个时钟周期提供更多计算。这显著提高了结构仿真软件的性能。但是工程师始终在努力尽可能减少仿真时间,这样他们就能够提高模型的复杂性(例如,通过提高网格密度或非线性行为),或者在给定时间内执行更多仿真。
图1 基准套件在两个极其相似的系统上采用ANSYS 16.0运行
加速结构力学仿真的一种方法是充分利用可用的最新硬件。计算机行业利用持续的平台发展极大提高了计算性能,包括每个CPU搭载更多的计算内核、集成型I/O处理器(产生更高存储带宽)、更快的附加内存(通道)、更大的L3高速缓存大小、更快的磁盘存储(如:用于ANSYS Mechanical的固态驱动器)、更快的互连以及Intel Advanced Vector Extensions 2(AVX2)支持。英特尔与ANSYS一直携手合作,以便ANSYS解决方案能够充分利用这些硬件发展带来的优势。
采用INTEL XEON E5 V3处理器
20多年来,ANSYS结构力学产品一直可支持并行处理,使工程师能够有效利用多核处理器和/或集群加速仿真。随着16.0版的发布,ANSYS继续进行投资,添加了能够利用最新英特尔处理器技术的相关功能。
ANSYS用户利用英特尔的最新Xeon E5 v3处理器能够显著缩短仿真运行时间,这主要归功于更多内核(多达18个)、对Intel AVX2的支持、更大的L3高速缓存(多达35MB)和更高的存储速度(多达2133MHz)。ANSYS Mechanical 16.0采用英特尔的名为Haswell的E5 v3处理器系列提高了性能。E5 v3系统针对迭代求解器基准(通常是存储带宽速度的良好指标)比E5 v2平均快20%,而针对直接求解器基准(通常是原始计算速度的良好指标)比E5 v2平均快40%。
采用INTEL XEON PHI协处理器
为了利用最新硬件发展实现更快的工程仿真技术,ANSYS自发布ANSYS13.0之后就开始与NVIDIA合作开发和推出基于通用图形处理器(GPU)的并行求解器执行解决方案。GPU目前能够加速流体、结构与电磁学仿真,以提高ANSYS高性能计算(HPC)功能的价值。
英特尔最近推出了设计上与高端GPU类似的Xeon Phi系列协处理器。它们是可插入PCI Express插槽的全高度卡,需要最低200W的附加功率。但是,此类协处理器并非针对显卡,并且不具备图形显示输出连接(例如:HDMI或显示器端口)。每个Xeon Phi协处理器都包含大约60个能够执行1百万兆次浮点运算的内核,而且具有8GB~16GB的GDDR 5内存,以提供大量存储带宽。这种新款硬件加速器能够加快结构力学仿真。
实现方案
在结构力学产品中开始实施对Xeon Phi协处理器的支持之前,ANSYS需要:
用户体验直接简单。
Xeon Phi硬件必须永远不降低仿真速度,而且在适用时能够加速仿真。
Xeon Phi不会降低求解精确度。
为了利用Xeon Phi协处理器加速ANSYS结构力学仿真,相关软件可以采用GPU加速器功能。虽然Xeon Phi可以实现其它执行模型,不过GPU加速器是引入这种协处理器的最佳工具。由于稀疏直接求解器是默认求解器并且常用于各种分析,因此这种线性方程求解器是最佳切入点。
ANSYS 16.0—效率与鲁棒性
随着发布16.0版,ANSYS继续投资,以提高结构力学仿真的效率与鲁棒性。求解器指标的关键改进可以实现速度更快、更稳健的仿真。
众多增强功能可以提高非线性分析的收敛。
稀疏求解器的改进可以在内核执行更多任务,从而提高求解器性能。在分布式存储器并行计算方面进行了众多改进。
进一步改进了域分解,从而提高了性能和规模,特别在更多内核数量情况下尤为如此。
最新增加的功能包括支持惯性释放、QRDAMP特征值抽取法(模态分析中)和模态叠加法(谐波响应与瞬态分析中)。