HP 8510W评测:评测环境及评测标准
普通PC与工作站因其面向的客户群和市场定位均不相同,在本身的设计、配件选择、服务等多个方面都存在很大差异。如果用测试普通PC的方法来对工作站做评测,显然是不公平的。为了客观评价工作站的性能, e-works特别设计了一套工作站评测环境和标准。
一、常见评测方法的不足
对于工作站的性能差异比较,评测是最为适合的方法。
工作站常见的评测方式有两种,一种方式可称之为标准软件评测,即采用评测程序和自带的模型,直接运算后得出一个客观的评分,常见工作站评测软件有SPECview Professional、SPECview application等;另一种评测方式可称之为主观评测,多针对某个专业应用,通过测试人实际使用软件的操作感受,对性能进行主观评价。
以上两种方式并不能完整解答企业的疑惑。以三维CAD软件为例:由于用户的行业、设计的复杂程度、采用的三维CAD软件存在差异,以上两种评测方式很难给企业选型工作站提供全面而有效的帮助。采用标准软件评测时,由于用无法清楚的了解相关标准评测中采用模型规模、模型结构和测试项目的具体内容,最终得分到底能够多大程度上与企业需求相匹配值得探究;而采用主观评测的测试结果由于缺少客观参数,测试人主观评价的合理性和有效性无法验证。
此外,很多评测报告中关于系统环境、测试过程、系统和应用设置等方面的描述相对简单。在日常应用过程中,无论是操作系统环境还是大型专业应用,都有诸多方法可以提高速度和效率。例如:防火墙和杀毒软件、操作系统的内存设置、注册表优化、对后台服务精简等或多或少会影响到测试成绩。某些发烧友在进行CPU超频标准软件评测时,为了追求更高的得分,采用特制的制冷系统、将系统进程数量大幅度减少到仅能维持测试程序运行,确实得到了很高的分数,也显得系统性能非常强大;但对于实际用户而言,这种高分的参考价值并不大,因为与实际应用相去甚远,测试成绩缺乏说服力。
要想解决常见评测方法中的不足,需要足够多的测试应用、设计丰富的测试项目、人工参与要尽可能少、测试结果要可量化和规范的测试操作。
二、e-works工作站评测方法
根据选用的评测软件,e-works将测试分为两部分:一部分是采用三维CAD模拟企业实际情况的应用评测,另一部分是采用通用评测软件的标准测试。
1. 测试软件
在制造企业中工作站最为常见的应用是三维CAD(计算机辅助设计),e-works在应用评测部分选用了Siemens PLM Software NX5和Autodesk Inventor 2009、达索SolidWorks 2008和PTC PRO/E Wildfire 4.0等4款不同的三维CAD软件。
在国内,NX的用户数量和PRO/E旗鼓相当,两者都是应用的最为广泛的高端3D工业设计软件之一,Autodesk Inventor和SolidWorks作为中端三维CAD软件中的佼佼者,在国内市场占有率非常高,它们作为评测平台可谓实至名归。所有软件均采用较新的版本,其原因既是由于新版本代表了企业升级的方向,同时对新的计算机技术的支持较好。
作为一种通用的测试手段,在标准测试中选用了SPECviewperf10.0、3DMarks2006和CINEBENCH R10等三种标准测试软件。其中SPECviewperf10.0重点测试OPENGL的性能,并在测试结果中选取了和本次应用测试有关的ugnx-01、sw-01和proe-04的成绩与三维CAD测试结果进行对比;3DMarks2006主要考察D3D的性能;CINEBENCH则主要考察CPU的性能。
选择众多软件作为测试平台,可保证评测结果具有更为广泛的代表性。在测试过程中,e-works会针对参评设备的操作系统进行统一优化,例如:虚拟内存调整、环境变量的修改、常见注册表优化等,因内容众多,不再赘述。
2. 测试模型
三维CAD软件产生的模型通常由特征、参数和图形三个要素组成。这三个要素的信息量,直接决定了测试的力度。如果模型规模太小,可能无法显示工作站的性能差距;而仅仅用超大规模的模型,又和企业实际情况相去甚远。
为此e-works在实际测试中选取了多种不同规模的模型。如:零件数量在50个以下的称为小模型、300个左右的称为中模型、500个以上的称为大模型、零件数量在1000以上的称为超大模型。在不同的三维CAD软件测试中引入多个规模的模型后,测试结果具有一定代表性。采用超大模型是为了通过评测找到工作站的极限,对企业选择工作站能有参考价值。
测评模型分为两类,一类是获得厂家官方提供的全球DEMO模型,例如:NX5超大模型是由SIEMENS PLM Software官方提供的、Inventor 2009的超大模型是由Autodesk官方提供的DEMO,此外,还有部分获得企业授权的模型。从某种程度上看,官方DEMO的进入,使此次测评具有一定的公信力。
为保护知识产权,部分模型消去了一些的特征和参数,这与企业实际使用环境有一定的差别(企业设计人员在设计时,会通过使用各种特征和参数,去生成自己希望得到的图形,因此企业中的模型,特征、参数和图形三个要素都是齐备的),在评测工作压力方面,可能比实际应用的同等规模模型小,但因为此次测评的参评设备均使用同一个模型进行横向对比测试,仍能有效保证测评结果的客观和公正。
3. 测试方法
针对三维CAD软件的应用评测主要采用两类测试方法:一类是能考验整机性能的耗时项目测试,对于三维CAD软件而言,在模型载入、渲染、干涉检查和格式转换四个环节所需时间最长,也最能体现不同工作站之间的性能差异。e-works在所有参评工作站上,在同一种三维CAD软件,用同一模型,完成测试的时间作为衡量标准。对耗时操作的评测考验了以CPU为核心的整机操作性能,时间越短,说明工作站性能越强。
此外,e-works在NX5测试中增加了有关工作站日常操作速度的评测,主要测试在用户操作NX5时,执行移动、旋转和缩放屏幕这三种常见操作时,计算机显示的实时速度,单位为FPS(帧/秒)。这个测试项目目的是评测参评工作站GPU的性能。
无论是耗时操作还是日常操作,通过测试平台自身的功能辅助编程手段,各环节均采用量化的结果。为了减少单次评测出现问题的概率,每个子项目均测试三次,且每次测试之间均会重新启动操作系统,最终成绩取测试成绩的平均值。
为了规范测试过程,确保评测能客观反映参评设备的性能差异,在不同规模的测试模型被载入后,均设定在同一个起始位置,评测操作过程统一用软件实现,不需人工操作,测试采用相同路径和设置。每个单项测试完成后,会重启计算机以确保评测项目之间不相互影响,以确保评测操作过程的客观和公正。
总之,采用多个测试软件、多个规模的三维CAD模型、多种测试项目、统一的测试方法、量化的测试结果、规范的测试操作目的是确保评测的公正性和可比性。
本文为e-works原创投稿文章,未经e-works书面许可,任何人不得复制、转载、摘编等任何方式进行使用。如已是e-works授权合作伙伴,应在授权范围内使用。e-works内容合作伙伴申请热线:editor@e-works.net.cn tel:027-87592219/20/21。
