FLOW-3D产品的硬件选择方案
Flow Science 的 IT 经理 Matthew Taylor 分析不同的硬件组件,提出了一些理想的配置,让您充分利用您的FLOW-3D产品。
虽然我们发布了基础配置要求,但我们经常遇到客户让我们提供更具体的硬件信息。本文深入探讨了截至 2019 年底的FLOW-3D产品的硬件选择。在本文的最后,我们将为您提供不同配置的一些想法,具体取决于您正在运行的模拟类型。
CPU
FLOW-3D是一个计算密集型程序,因为 CFD 求解器的性能完全取决于 CPU 的浮点性能。FLOW-3D POST也高度依赖 CPU。虽然我们无法对每个可用的 CPU 进行基准测试,但我们可以合理地比较相对性能。
估计CPU 的FLOW-3D性能或比较多个 CPU 选项之间的性能的最佳选择是 Standard Performance Evaluation Corporation 的 SPEC CPU2017 基准测试,特别是他们的SPECspeed 2017 浮点结果,它可以非常好地预测 CFD 求解器的性能。
由于这是一项付费基准测试,因此并非所有 CPU 都会进行测试。诸如具有大量 RAM 的多插槽 Intel Xeon 机器之类的昂贵配置得到了很好的体现。
CPU 比较的另一个选项是Passmark Software的CPU基准测试。虽然他们的 PerformanceTest 套件是付费软件,但也有免费试用版。列出了大多数 CPU,包括大多数低成本选项。尽管浮点性能只是完整基准测试的一个方面,但它是对各种工作负载中整体性能的不错测试。
一旦您确定了预算并选择了一些在该预算范围内的 CPU,您就可以使用基准来确定价格的最佳性能。
主频与内核
通常,具有较高主频运行速度的芯片包含较少的 CPU 内核。FLOW-3D的并行性很好,但某些操作本质上是单线程的,例如磁盘写入。具有频繁和/或大量数据输出的模拟通常受益于更高的主频速度而不是更多的内核。同样,跨核和CPU的多线程会增加工作负载,因此对于非常小的问题,限制使用的内核数量可能会提高性能。
CPU架构
架构很重要。较新的 CPU 通常每个周期提供更多功能。这意味着当前 CPU 在相同主频速度下的性能通常会优于旧 CPU。它们还可以提高用电效率,从而提高每瓦性能。在 Flow Science,我们拥有配备当前一代 10 至 12 核 Core i9 CPU 的机器,其性能优于旧款多插槽 12、16 甚至 24 核 Xeon。
超频
我们不会超频 CPU。我们认为硬件是一项多年投资,而超频会增加热量,从而缩短使用寿命。根据 CPU 的不同,稳定性也可能会降低。超频 CPU 时,强烈建议进行热管理。
超线程
所有内核长期处于 100% 利用率的模拟通常在禁用超线程的情况下表现更好。由于FLOW-3D 的利用率通常为 100% ,因此我们建议在配置新硬件时禁用超线程。该设置可从机器的 BIOS 设置页面中访问。
对于一些工作负载,我们观察到启用超线程的性能稍好一些。可能值得在两种配置中测试您的常见模拟类型以获得最佳运行时间。
性能比例
使用多核时性能的提高不是线性的。例如,从12核CPU升级到24核CPU不会使模拟运行时间减半。当选择16到32个以上的CPU核时,根据您的模拟类型,应考虑使用HPC版本的FLOW-3D和FLOW-3D CAST或移动到FLOW-3D CLOUD。
AMD Ryzen 或 Epyc CPU 怎么样?
AMD 凭借一些 CPU 在基准测试图表中名列前茅,它们的价格极具竞争力。我们用一小部分 AMD CPU 测试了FLOW-3D,我们目前的感觉是 Epyc 并不理想,而 Ryzen 的表现还算不错。热量仍然是一个必须仔细解决的问题。我们知道一个影响其 32 核选项的 Windows 错误,该错误会显着降低性能;建议这些 CPU用Linux系统。
内存注意事项
每个CPU内核至少 4GB的内存是FLOW-3D的很好起点。当使用FLOW-3D POST对结果进行后处理时,建议使用大量 内存。良好的硬件意味着改进的 FLOW-3D POST性能:
-
- 超大(超过 2 亿个单元):至少 128GB
- 大型(60-1.5 亿个单元之间):64-128GB
- 中(30-60 百万个单元之间):32-64GB
- 小型(3000 万单元及以下):至少 32GB
内存速度
更快的RAM可以提高性能,但大量非常快的 RAM 可能会很昂贵。RAM速度的影响难以有效衡量,这使得价格/性能难以确定。我们建议选择适合您预算的最快 RAM,如果有疑问,请选择更大容量的 RAM,而不是更高的速度。
Skylake 和更新的注意事项
我们已经确定,RAM 主板的安插方式对于 Skylake 和更新架构的性能极为重要。对于支持 6 个内存通道的 CPU,6 或 12 个 DIMM 应安装相同。对于四通道 CPU,应安装相同的 4 或 8 个 DIMM。
内存通道或 DIMM 大小/速度不匹配的不平衡配置会显着降低性能。
图形显卡
我们强烈推荐 nVidia 的 Quadro 图形硬件。这些产品有多种价位可供选择,并且包含在更高端的工作站级笔记本电脑中。应选择具有至少 3GB显存的 显卡。
不推荐使用 AMD 显卡。明确不支持英特尔集成显卡。一些笔记本电脑同时包含 Intel 集成卡和 nVidia 独立卡。在这些情况下,您将需要使用 nVidia 控制面板为FLOW-3D和FLOW-3D POST使用独立显卡。
服务器和 HPC 节点上的极低端主板显卡,不支持 3D 加速,不能使用也不支持。
远程可视化
在 Windows 上,Quadro 驱动程序通过远程桌面连接自动启用 OpenGL。
在 Linux 上,需要额外的软件来支持远程连接上的 OpenGL,而这通常需要 Quadro 硬件。
VNC 服务器不支持远程连接上的 OpenGL,因此不推荐或不支持。
我们定期测试免费分发的 VirtualGL/TurboVNC 组合,从历史上看,它不能与FLOW-3D一起使用。已观察到重大问题,例如访问 OpenGL 窗口时冻结和奇怪的几何伪影。
由于 Flow Science 不支持远程可视化解决方案,我们建议购买支持安装、实施和维护的产品。
硬盘
我们强烈建议使用固态硬盘 (SSD) 而不是传统的旋转硬盘。在过去的几年里,价格大幅下降,并继续下降。一种理想的选择是使用 1TB 或更大的 SSD 来短期存储模拟结果和后处理,使用更大的 HDD RAID 阵列或外部存储选项来存档旧结果。
配置建议
鉴于上述建议,以下是一些可能的配置以及如何使用它们的想法:
4 到 6 核 Intel Core i7 或 i9 笔记本电脑,配备 32GB RAM,Quadro 显卡,配备 1-2GB VRAM
-
- 流动性
- 简单的水和环境模拟(少于 500,000 个网格),具有简单的物理特性,如重力和粘度
- 简单模型的后处理
6 到 10 核 Intel Core i7,32-64GB RAM,Quadro 显卡,2-3GB VRAM
-
- 航空航天晃动动力学模拟
- 市政水/废水应用的设计模拟,例如接触池、沉淀池
- 具有低网格数的低速金属铸造模拟
- 中等难度的后处理
10 到 18 核 Intel Core i9 工作站,配备 64-128GB RAM、3GB+ VRAM
-
- 鱼道设计模拟
- 具有厚壁、缓慢填充铸件的金属铸造模拟
- 简单到中等难度的增材制造模拟
- 繁重的后处理
16 至 36 核双英特尔至强工作站或服务器,配备 128GB+ RAM、3GB+ VRAM
-
- 带有卷气和颗粒流的溢洪道设计模拟
- 具有薄壁、高速的金属铸造模拟
- 汽车油箱的喷嘴填充模拟
- 高难度的增材制造模拟
- 繁重的后处理
36+ 核高性能计算集群、多个节点、每个节点多插槽、低延迟、高带宽网络互连、每个计算节点的大量 RAM。具有 128GB+ RAM 的图形节点、具有 3GB+ VRAM 的 Quadro 和用于远程可视化的 Penguin Scyld Cloud Workstation
-
- 计算量极大的模拟,例如河流水流模拟或高压压铸模拟,用于需要精细网格分辨率以解析复杂几何形状的零件
- 中型和重型难度模拟的运行优化
- 繁重的后处理