高性能计算（HPC）需要更好的CPU - 创新科技（人工智能）－全球企业门户

随着行业转向定制芯片，定制硅是前进的方向。HPC行业开始通过FPGAs和GPU来满足需求，而CPU面临着落后的风险，过去十年中，企业硬件领域见证了市场领导者，如AMD和英特尔，他们推动着CPU中更多核心的趋势。由于可改进的伸缩性和云服务提供商的增加，这一行业趋势在过去几年中或多或少没有受到抑制。然而，像IBM、Atos、Oracle和HPE这样的HPC客户现在要求的不仅仅是内核；他们需要更好的CPU。

要了解CPU制造商为什么推动每插槽更多内核，我们必须首先了解企业用户的要求。数据中心效率的最大限制因素之一是空间。服务器布置在机架系统中，每个机架包含一台完全配置的计算机(或服务器基础设施，如网络交换机和冷却解决方案)。每个机架可以容纳多达4个CPU插槽，对单个机架可以容纳的计算能力以及服务器群(通过扩展)设置了硬性限制。

由于这一限制，云服务提供商和超大规模企业在尝试扩展其资源时经常遇到问题，这导致对更多内核CPU的需求激增。AMD和英特尔随后投入大量R&D资源开发新的微体系结构，让他们在每个芯片上放置更多的内核。例如，AMD的Threadripper和Epyc系列已经从新的小芯片（chiplet）微体系结构中受益匪浅。

从那以后，芯片制造商只专注于增加内核数量。人们只需要看看当前的企业技术领域和十年前的区别。2013年，英特尔发布了Ivy Bridge版本的至强处理器，在其最高端的芯片上，每个插槽最多可提供12个内核。相比之下，他们的新蓝宝石Rapids芯片每插槽高达60个内核。AMD也是如此，他们在2017年推出了每插槽32核的Epyc Naples系列芯片。现在，最新的Epyc芯片每插槽最高可达96个内核。

内核数之外的问题

虽然增加更多内核为谷歌、Meta等云计算巨头和超算公司提供了可扩展性选择，但同时也意味着市场的其余部分被甩在了后面。联想负责HPC和AI的副总裁Scott Tease表示，

“我们就像是在核心地带游泳。我们发现，真正寻求96核或128核的客户非常少。如果有一个频率为GHz以上的8核或16核器件就更好了。”

由于专注于将更多内核装入CPU，时钟速度、内存带宽和功耗等其他指标都被抛到了一边。过去十年里，企业级CPU的频率已经降到了3GHz左右，AMD最新的消费芯片可以将频率提高到5.7GHz，英特尔的芯片可以达到6GHz。

内存带宽也是如此，随着DDR5内存的兴起，AMD将他们的带宽提高到了460GB/s。英特尔至强已经决定采用高带宽内存(HBM)模型，牺牲可升级性和1TB/s内存带宽的成本。这些只是权宜之计，因为必须从根本上改造CPU架构，以允许更多的内存通道和带宽。

功耗也是另一个因内核数量增加而加剧的问题。最新系列的Epyc和Xeon处理器每个CPU的功耗分别为400瓦和350瓦，这迅速增加了服务器农场规模。运营商还必须考虑这种高能耗芯片带来的更高热量输出，这需要额外的冷却解决方案，从而增加了成本。

CPU开始纵向衰落

当考虑科技巨头的规模市场时，方向是明确的。定制硅是前进的方向，这一趋势甚至连AMD和英特尔都已认识到。AMD的Instinct芯片旨在将CPU和GPU的能力结合在一起，并将其与高带宽内存和3D V-Cache技术相结合。英特尔还将其羽翼未丰的GPU技术与其“Falcon Shores”产品中的CPU相结合。

虽然这些产品肯定会填补超算需求的空白，但HPC行业已经转向FPGAs和GPU来满足他们的需求。例如，CERN正在使用FPGAs来加速他们发现暗物质的工作。

微软还创建了Project Catapult，这是一项将FPGAs和CPU结合起来在云中创建可编程芯片的计划。物理模拟是HPC的支柱，已经成熟到可以在GPU上运行得非常好的程度，将管理系统资源的任务交给了CPU。

未来十年内，CPU制造商将看到市场份额萎缩。随着定制芯片以及FPGAs和GPU功能的兴起，CPU必须为HPC提供坚实的竞争优势，否则将面临消亡的风险。（镨元素；英文链接

http://analyticsindiamag.com/forget-more-cores-hpc-needs-better-cpus/）