 随着行业转向定制芯片,定制硅是前进的方向。HPC行业开始通过FPGAs和GPU来满足需求,而CPU面临着落后的风险,过去十年中,企业硬件领域见证了市场领导者,如AMD和英特尔,他们推动着CPU中更多核心的趋势。由于可改进的伸缩性和云服务提供商的增加,这一行业趋势在过去几年中或多或少没有受到抑制。然而,像IBM、Atos、Oracle和HPE这样的HPC客户现在要求的不仅仅是内核;他们需要更好的CPU。 要了解CPU制造商为什么推动每插槽更多内核,我们必须首先了解企业用户的要求。数据中心效率的最大限制因素之一是空间。服务器布置在机架系统中,每个机架包含一台完全配置的计算机(或服务器基础设施,如网络交换机和冷却解决方案)。每个机架可以容纳多达4个CPU插槽,对单个机架可以容纳的计算能力以及服务器群(通过扩展)设置了硬性限制。 由于这一限制,云服务提供商和超大规模企业在尝试扩展其资源时经常遇到问题,这导致对更多内核CPU的需求激增。AMD和英特尔随后投入大量R&D资源开发新的微体系结构,让他们在每个芯片上放置更多的内核。例如,AMD的Threadripper和Epyc系列已经从新的小芯片(chiplet)微体系结构中受益匪浅。 从那以后,芯片制造商只专注于增加内核数量。人们只需要看看当前的企业技术领域和十年前的区别。2013年,英特尔发布了Ivy Bridge版本的至强处理器,在其最高端的芯片上,每个插槽最多可提供12个内核。相比之下,他们的新蓝宝石Rapids芯片每插槽高达60个内核。AMD也是如此,他们在2017年推出了每插槽32核的Epyc Naples系列芯片。现在,最新的Epyc芯片每插槽最高可达96个内核。 内核数之外的问题 虽然增加更多内核为谷歌、Meta等云计算巨头和超算公司提供了可扩展性选择,但同时也意味着市场的其余部分被甩在了后面。联想负责HPC和AI的副总裁Scott Tease表示, “我们就像是在核心地带游泳。我们发现,真正寻求96核或128核的客户非常少。如果有一个频率为GHz以上的8核或16核器件就更好了。” 由于专注于将更多内核装入CPU,时钟速度、内存带宽和功耗等其他指标都被抛到了一边。过去十年里,企业级CPU的频率已经降到了3GHz左右,AMD最新的消费芯片可以将频率提高到5.7GHz,英特尔的芯片可以达到6GHz。 内存带宽也是如此,随着DDR5内存的兴起,AMD将他们的带宽提高到了460GB/s。英特尔至强已经决定采用高带宽内存(HBM)模型,牺牲可升级性和1TB/s内存带宽的成本。这些只是权宜之计,因为必须从根本上改造CPU架构,以允许更多的内存通道和带宽。 功耗也是另一个因内核数量增加而加剧的问题。最新系列的Epyc和Xeon处理器每个CPU的功耗分别为400瓦和350瓦,这迅速增加了服务器农场规模。运营商还必须考虑这种高能耗芯片带来的更高热量输出,这需要额外的冷却解决方案,从而增加了成本。 CPU开始纵向衰落 当考虑科技巨头的规模市场时,方向是明确的。定制硅是前进的方向,这一趋势甚至连AMD和英特尔都已认识到。AMD的Instinct芯片旨在将CPU和GPU的能力结合在一起,并将其与高带宽内存和3D V-Cache技术相结合。英特尔还将其羽翼未丰的GPU技术与其“Falcon Shores”产品中的CPU相结合。 虽然这些产品肯定会填补超算需求的空白,但HPC行业已经转向FPGAs和GPU来满足他们的需求。例如,CERN正在使用FPGAs来加速他们发现暗物质的工作。 微软还创建了Project Catapult,这是一项将FPGAs和CPU结合起来在云中创建可编程芯片的计划。物理模拟是HPC的支柱,已经成熟到可以在GPU上运行得非常好的程度,将管理系统资源的任务交给了CPU。 未来十年内,CPU制造商将看到市场份额萎缩。随着定制芯片以及FPGAs和GPU功能的兴起,CPU必须为HPC提供坚实的竞争优势,否则将面临消亡的风险。(镨元素;英文链接 http://analyticsindiamag.com/forget-more-cores-hpc-needs-better-cpus/)
|