 【产通社,11月27日讯】20世纪80年代的一些芯片先驱正在利用人工智能和开源RISC-V架构提供的新机遇,提高现代芯片设计的赌注。 由模拟和混合信号芯片先驱Martin Snelgrove共同创立的Untether AI发布了一款名为Boqueria的新人工智能推理芯片,该芯片拥有超过1400个优化的RISC-V处理器。该芯片将与Esperanto ET-SoC-1人工智能推理芯片竞争,后者拥有超过1088个内核,并于今年早些时候开始供样。 Esperanto联合创始人Dave Ditzel因在RISC芯片方面的开创性工作而闻名,包括开发Sun公司的SPARC处理器。 Tenstorrent公司在首席技术官Jim Keller的指导下,也在为人工智能开发RISC-V芯片,Jim Keller因在苹果、AMD和英特尔工作期间在移动和PC芯片方面的突破而闻名。 这些公司是许多专注于人工智能的芯片创业公司之一。RISC-V指令集架构可以自由许可和定制,为包括人工智能在内的许多新应用带来了低成本芯片开发机会。 Untether在Hot Chips 2022大会上公布了Boqueria芯片。该公司声称在人工智能推理性能方面获得了性能冠军,在FP8数据类型上的性能为2 petaflops。该芯片的性能也达到了每瓦30万亿次浮点运算。 这是该公司前身人工智能芯片RunAI的整体改进。RunAI于2020年发布,性能为500万亿次,效率为每瓦8万亿次。 产品和硬件工程副总裁Robert Beachler在Hot Chips的一次演讲中表示:“从推论上来说,您希望确保尽可能高效地工作,并使用正确的数据类型来确保必要的准确性,但同时提供能源效率。” 该公司表示,其性能和性能功耗比基准优于MLPerf上的可比芯片,ml perf正在成为行业标准的人工智能基准。但该公司尚未向MLPerf开放其基准,并计划在有可用资源时这样做。 Untether AI采用了一种新的设计方法,通过将更多的计算资源放在数据存在的地方来确保数据移动的效率。例如,计算元件直接连接到存储单元。 “当我们坐下来设计人工智能推理加速时,我们首先看到的是,进行神经网络计算的90%的能量都在移动数据,无论是来自外部存储器还是内部缓存。而且只有10%是真正在计算机中完成的,”Beachler说。 该芯片有729个内存条,每个内存条有两个1.3GHz的RISC-V CPU内核。Beachler说,“因为处理元件有自己的专用内存,所以我们有巨大的内存带宽,大约是1pb的内存带宽。” Boqueria支持PCI-Express互连。该公司可以在单个PCI-Express卡中插入多达6个芯片,以运行大型自然语言处理网络。六芯片PCI卡将消耗400瓦的功率,但典型的工作负载将在200到300瓦的范围内运行。 对于不运行大规模推理应用程序的客户来说,Boqueria也可以缩减到更少的内存组。人工智能家族将从低于1瓦一直扩展到Hot Chips中描述的新芯片。 Beachler说,“这使我们能够解决多个不同的性价比点和形状因素”,其中包括小芯片的集成,以及与片上系统封装中其他芯片的直接管芯到管芯互连。 该芯片支持从INT4到FP16的多种数据类型,精度更高。该公司研究了不同的数据类型,并得出结论,16位数据类型,如BF16,提供了与FP32一样的准确性,但使用更少的功率和计算资源。 “我们还发现,我们开发了一种新的FP8数据类型,效率是BF16的四倍,但同时保持了当今人工智能工作负载所需的准确性,”Beachler说。 Boqueria中的RISC-V CPU是一种标准架构,有二十多条定制指令来利用设计和推理工作负载。查询进一步信息,请访问官方网站 http://www.hpcwire.com/2022/08/25/chip-pioneers-to-battle-it-out-in-modern-risc-v-ai-chips/。(编译:Donna Zhang,张底剪报)
|