加入收藏
 免费注册
 用户登陆
首页 展示 供求 职场 技术 智造 职业 活动 视点 品牌 镨社区
今天是:2024年4月30日 星期二   您现在位于: 首页 →  技术 → 电子材料(技术聚焦)
通过架构定制(DSA)迭代为AI提供通用算力
2023/4/12 13:37:40    
Domain-Specific Architectures(DSA)是后摩尔时代持续提升处理器性能的一种技术理念,即采用可编程的专用集成电路(ASICs)去加速特定的高强度的处理器负载,比如加速图形渲染、加速AI神经网络的前向推理计算、提高巨量网络数据的吞吐等。

架构的定义包含指令集架构与微架构。指令集架构是软件与硬件进行对话的接口,如果说一条指令是一个单词,那么指令集(ISA)就是词典,而软件程序就像是一本使用特定词典中的词汇编写出来的一本书。

通过对架构进行面向特定领域的设计,缩小应用范围,获得更高的性能,或者更好的能效比,保持可编程的灵活性,这就是DSA的理念。
- 面向领域的架构设计可以以较低的成本获取较高的算力,以满足算力需求。
- 指令集架构的可编程性带来了相对通用的算力,为下一代算法的应用和覆盖更广泛的领域提供了无限的可能。

GPU也是一种的DSA,GPU的发展论证了DSA取得的成功。DSA、GPU、AI这是个互相成就的故事。而Nvidia的GPGPU硬件的成功,与其CUDA生态丰富的算力软件包、易于使用的编程接口、优秀的编译器脱不开干系。由此我们可以得出一条结论,对于DSA算力硬件来说,这些都是走向商业成功的必要条件。

从TX1推出开始,对标TX1的竞品层出不穷。TX1的算力来自于GPGPU,而更加客制化的ASIC,利用卷积操作的空间局部性进行数据复用的精妙设计,在达到同等甚至更高算力的同时硬件的成本更低。最普遍的设计是一个高能效比的CPU小核如Arm Cortex A7/A53加固化的2D图像处理(CV)模块与固化的神经网络处理(DNN/NPU)模块。

由于小CPU的计算能力非常受限,将主要负责应用软件的任务调度部分,AI应用的前处理(非DNN算法模型部分)主要由2D图像处理模块来承接。问题在于前处理是非常碎片化的算法,除了个别的插值、颜色域转换功能几乎所有图像处理软件都会用到,其他所需功能非常的广泛。仅OpenCV的核心函数、图像处理函数就包含矩阵变换、滤波、分辨率变换、颜色空间转换、直方图等等几个大类,其中每个大类中的子方法又会有若干个,无法定义哪些功能需要被固化。这还不包含3D数据处理能力与特征描述子的使用。算法厂商的需求各不相同,固化的多了浪费面积,固化的少了产品开发的难度将大幅提升。

ONNX是一种针对机器学习所设计的开放式的文件格式,用于存储训练好的模型。它使得不同的人工智能框架训练得到的网络模型可以以相同的格式进行存储。 ONNX的规范及代码主要由微软,亚马逊,Facebook和IBM等公司共同开发。以NVIDIA的AI软件生态中最富盛名的DNN推理开发工具库TensortRT为例,5.1版本支持87个ONNX算子,到了7.1版本支持的ONNX算子数量为108个。功能高度固化的ASIC无法对新增的算子计算类型进行支持,将会越来越约束算法的迭代。而在这之上进行AI产品开发的算法工程师们无异于是戴着镣铐跳舞。

Google公司研发了张量处理单元 (TPU),TPU v1 于2015年投入生产,并被谷歌内部用于其应用程序。TPU是一种应用于AI领域,为AI算法提供算力的ASIC,利用了神经网络对于数值精度不敏感的特性,其思想核心是采用低精度矩阵Systolic Array提供巨大算力,同时提供满足AI需求的最小化的运算功能。此版本(即TPUv1)的云服务从未对用户开放开发使用。现在TPUv2以及后续版本被广泛的应用于谷歌的搜索排序、语音识别、以图搜图、谷歌翻译等领域。

通过以上的成功案例我们可以发现,GPGPU、TPU的迭代的共同点是通过越来越高度的架构定制带来了越来越澎湃的专用算力。同时保留或者新增通用的算力。通过高度优化的编译器和丰富的软件栈,让用户能够轻松的将硬件算力充分地利用起来。那么通用算力、编译器、软件栈这些显然都在CPU平台是最丰富最成熟的,而对于CPU来说 “Domain-specific architecture design is all you need”。(张底剪报)
→ 『关闭窗口』
 365pr_net
 [ → 我要发表 ]
上篇文章:合作应对来自小芯片封装的10大挑战
下篇文章:数字声纹,让我们通过声音辨别出一个人
→ 主题所属分类:  电子材料 → 技术聚焦
 热门文章
 如何申请EtherCAT技术协会(ETG)会员资格 (166958)
 台北国际计算机展(COMPUTEX 2015)参展商名… (104284)
 上海市集成电路行业协会(SICA) (90637)
 USB-IF Members Company List (82607)
 第十七届中国专利优秀奖项目名单(507项) (74257)
 台北国际计算机展(COMPUTEX 2015)参展商名… (67865)
 苹果授权MFi制造商名单-Authorized MFi Lic… (67154)
 中国130家太阳能光伏组件企业介绍(3) (55205)
 PLC论坛 (52143)
 中国130家太阳能光伏组件企业介绍(2) (48486)
 最近更新
 英特尔用于下一代先进封装的玻璃基板(Glass Subs… (4月29日)
 EUV光刻技术回眸:Trumpf、Zeiss和ASML的… (4月3日)
 为Al设计的NPU与其他处理器共同加速生成式AI体验 (3月9日)
 英特尔为未来数据中心开发的处理器芯片新技术 (2月23日)
 压电技术使手机屏幕直接变成高质量话筒 (2月14日)
 PCB基础知识及设计软件概述 (2月2日)
 国家文化和科技融合示范基地名单(含第五批) (1月24日)
 国家文化和科技融合示范基地认定管理办法(试行) (1月24日)
 隐身衣逐步走进现实:光学隐身衣、电磁波隐身衣 (10月30日)
 电子电路常用电子元件名称缩写及中英文对照 (10月17日)
 文章搜索
搜索选项:            
  → 评论内容 (点击查看)
您是否还没有 注册 或还没有 登陆 本站?!
关于我们 ┋ 免责声明 ┋ 产品与服务 ┋ 联系我们 ┋ About 365PR ┋ Join 365PR
Copyright @ 2005-2008 365pr.net Ltd. All Rights Reserved. 深圳市产通互联网有限公司 版权所有
E-mail:postmaster@365pr.net 不良信息举报 备案号:粤ICP备06070889号