加入收藏
免费注册
用户登陆
首页
展示
供求
职场
技术
智造
职业
活动
视点
品牌
镨社区
今天是:2024年10月10日 星期四 您现在位于:
首页
→
技术
→ 行业标准(移动电子)
AI TOPS和NPU性能指标指南
2024/6/11 11:47:14
在当今快速发展的技术环境中,AI正在变革各行各业并推动创新,理解AI性能指标的复杂性至关重要。过去许多AI模型需要在云端运行。当我们走向由终端侧生成式AI处理定义的未来时,我们必须能够评估计算平台可运行AI模型的性能、准确性和效率。如今,TOPS(每秒万亿次运算)是衡量处理器AI性能的主要方式之一。TOPS是基于处理器所需的架构和频率,衡量处理器潜在AI推理峰值性能的方法,比如神经网络处理器(NPU)。下面我们将深入探讨。
NPU是什么?
在深入探讨TOPS的具体内容之前,让我们先看看NPU的重要性。对于终端侧AI处理,NPU在提高效率、为个人用户和企业提供创新的应用体验方面发挥着关键作用。评估这些专用处理器的性能需要全面了解其能力背后的关键指标。
NPU的演进改变了人们处理计算的方式。传统上,CPU负责执行AI算法。随着对处理性能的需求飙升,专用NPU应运而生,成为处理AI相关软件应用的专用解决方案。NPU旨在高效处理AI任务所需的复杂数学计算,提供出色的效率、性能和能效。
 
AI TOPS是什么?
TOPS作为展示处理器计算能力的指标,是衡量NPU性能的核心。
TOPS通过以万亿单位测量一秒钟内执行的运算(加法、乘法等)次数来量化NPU处理能力。
这种标准化测量方式非常明确地显示了NPU的性能,可作为比较不同处理器和架构AI性能的关键指标。因为TOPS是针对NPU的基础性能指标,探索TOPS的计算参数以及它们如何决定性能至关重要,这有助于更深入地了解NPU的能力。
乘法累加(MAC)运算执行AI工作负载中的核心数学公式。矩阵乘法由两类基础运算组成:累加器的乘法和加法。例如,一个MAC单元可在每个时钟周期内运行两类基础运算各一次,意味着它在每个时钟周期内执行两个运算。一个给定的NPU有一定数量的MAC单元,能够在不同精度级别进行运算,这取决于NPU架构。
频率决定NPU及其MAC单元(以及CPU或GPU)运算的时钟速度(或每秒周期数),直接影响整体性能。更高的频率允许在单位时间内执行更多运算,从而提高处理速度。但是,提高频率也会导致更高功耗和发热,影响电池续航和用户体验。处理器TOPS计算通常使用峰值运行频率。
精度指计算的颗粒度,通常精度越高模型准确性就越高,需要的计算强度也越高。最常见的高精度AI模型为32位和16位浮点精度,而速度更快的低精度低功耗模型通常使用8位和4位整数精度。当前行业标准为以INT8精度评估AI推理性能TOPS。
计算TOPS要从计算OPS开始,OPS等于MAC单元数乘以运行频率的两倍。TOPS数量是OPS除以一万亿的值,将公式更简单地列出,即:TOPS = 2×MAC单元数×频率/1万亿。 
TOPS和实际性能
尽管TOPS提供了探索NPU能力的重要信息,我们仍必须将理论指标和实际应用联系起来。
毕竟,仅仅有高TOPS值并不能保证最佳的AI性能;各种因素协同作用的结果才能真正决定NPU实力。
因此评估NPU性能时要考虑内存带宽、软件优化和系统集成等方面的因素。基准测试可以帮助我们超越数字,了解NPU在实际场景中的表现,其中时延、吞吐量和能效尤为重要。
Procyon AI基准测试使用真实工作负载来帮助将理论性的TOPS评估转化为用户在使用AI推理的真实应用中对响应和处理能力的预期。它以多个精度运行六个模型,提供NPU不同性能表现的详细洞察。类似模型在生产力、媒体、创作者和其他应用中越来越常见。在Procyon AI和其他基准测试中有更快的性能表现,与实现更快推理和更好用户体验息息相关。
为此,分析实际性能可以为NPU的能力和局限性提供宝贵洞察。必须从可行性和实用性角度检验性能指标。 
未来NPU性能指标
随着技术不断快速发展,数字化转型需求持续影响各行各业,NPU性能指标格局将进一步演进。尽管新兴趋势正在更广泛地定义和评估NPU性能与计算的方式,TOPS仍是很好的性能指标,没有理由认为它会很快被淘汰。
随着各种AI新技术在未来几年受到关注并重新定义无数行业,对能够反应不同技术独特特征的可靠性能指标的需求将不断凸显。适应性、可扩展性和实际应用相关性将定义未来的NPU性能指标。
根据用户需求评估NPU性能
应对快速变化的NPU性能评估领域或许会让人望而生畏,但随着数字化转型(尤其是在AI领域)持续快速发展,深入了解TOPS对行业和个人来说都很重要。
最终,选择合适的系统级芯片(SoC)取决于用户、客户或组织的工作负载和优先级,而这一决策很可能需要取决于SoC中的NPU。
无论用户是优先考虑原始算力、能效还是模型准确度,骁龙X系列平台面向笔记本电脑,配备高达45TOPS的NPU,能够强力赋能PC,并将实际可用的AI体验引入用户的工作流程。查询进一步信息,请访问官方网站
http://www.qualcomm.cn/news/blogs/2024/05/blog-2024-05-30
。(张怡,张底剪报)
→
『关闭窗口』
365pr_net
[
→ 我要发表
]
上篇文章:
驱动增强终端侧生成式AI体验的技术:多模态生成式AI
下篇文章:
驱动增强终端侧生成式AI体验的技术:LoRA
→ 主题所属分类:
行业标准
→
移动电子
热门文章
如何申请EtherCAT技术协会(ETG)会员资格
(
175041
)
台北国际计算机展(COMPUTEX 2015)参展商名…
(
105084
)
上海市集成电路行业协会(SICA)
(
92212
)
USB-IF Members Company List
(
83683
)
第十七届中国专利优秀奖项目名单(507项)
(
75115
)
台北国际计算机展(COMPUTEX 2015)参展商名…
(
68603
)
苹果授权MFi制造商名单-Authorized MFi Lic…
(
68547
)
中国130家太阳能光伏组件企业介绍(3)
(
55845
)
PLC论坛
(
52844
)
中国130家太阳能光伏组件企业介绍(2)
(
49141
)
最近更新
将GaN极性半导体晶圆的两面用于功能器件
(9月30日)
驱动增强终端侧生成式AI体验的技术:LoRA
(6月11日)
AI TOPS和NPU性能指标指南
(6月11日)
驱动增强终端侧生成式AI体验的技术:多模态生成式AI
(6月11日)
AI工程师如何建立团队在AI和AI方面的技能
(5月25日)
Copilot键让最新Windows电脑能记住一切
(5月24日)
英特尔是如何削弱标准机构为我们提供PCI连接器?
(5月22日)
英特尔用于下一代先进封装的玻璃基板(Glass Subs…
(4月29日)
EUV光刻技术回眸:Trumpf、Zeiss和ASML的…
(4月3日)
为Al设计的NPU与其他处理器共同加速生成式AI体验
(3月9日)
文章搜索
搜索选项:
文章标题
发布人
请选择文章的类别
电子材料
技术聚焦
工艺制程
应用信息
企业故事
电子元件
技术聚焦
工艺制程
应用信息
企业故事
半导体器件
技术聚焦
工艺制程
应用信息
企业故事
显示器件
技术聚焦
工艺制程
应用信息
企业故事
绿色能源
技术聚焦
工艺制程
应用信息
企业故事
电子制造
技术聚焦
电子设备
工艺指南
企业故事
电子测量
技术聚焦
电子仪器
测试指南
企业故事
家庭电子
技术聚焦
产品概览
企业故事
移动电子
技术聚焦
产品概览
企业故事
办公电子
技术聚焦
企业故事
产品概览
汽车电子
技术聚焦
产品概览
企业故事
通信网络
技术聚焦
产品概览
企业故事
工业电子
技术聚焦
产品概览
企业故事
固态照明
技术聚焦
产品概览
企业故事
安全电子
技术聚焦
产品概览
企业故事
医疗电子
技术聚焦
产品概览
企业故事
行业标准
通用标准
电子元件
半导体器件
显示器件
绿色能源
电子材料
电子制造
电子测量
家庭电子
移动电子
办公电子
汽车电子
通信网络
工业电子
固态照明
安全电子
医疗电子
研究报告
官方数据
电子元件
半导体器件
显示器件
绿色能源
电子材料
电子制造
电子测量
家庭电子
移动电子
办公电子
汽车电子
通信网络
工业电子
固态照明
安全电子
医疗电子
官方网站
标准制订
行业协会
产业联盟
技术论坛
认证测试
展览机构
行业名录
企业杂志
电子元件
半导体器件
显示器件
绿色能源
电子材料
电子制造
电子测量
家庭电子
移动电子
办公电子
汽车电子
通信网络
工业电子
固态照明
安全电子
医疗电子
→
评论内容
(点击查看)
(没有相关评论)
您是否还没有
注册
或还没有
登陆
本站?!
关于我们
┋
免责声明
┋
产品与服务
┋
联系我们
┋
About 365PR
┋
Join 365PR
Copyright @ 2005-2008 365pr.net Ltd. All Rights Reserved. 深圳市产通互联网有限公司 版权所有
E-mail:postmaster@365pr.net
不良信息举报
备案号:
粤ICP备06070889号