加入收藏
免费注册
用户登陆
首页
展示
供求
职场
技术
智造
职业
活动
视点
品牌
镨社区
今天是:2025年3月27日 星期四 您现在位于:
首页
→
技术
→ 工业电子(技术聚焦)
驱动增强终端侧生成式AI体验的技术:多模态生成式AI
2024/6/11 11:44:42
改善情境化和定制化一直是用户体验的长期需求。例如,消费者希望终端能够自动利用来自智能手机数据和传感器的情境信息和自定义偏好,让体验更直观和无缝,比如基于当前位置、时刻和食物选择偏好推荐餐厅用餐,创造愉悦体验。
尽管生成式AI已展现出新兴的和变革性的能力,但其仍有很大改进空间。类似多模态生成式AI等这样的技术可应对生成式AI更加情境化和定制化的体验趋势。多模态生成式AI模型输入和输出多种模态,以提供更佳响应和答案。
 
多模态AI模型能够更好的理解世界
大语言模型(LLM)为纯文本训练模型带来了惊艳的能力。如果模型能够支持包含更多知识的不同信息形式,能带来怎样的提升呢?
人类能够通过语言和阅读文字学到很多东西,但也需要通过各种感官和互动形成对世界的理解:
● 我们的眼睛让我们能够看到球在倾斜地面上滚动的场景,以及当球滚到沙发后面会如何消失。
● 我们的耳朵可以识别语音中的情绪或警报声来源的方向。
● 我们与世界的接触和互动让我们知道如何用手握住泡沫塑料咖啡杯,以及如何在走路时避免摔倒。
类似的例子不胜枚举。尽管语言可以描述几乎所有这些事情,但它可能不如其他模态做得那么好或那么高效。
正如人类需要利用各种感官学习,生成式AI除了利用文本之外还可以使用更多其他模态学习:这正是多模态生成式AI模型的作用所在。
多模态生成式AI模型可基于一系列模态进行训练,包括文本、图像、语音、音频、视频、3D、激光雷达(LIDAR)、射频(RF)、以及几乎任何传感器数据。
通过利用所有这些传感器,融合数据,并更全面地理解世界,多模态生成式AI模型可以提供更佳答案。AI研究人员已经做到了这一点,他们利用不同模态的一系列数据在云端训练多模态大模型(LMM),让模型更“智能”。OpenAI GPT-4V和谷歌Gemini就是这类LMM。
这能给用户带来什么?举例来说,LMM可以充当通用助手,接收任何模态的输入,为更广泛的问题类型提供大幅改进的答案。比如基于复杂的停车标志回答用户可否停车,或基于振动噪音回答用户该如何修理洗碗机故障。
下一步,部署LMM进行推理:尽管生成式AI推理可在云端运行,但在边缘终端侧运行有着诸多好处,比如隐私、可靠性、成本效益和即时性。例如,传感器和相应的传感器数据来源于边缘终端,因此在终端侧处理和保存数据更具成本效益和可扩展性。
 
终端侧LLM现在具备视觉理解能力
高通AI研究近期演示了全球首个在Android手机上运行的多模态LLM。我们展示了一个超过70亿参数的大语言和视觉助理大模型(LLaVA),其可接受包括文本和图像在内的多种类型的数据输入,并生成关于图像的多轮对话。通过全栈AI优化,LLaVA能够在搭载第三代骁龙8移动平台的参考设计上以实时响应的速度在终端侧生成token。
具有语言理解和视觉理解能力的LMM能够赋能诸多用例,例如识别和讨论复杂的视觉图案、物体和场景。例如,视觉AI助手可以帮助视力障碍者更好地理解周围环境并与之互动,从而提高生活质量。
 
终端侧LLM现在具备听觉理解能力
在搭载骁龙X Elite的Windows PC上,高通近期还展示了全球首个在终端侧运行的超70亿参数的LMM,可接受文本和环境音频输入(如音乐、交通环境音频等),并基于音频内容生成多轮对话。
音频提供的更多情境信息可以帮助LMM针对用户的提示给出更佳答案。我们很高兴看到终端侧LMM现已支持视觉、语音和音频模态,并期待对更多模态的支持。 
生成式AI时代刚刚开始,无限创新即将到来。
 
更多终端侧生成式AI技术进步即将到来
打造能够更好理解情境信息的AI模型是获得更佳答案和体验提升的必要条件,多模态生成式AI正是即将应用于未来终端的最新变革性技术之一。欢迎阅读博客第二部分,我将深入介绍LoRA,探究它将如何帮助应对现有挑战,为消费者和企业规模化提供情境化、定制化和个性化体验。查询进一步信息,请访问官方网站
http://www.qualcomm.cn/news/blogs/2024/05/blog-2024-05-30
。(张怡,张底剪报)
→
『关闭窗口』
365pr_net
[
→ 我要发表
]
上篇文章:
AI工程师如何建立团队在AI和AI方面的技能
下篇文章:
AI TOPS和NPU性能指标指南
→ 主题所属分类:
工业电子
→
技术聚焦
热门文章
如何申请EtherCAT技术协会(ETG)会员资格
(
183181
)
台北国际计算机展(COMPUTEX 2015)参展商名…
(
105905
)
上海市集成电路行业协会(SICA)
(
93861
)
USB-IF Members Company List
(
84343
)
第十七届中国专利优秀奖项目名单(507项)
(
76159
)
苹果授权MFi制造商名单-Authorized MFi Lic…
(
69961
)
台北国际计算机展(COMPUTEX 2015)参展商名…
(
69396
)
中国130家太阳能光伏组件企业介绍(3)
(
56532
)
PLC论坛
(
53273
)
中国130家太阳能光伏组件企业介绍(2)
(
49846
)
最近更新
一本面向设计工程师精心修订和更新的《ESD应用手册…
(3月10日)
表皮电子学的代表作:石墨烯纹身
(2月26日)
在晶圆级大规模生产中引入脉冲激光沉积(PLD)技术
(1月21日)
你听说过PiezoMEMS技术吗?
(1月21日)
旨在挑战EUV的纳米压印光刻技术(Nanoimprint L…
(1月3日)
新UV光刻机专利显著提高能效并降低半导体制造成本
(11月6日)
将GaN极性半导体晶圆的两面用于功能器件
(9月30日)
驱动增强终端侧生成式AI体验的技术:LoRA
(6月11日)
AI TOPS和NPU性能指标指南
(6月11日)
驱动增强终端侧生成式AI体验的技术:多模态生成式AI
(6月11日)
文章搜索
搜索选项:
文章标题
发布人
请选择文章的类别
电子材料
技术聚焦
工艺制程
应用信息
企业故事
电子元件
技术聚焦
工艺制程
应用信息
企业故事
半导体器件
技术聚焦
工艺制程
应用信息
企业故事
显示器件
技术聚焦
工艺制程
应用信息
企业故事
绿色能源
技术聚焦
工艺制程
应用信息
企业故事
电子制造
技术聚焦
电子设备
工艺指南
企业故事
电子测量
技术聚焦
电子仪器
测试指南
企业故事
家庭电子
技术聚焦
产品概览
企业故事
移动电子
技术聚焦
产品概览
企业故事
办公电子
技术聚焦
企业故事
产品概览
汽车电子
技术聚焦
产品概览
企业故事
通信网络
技术聚焦
产品概览
企业故事
工业电子
技术聚焦
产品概览
企业故事
固态照明
技术聚焦
产品概览
企业故事
安全电子
技术聚焦
产品概览
企业故事
医疗电子
技术聚焦
产品概览
企业故事
行业标准
通用标准
电子元件
半导体器件
显示器件
绿色能源
电子材料
电子制造
电子测量
家庭电子
移动电子
办公电子
汽车电子
通信网络
工业电子
固态照明
安全电子
医疗电子
研究报告
官方数据
电子元件
半导体器件
显示器件
绿色能源
电子材料
电子制造
电子测量
家庭电子
移动电子
办公电子
汽车电子
通信网络
工业电子
固态照明
安全电子
医疗电子
官方网站
标准制订
行业协会
产业联盟
技术论坛
认证测试
展览机构
行业名录
企业杂志
电子元件
半导体器件
显示器件
绿色能源
电子材料
电子制造
电子测量
家庭电子
移动电子
办公电子
汽车电子
通信网络
工业电子
固态照明
安全电子
医疗电子
→
评论内容
(点击查看)
(没有相关评论)
您是否还没有
注册
或还没有
登陆
本站?!
关于我们
┋
免责声明
┋
产品与服务
┋
联系我们
┋
About 365PR
┋
Join 365PR
Copyright @ 2005-2008 365pr.net Ltd. All Rights Reserved. 深圳市产通互联网有限公司 版权所有
E-mail:postmaster@365pr.net
不良信息举报
备案号:
粤ICP备06070889号