加入收藏
 免费注册
 用户登陆
首页 展示 供求 职场 技术 智造 职业 活动 视点 品牌 镨社区
今天是:2025年12月22日 星期一   您现在位于: 首页 →  产通直播 → 半导体器件(企业动态)
摩尔线程TurboRAG研究成果被自然语言处理顶会EMNLP 2025收录
2025/12/22 11:19:11     

按此在新窗口浏览图片

【产通社,12月22日讯】摩尔线程(Moore Threads;股票代码:688795)官网消息,其创新研究论文《TurboRAG: Accelerating Retrieval-Augmented Generation with Precomputed KV Caches for Chunked Text》近日被自然语言处理领域的顶级国际会议EMNLP 2025收录。该论文提出了一种创新的“混合离线-在线”RAG推理架构,通过预计算与复用KV Cache(Key-value Cache),显著提升生成式检索增强系统的推理效率,为大模型在高频交互与实时响应场景中的应用提供了全新的技术解决方案。

传统Retrieval-Augmented Generation(RAG)系统在处理多文档任务时面临显著瓶颈:频繁检索文档需要重复编码,带来大量冗余计算;长上下文拼接注意力机制复杂度呈平方级增长,严重影响首令牌生成速度,导致延迟;同时,显存占用过高也限制了批处理规模,影响系统整体吞吐,形成性能瓶颈。这些问题制约了RAG系统在实时交互场景中的广泛应用。

摩尔线程TurboRAG通过引入“分块预计算KV Cache”与“位置重编码”两项核心技术,在不改变模型架构的前提下,实现了多文档上下文的快速拼接与高效推理。实验结果显示,在LongBench等多文档问答基准测试中,TurboRAG将首令牌生成速度最高加快9.4倍,平均提升8.6倍,同时在线推理计算量大幅降低98.5%。在大模型文档问答的准确性基准RGB中,即使噪声文档比例高达80%,TurboRAG的答案准确率仍与GPT-4o相当,且模型通用能力保持稳定。该技术已成功在Qwen2、LLaMA等主流开源模型上完成验证,展现出优秀的通用性与工程落地潜力。

作为专注于智能计算创新的科技企业,摩尔线程持续深耕大模型推理加速与系统优化领域。本次被EMNLP 2025收录的TurboRAG研究成果,体现了公司在"算法-系统协同设计"方面的技术实力。查询进一步信息,请访问官方网站http://developer.mthreads.com。(张怡,产通发布)    (完)
→ 『关闭窗口』
 365pr_net
 [ → 我要发表 ]
上篇文章:飞凯材料准分子肤感涂料荣获2025年度“亚洲涂料行…
下篇文章:香港科大冯诺依曼(von-neumann)团队发布创新AI…
  → 评论内容 (点击查看)
您是否还没有 注册 或还没有 登陆 本站?!
 分类浏览
官网评测>| 官网  社区  APP 
STEAM>| 学术科研  产品艺术  技术规范  前沿学者 
半导体器件>| 产品通报  企业动态  VIP追踪 
电子元件>| 产品通报  企业动态  VIP追踪 
消费电子>| 产品通报  企业动态  VIP追踪 
商业设备>| 产品通报  企业动态  VIP追踪 
电机电气>| 产品通报  企业动态  VIP追踪 
电子材料>| 产品通报  企业动态  VIP追踪 
电子测量>| 产品通报  企业动态  VIP追踪 
电子制造>| 产品通报  企业动态  VIP追踪 
应用案例>| 家庭电子  移动电子  办公电子  通信网络  交通工具  工业电子  安全电子  医疗电子  智能电网  固态照明 
工业控制>| 产品通报  企业动态  VIP追踪 
通信电子>| 产品通报  企业动态  VIP追踪 
交通工具>| 产品通报  企业动态  VIP追踪 
基础工业>| 产品通报  企业动态  VIP追踪 
农业科技>| 产品通报  企业动态  专家追踪 
信息服务>| 企业动态 
光电子>| 企业动态 
关于我们 ┋ 免责声明 ┋ 产品与服务 ┋ 联系我们 ┋ About 365PR ┋ Join 365PR
Copyright @ 2005-2008 365pr.net Ltd. All Rights Reserved. 深圳市产通互联网有限公司 版权所有
E-mail:postmaster@365pr.net 不良信息举报 备案号:粤ICP备06070889号