Meta开发REFRAG框架大幅提高检索大模型增强生成速度

科研动态1周前更新 0f6ec722422f273c

查找参加最新学术会议，发表EI、SCI论文，上学术会议云

2025年数据科学与智能系统国际会议（DSIS 2025）

2025年第四届先进的电子、电气和绿色能源国际会议 (AEEGE 2025)

2025年第二届亚太计算技术、通信和网络会议（CTCNet 2025）

热门国际学术会议推荐 | 出版检索稳定，快至7天录用

2026年第五届算法、计算和机器学习国际会议(CACML 2026)

2026年第八届软件工程和计算机科学国际会议(CSECS 2026)

Meta开发REFRAG框架大幅提高检索大模型增强生成速度

文章导读

Meta的REFRAG框架让AI检索效率迎来突破性飞跃！你是否曾因大模型处理长文本时响应缓慢而困扰？这项技术不仅解决了系统延迟和内存占用的痛点，更实现了30倍的推理加速和16倍上下文处理能力提升。通过智能压缩低相关性内容，REFRAG在保持性能的同时大幅优化了用户体验，为AI应用的高效运行开辟全新路径。

— 内容由好学术AI分析文章内容生成，仅供参考。

10月12日，美国Meta公司超级智能实验室推出一种新型REFRAG框架，使大模型检索增强生成（RAG）推理速度提升30倍。相关研究成果以“REFRAG: Rethinking RAG based Decoding”为题发布在预印本平台arXiv上。

大模型在RAG任务中表现突出，但现有大模型处理文本较长的上下文输入时存在显著的系统延迟，并且需要大量内存来存储键值，从而导致吞吐量下降。对此，Meta公司超级智能实验室推出一种解码框架REFRAG，能够在仅保留核心内容原始Token的前提下，对RAG召回的低相关性文本块进行智能压缩，以降低系统延迟，提高数据吞吐量。测试显示，REFRAG在不损失性能的前提下，TTFT（用户发出请求到大模型返回第一个token所需的时间）速度提高30.85倍，大模型上下文处理长度提升了16倍。这项研究显示出对RAG进行专门优化的重要性，为实现高效的上下文大模型推理开辟了新的方向。

© 版权声明

本文由分享者转载或发布，内容仅供学习和交流，版权归原文作者所有。如有侵权，请留言联系更正或删除。

2025年数据科学与智能系统国际会议（DSIS 2025）

第二届大数据分析与人工智能应用学术会议（BDAIA2025）

2025年第四届先进的电子、电气和绿色能源国际会议 (AEEGE 2025)

2025年第二届亚太计算技术、通信和网络会议（CTCNet 2025）

热门国际学术会议推荐 | 多学科征稿、征稿主题广 | 免费主题匹配

2026年第五届算法、计算和机器学习国际会议(CACML 2026)

2026年第八届软件工程和计算机科学国际会议(CSECS 2026)

相关文章

高海拔宇宙线观测揭示恒星级黑洞为宇宙极端粒子加速器

高海拔宇宙线观测揭示恒星级黑洞为宇宙极端粒子加速器

1周前

02930

北京大学生命科学学院郑晓峰课题组揭示代谢酶ALDOA入核激活NF-κB信号通路驱动胰腺癌进展

北京大学生命科学学院郑晓峰课题组揭示代谢酶ALDOA入核激活NF-κB信号通路驱动胰腺癌进展

1个月前

02900

打造有害生物治理“新疆方案” 筑牢植物生物安全西北屏障

打造有害生物治理“新疆方案” 筑牢植物生物安全西北屏障

4个月前

03460

北京化工大学气溶胶与霾实验室的Markku Kulmala教授及合作团队在《Nature Geoscience》刊发研究成果，揭示了北京二次有机气溶胶的来源

北京化工大学气溶胶与霾实验室的Markku Kulmala教授及合作团队在《Nature Geoscience》刊发研究成果，揭示了北京二次有机气溶胶的来源

10个月前

06180

查找最新学术会议，发表EI、SCI论文，上学术会议云

第三届机器学习与自动化国际学术会议（CONF-MLA 2025）

热门国际学术会议推荐 | 立即查看超全会议列表

1 条评论

冷香读者

哇这个速度提升太惊人了吧！30倍是什么概念🤯

1周前未知

回复