一篇大模型RAG最新综述

  • 电脑网络维修
  • 2024-11-15

良久没分享过综述了,当蠢才享一个最新的RAG综述,来自卡内基梅隆大学。题目:A Comprehensive Survey of Retrieval-Augmented Generation (RAG): Evolution, Current Landscape and Future Directions

1. 引言

1.1 RAG技术概述

检索增强生成技术(RAG)关键由两个关键局部导致:其一是检索组件,关键职责是从外部数据库(如维基百科或私有库)中提取关系消息,经过密集向量表征启动文档识别;其二是生成组件,基于transformer结构,对失掉的消息启动处置并输入人造言语文本。这种技术有效降落了内容生成中的虚伪消息,优化了文本的准确性和语境顺应性。目前,RAG已在开明域问答、自动对话系统及共性化介绍等多个方向失掉运行。

1.2 检索与生成的融合系统

在RAG技术问世以前,NLP畛域关键驳回繁多的检索或生成方法。传统检索系统虽能极速定位关系文档,但缺乏消息整合才干;纯生成模型虽然表白流利富裕创意,却常有理想偏向。这两种方法各有优劣,促使钻研者开局探求融共打算,其中DrQA是较早将检索技术运行于问答义务的代表。

1.3 RAG系统的应战

该技术面临几个关键疑问:首先,在处置含糊查问和专业畛域检索时准确度无余,即使驳回DPR等技术,仍或者产生检索偏向;其次,检索消息与生成内容的整合有时显得僵硬,影响输入品质;再次,系统运转须要少量计算资源,特意是在规模化运行场景下;最后,还存在成见流传和透明度等伦理疑问,虽然RAG或者经过多元消息检索缩小成见,但仍需警觉消息源自身的倾向性。

2. RAG技术架构详解

2.1 基本框架

RAG系统由检索器和生成器两局部组成,前者担任文档检索,后者整合消息生成回应。相比传统模型,RAG能够实时调用外部常识,性能优于固定数据集的生成模型。

2.2 检索技术剖析

2.2.1 BM25算法

作为传统检索方法,BM25基于TF-IDF原理对文档启动排序。虽然在关键词婚配方面体现优秀,但在语义了解上存在局限。

2.2.2 DPR技术

DPR驳回双编码器架构,将查问和文档映射至高维向量空间,经过语义相似度启动婚配,在开明域问答中展现出优秀性能。

2.2.3 REALM打算

REALM翻新地将检索环节融入言语模型训练,成功检索器与生成器的协同优化。经过同步降级机制,该方法在常识密集型义务中展现出长处。

最新钻研显示,Self-RAG和REPLUG等技术经过引入LLM优化了检索才干。这些系统运用留意力机制处置输入和检索文本,确保生成环节中突出关键消息,虽然计算开支较大。

2.3 生成模块解析

生成模块作为RAG系统的关键组成局部,关键担任整合检索消息与输入内容,输入连接的照应结果。该模块以大规模言语模型为基础,确保输入内容的流利性与准确性,并与初始查问坚持高度关系。

2.3.1 文本转换转换器T5

作为文本生成的干流选用,T5模型将一切人造言语处置义务一致为文本转换框架。这种设计理念使其在问答、摘要等多种义务中展现出优秀的顺应性。在与检索模块结合后,T5基础的RAG系统在多个评测数据集上取得了清楚成绩,尤其是在Natural Questions和TriviaQA等测试中的体现逾越了传统生成模型。其杰出的多义务处置才干使其成为常识密集型运行的理想选用。

2.3.2 双向自回归转换器BART

BART在处置含噪声输入的文本生成义务中体现突出,特意适宜摘要和开明域问答等运行。其去噪自编码机制能够有效重构受损文本序列,当与检索配置结合时,清楚优化了生成内容的理想准确度。

3. 多模态RAG技术探析

3.1 文本RAG技术

文本畛域的RAG运行最为成熟,以BERT和T5为代表的Transformer架构为外围,经过留意力机制增强了文本了解才干,推进了多种实践运行的开展。

3.2 音频RAG技术

音频RAG技术将检索增强生成裁减到语音畛域,借助Wav2Vec 2.0等预训练模型启动特征示意,为语音识别等运行提供允许。

3.3 视频RAG技术

视频RAG模型经过I3D TimeSformer等技术捕捉时空特征,成功了视觉与文本消息的融合,优化了视频了解和字幕生成等义务的效果。

3.4 跨模态RAG运行

跨模态RAG技术整合了多种数据方式,如Flamingo模型成功了文本、图像和视频的一致处置。"检索即生成"方法经过应用大规模配对数据集,将RAG框架裁减到了更宽泛的运行场景,成功了高效的跨模态消息检索与生成。

4. 现有RAG框架一览

RAG框架出现多元化开展趋向,各具特征:

其余翻新框架包含:

4.1 长高低文RAG技术开展

随着Gemini-1.5和GPT-4等允许长高低文的模型产生,RAG技术也相应演进:

这些框架各具特征,推进了RAG技术在不同运行场景中的开展。

以下是修正后的版本:

5. RAG技术面临的应战

RAG技术存在多个待处置的关键疑问:

系统性能方面:

品质控制方面:

社会影响方面:

6. 开展趋向与前景展望

6.1 多模态技术整合

未来开展重点包含:

6.2 性能优化方向

关器重点:

6.3 共性化服务增强

开展方向:

6.4 伦理与隐衷保证

重点关注:

6.5 言语允许拓展

开展重点:

6.6 检索机制翻新

翻新方向:

6.7 技术融合探求

未来展望:

本文转载自​​,作者:​​

  • 关注微信

本网站的文章部分内容可能来源于网络和网友发布,仅供大家学习与参考,如有侵权,请联系站长进行删除处理,不代表本网站立场,转载联系作者并注明出处:https://duobeib.com/diannaowangluoweixiu/6197.html

猜你喜欢

热门标签

洗手盆如何疏浚梗塞 洗手盆为何梗塞 iPhone提价霸占4G市场等于原价8折 明码箱怎样设置明码锁 苏泊尔电饭锅保修多久 长城画龙G8253YN彩电输入指令画面变暗疑问检修 彩星彩电解除童锁方法大全 三星笔记本培修点上海 液晶显示器花屏培修视频 燃气热水器不热水要素 热水器不上班经常出现3种处置方法 无氟空调跟有氟空调有什么区别 norltz燃气热水器售后电话 大连站和大连北站哪个离周水子机场近 热水器显示屏亮显示温度不加热 铁猫牌保险箱高效开锁技巧 科技助力安保无忧 创维8R80 汽修 a1265和c3182是什么管 为什么电热水器不能即热 标致空调为什么不冷 神舟培修笔记本培修 dell1420内存更新 青岛自来水公司培修热线电话 包头美的洗衣机全国各市售后服务预定热线号码2024年修缮点降级 创维42k08rd更新 空调为什么运转异响 热水器为何会漏水 该如何处置 什么是可以自己处置的 重庆华帝售后电话 波轮洗衣机荡涤价格 鼎新热水器 留意了!不是水平疑问! 马桶产生了这5个现象 方便 极速 邢台空调移机电话上门服务 扬子空调缺点代码e4是什么疑问 宏基4736zG可以装置W11吗 奥克斯空调培修官方 为什么突然空调滴水很多 乐视s40air刷机包 未联络视的提高方向 官网培修 格力空调售后电话 皇明太阳能电话 看尚X55液晶电视进入工厂形式和软件更新方法 燃气热水器缺点代码

热门资讯

关注我们

微信公众号