幻觉 如何经过实时数据优化AI准确性并缩小 RAG

  • 电脑网络维修
  • 2024-11-14

​在人工自动的开展中,内容生成的准确性一直是一个关键应战,特意是当模型生成出看似可信但实践失误的回答时,即所谓的“幻觉”(Hallucinations)。为了处置这一疑问,出现了一项先进的AI技术——检索增强生成(Retrieval-Augmented Generation,简称RAG),它经过联合实时检索与内容生成的双重才干,清楚优化AI的回答准确性。本文将深化讨论RAG的原理、技术架构、向量数据库的运行及其如何缩小AI的经常出现疑问,让读者全方位了解如何经过RAG成功更牢靠、更贴近实践的内容生成。

01、RAG的外围思念:什么是检索增强生成?

便捷来说,RAG是一种经过先检索再生成来优化回答准确性的AI方法。传统的AI生成内容理论基于模型的训练数据,但往往不可反映实时的灵活消息,这或者造成回答与实践状况脱节。RAG则不同,它首先从常识库中检索出与疑问关系的最新消息,而后基于这些消息生成回答。经过将检索式模型与生成式模型相联合,RAG不只清楚优化了内容的品质和准确性,也增强了模型在人造言语处置义务中的体现。

02、深化解析RAG的架构流程

RAG的流程分为两个关键阶段:检索阶段和生成阶段。以下为RAG的具体上班步骤:

1. 检索阶段

2. 生成阶段

这种双重环节使得RAG生成的回答更具可信度,特意是在常识密集型或须要实时降级的畛域中体现杰出。

对比RAG与传统生成形式

在没有RAG的状况下,传统AI模型只能依赖已训练的静态数据来回答疑问,不足对新常识的顺应才干。这造成了生成的内容往往不够准确,甚至出现“幻觉”或“虚拟”内容。而RAG经过引入实时消息,补偿了这一短板,为AI生成的内容削减了时效性和实在性。

03、什么是向量数据库?RAG上班流中的关键角色

向量数据库在RAG的检索阶段中起到至关关键的作用,它能够经过语义相似性高效地检索关系消息。与传统的关键词婚配系统不同,向量数据库将文本转化为高维空间中的向量,并将具备相似含意的文本向量搁置在相邻位置,从而成功更精准的消息检索。

向量数据库示例

以下为向量数据库中一个数据点的结构示例:

{"id": 0,"vector": [0.01, -0.03, 0.15, ..., -0.08],"payload": {"company": "Apple Inc.","ticker": "AAPL","price": 175.50,"market_cap": "2.8T","industry": "Technology","pe_ratio": 28.5}}

04、RAG罕用的距离度量方法

在向量数据库中,为了更准确地婚配消息,系统须要经常使用距离度量来权衡数据点之间的相似性。不同的距离度量实用于不同场景,以下是RAG罕用的几种距离度量方法:

这些度量方法经过计算数据点间的相似性,确保RAG能够找到最婚配的消息,从而生成更精准的回答。

05、如何应用RAG缩小AI幻觉与虚拟疑问?

在AI生成内容时,有时会发生“幻觉”,即看似正当但却失误的回答。例如:

这类疑问源于模型试图依据已知的形式来预测回答,却不可访问实时或正确的消息。RAG经过将生成环节建设在外部消息检索之上,从基本上缩小了这种失误。另外,RAG还能有效应答另一类疑问,即“虚拟”,即AI模型用失误的理由来撑持一个回答。RAG经过确保模型生成的内容基于实践检索的数据,降落了生成不准确消息的危险。

06、RAG成功步骤:从数据治理到向量数据库检索

以下是成功RAG的基本流程:

示例:Python成功RAG流程

以下为RAG流程的Python代码成功步骤:

Step 1:初始设置与性能

import pandas as pdfrom sentence_transformers import SentenceTransformer# 加载句子嵌入模型encoder = SentenceTransformer('all-MiniLM-L6-v2')

Step 2:数据荡涤

# 读取JSON格局的数据df = pd.read_json('../../stock_data.json')df = pd.json_normalize(df['stocks'])df = df[df['company'].notna()]data = df.to_dict('records')

Step 3:初始化向量数据库

from qdrant_client import QdrantClient# 创立内存中的向量数据库qdrant = QdrantClient(":memory:")

Step 4:创立向量汇合

# 创立汇合以存储向量数据qdrant.recreate_collection(collection_name="top_stocks",vectors_cnotallow=models.VectorParams(size=encoder.get_sentence_embedding_dimension(),distance=models.Distance.COSINE))

Step 5:数据向量化并上行

# 向量化数据并上行至向量数据库valid_data = [doc for doc in,points=[models.PointStruct(id=idx,vector=encoder.encode(doc["company"]).tolist(),payload=doc) for idx, doc in enumerate(valid_data)])

Step 6:口头查问并检索结果

# 口头查问并失掉相似结果query_prompt = "市值较高的科技公司"query_vector = encoder.encode(query_prompt).tolist()search_results = qdrant.search(collection_name="top_stocks",query_vector=query_vector,limit=3,with_payload=True)for result in search_results:print(f"公司:{result.payload['company']},行业:{result.payload['industry']},市值:{result.payload['market_cap']}")

联合检索结果启动生成

RAG还可以将检索结果传递给生成式模型,用于增强回答的准确性。例如:

from openai import OpenAIclient = OpenAI(base_url="http://127.0.0.1:8080/v1", api_key="your_api_key")completion = client.chat.completions.create(model="LLaMA_CPP",messages=[{"role": "system", "content": "你是股票畛域的专家,协助用户选用股票并回答他们的疑问。"},{"role": "user", "content": "NVIDIA的市值和市盈率是多少?"},{"role": "assistant", "content": str(search_results)}])print(completion.choices[0].message["content"])

经过RAG的检索增强,回答不只限于模型训练的静态数据,还添加了最新的市场灵活消息,使回答愈加准确和实时。

07、结语

在谋求AI内容生成准确性和牢靠性的时代,RAG技术无疑是一项打破。经过将外部实时数据融入到生成环节,RAG清楚降落了“幻觉”和“虚拟”现象的出现,使AI生成的回答更具实践意义。联合向量数据库的语义搜查性能,RAG能够为用户提供更关系、更合乎事实的消息。

RAG的检索与生成相联合,正推进AI走向更上档次的自动化运行,为须要常识密集型内容的场景提供了新的处置打算。

参考:

基咯咯

原文链接:​ ​​ ​

  • 关注微信

本网站的文章部分内容可能来源于网络和网友发布,仅供大家学习与参考,如有侵权,请联系站长进行删除处理,不代表本网站立场,转载联系作者并注明出处:https://duobeib.com/diannaowangluoweixiu/5287.html

猜你喜欢

热门标签

洗手盆如何疏浚梗塞 洗手盆为何梗塞 iPhone提价霸占4G市场等于原价8折 明码箱怎样设置明码锁 苏泊尔电饭锅保修多久 长城画龙G8253YN彩电输入指令画面变暗疑问检修 彩星彩电解除童锁方法大全 三星笔记本培修点上海 液晶显示器花屏培修视频 燃气热水器不热水要素 热水器不上班经常出现3种处置方法 无氟空调跟有氟空调有什么区别 norltz燃气热水器售后电话 大连站和大连北站哪个离周水子机场近 热水器显示屏亮显示温度不加热 铁猫牌保险箱高效开锁技巧 科技助力安保无忧 创维8R80 汽修 a1265和c3182是什么管 为什么电热水器不能即热 标致空调为什么不冷 神舟培修笔记本培修 dell1420内存更新 青岛自来水公司培修热线电话 包头美的洗衣机全国各市售后服务预定热线号码2024年修缮点降级 创维42k08rd更新 空调为什么运转异响 热水器为何会漏水 该如何处置 什么是可以自己处置的 重庆华帝售后电话 波轮洗衣机荡涤价格 鼎新热水器 留意了!不是水平疑问! 马桶产生了这5个现象 方便 极速 邢台空调移机电话上门服务 扬子空调缺点代码e4是什么疑问 宏基4736zG可以装置W11吗 奥克斯空调培修官方 为什么突然空调滴水很多 乐视s40air刷机包 未联络视的提高方向 官网培修 格力空调售后电话 皇明太阳能电话 看尚X55液晶电视进入工厂形式和软件更新方法 燃气热水器缺点代码

热门资讯

关注我们

微信公众号