解读RAG

向大模型输入问题，让大模型回答。

大模型的做法是，先自己去寻找相关信息，再汇总出答案。这个过程有可能不靠谱，大模型自己寻找出他自己认为是对的信息，可能是错的，所以做出的答案，就是错的。

于是改成，让程序找出相关信息，再给大模型汇总。程序员编程后找出的信息肯定是对的，大模型汇总的结果，以大模型的能力，结果也是对的。

但这种方式有问题，就是会多次调用大模型，大模型通常是部署在远端的，就会产生性能问题。所以在大模型内部，让大模型自己去调用工具。

要大模型自己调用工具，就得靠系统提示词了，当然系统提示词不用自己写，将在n8n中流程导出json，再向deepseek提问，就可以生成提示词了。

调用的工具不止一个，就会产生协同问题，如何将a工具产生的结果作为参数调用b工具，这里的做法就是使用few shot，意思是在提示词中要要提供例子，如调用工具产生结果r1，{"input": r1}以这个参数调用工具b，这样工具b内部通过fromAI("input")就能获取到input参数的值了。

这个过程中大模型实际只做汇总，利用了大模型的长处，避免了大模型的短处。

程序去找信息，如果是从数据库中找出相关文档的方式，就是通常据说的RAG。

但在做RAG的过程中，难免碰到需求，如：用户输入关键词，直播回答某些预先答案。

象这种的实现方式，如果采用将答案弄成文档，再去让程序找到相关文档，再让大模型汇总这种方式也是不可靠。因为找到文档也是靠概率。

因此需使用新的方式，这种方式就是让程序调用工具，得出结果作为相关信息，再让大模型做汇总。这个过程出来的结果就是可靠的了。

为什么大模型会去调用工具呢

如果工具处理的方式不够，需要思考，那就需要加入大模型进去，进行协助，这种工具就是智能体了。整个架构就是所谓的多智能体的方式了。

所以总体的思路，就是让大模型做最擅长的活，汇总，信息提供由外部去做。整个结果就是可控的了。

posted on 2025-12-13 01:28 paulwong 阅读(46) 评论(0) 编辑收藏所属分类: AI-RAG


只有注册用户登录后才能发表评论。




网站导航: 博客园博客园最新博文博问管理
相关文章: AI应用资源解读RAG Open WebUI + N8N 流式输出 RAG提高召回率秘笈 RAG优化

paulwong