【值得收藏】RAG技术2026最新进展:范式评估与A-RAG方案详解 📅 发布时间:2026/7/3 10:49:04 👁️ 浏览次数: 文章详细介绍了RAG技术的最新进展包括基于RAGRouter-Bench数据集的5种RAG范式LLM-only、NaiveRAG、GraphRAG、HybridRAG、IterativeRAG评估与选型建议以及AgenticRAG的A-RAG方案。文章提供了数据构建策略和分层检索工具的实现方法并根据查询类型和语料特性给出了RAG范式选择的实用建议帮助开发者根据实际需求选择最适合的RAG技术方案。来看RAG进展回顾下选型上的事情包括RAG范式选择评估的建议顺便看下数据怎么做的然后再看看AgenticRAG之A-RAG方案。温故而知新常看常新。技术总是有趣的从基本问题出发多总结多归纳**多从底层实现分析逻辑**会有收获。一、RAG范式选择评估的建议来看第一个故事讲的是自适应RAG路由的数据集和基准测试RAGRouter-Bench对比了5种RAG范式**LLM-only、NaiveRAG、GraphRAG、HybridRAG、IterativeRAG等五种RAG范式然后评估每类范式都适合做啥**。工作在《RAGRouter-Bench: A Dataset and Benchmark for Adaptive RAG Routing》https://arxiv.org/pdf/2602.00296Code: https://github.com/ziqiwang0908/RAGRouter-BenchDataset: https://huggingface.co/datasets/Chaplain0908/RAGRouterLeaderboard: https://huggingface.co/spaces/Chaplain0908/RAGRouter-Leaderboard。可以再回顾下以下几点1、先看数据构建策略整合MuSiQue百科、QuALITY文学、UltraDomain_legal法律、GraphRAGBench_medical医疗21,460份文档覆盖百科、文学、法律、医疗四领域然后在数据构建上分块用滑动窗口512token窗口100token重叠分割文档知识图谱构建上对每个文本块用DeepSeek-V3提取主语-关系-宾语三元组如“阿司匹林-治疗-头痛”构建领域知识图谱如百科图谱含20.6万实体节点、27.7万边抽取的prompt如下∶向量索引用OpenAItext-embedding-3-small将文本块编码为1536维向量通过FAISS构建向量索引做余弦相似度检索。然后开始做问题生成和校验伪代码如下∶针对原始数据集查询类型单一的问题如MuSiQue仅含推理查询通过LLM增强生成三类查询覆盖不同复杂度事实型查询单段事实提取如“《史酷比神秘开端》中为史酷比配音的是谁”要求答案来自单个文本块推理型查询多段逻辑链推理如“SamJenkins注射静脉烧瓶的文档中提到的OA仓库属于哪个领域”需跨2-3个文本块关联信息总结型查询多源信息聚合如“文档中描述的‘美’有哪些不同作用或意义”需整合多个文本块的核心观点。然后再加一个check流程因为增强的有问题事实性检查用LLM基于语料生成答案验证与标准答案的语义一致性确保查询可从语料中解答捷径检测对推理型查询验证是否单个文本块即可解答避免“伪多跳”若是则过滤知识泄露检查通过闭卷测试不让LLM接触语料若LLM仅靠预训练知识就能答对则视为无效查询人工抽样验证对4个领域各抽取50条查询共200条人工审核与自动化判断的一致性达94%【量化】最终形成查询7727条含事实型30.0%、推理型52.9%、总结型17.1%2、再回顾几个RAG范式2026年了已经再回顾下吧∶LLM-only无检索仅依赖LLM内置知识适合无外部事实需求的任务NaiveRAG单轮向量检索基于余弦相似度Top-100chunks适合事实问答、总结隐含叙事文本GraphRAG知识图谱遍历提取20个种子实体PPR传播适合实体中心任务、多跳推理HybridRAG并行调用两种检索RRF融合结果适合需平衡语义覆盖与结构推理的场景IterativeRAG检索-生成-评估循环最多3轮迭代适合复杂查询、需逐步澄清的任务3、看评估总结GraphRAG擅长实体密集型任务如百科事实查询准确率90.2%NaiveRAG适配隐含叙事文本如文学事实查询准确率83.7%HybridRAG适合需平衡语义覆盖与结构推理的复杂场景3/4数据集平均表现最优IterativeRAG在医疗领域性价比突出效率上LLM-only成本最低~10³tokensHybridRAG成本最高Legal领域达293.1MtokensNaiveRAG与GraphRAG处于中等水平约10⁴tokens/查询因此可以做个选型总结理想情况下可以根据查询类型事实型→GraphRAG/NaiveRAG推理型→HybridRAG和语料特性结构密集→GraphRAG语义分散→NaiveRAG动态路由复杂范式未必更优需权衡效果与资源预算如资源受限场景优先NaiveRAG/GraphRAG高准确率需求场景选HybridRAG。二、AgenticRAG之A-RAG方案上面说了5个范式现在顺着讲AgenticRAG的故事搞了个框架ARAG通过暴露关键词搜索、语义搜索、文本块读取三种多粒度检索工具让大模型决策检索策略、迭代执行并交错使用工具在HotpotQA等多个多跳问答基准测试中对比了下传统RAG方法如GraphRAG、WorkflowRAG这些方案如下代表性的方案这里再回顾下GraphRAG从带有层级社群结构的文档中构建知识图谱支持基于本地实体和全局社群的双重检索为面向查询的摘要生成提供支撑HippoRAG2借助知识图谱与个性化页面排序算法模拟人类海马体的记忆索引机制实现单步多跳推理且推理效率得到提升LinearRAG以实体抽取替代关系抽取简化图谱构建流程生成层级化知识图谱并采用两阶段检索策略FaithfulRAG通过自事实挖掘、冲突识别与推理融合的方式解决检索到的内容与模型参数化知识之间存在的知识冲突问题MA-RAG多智能体RAG框架包含多个专用智能体规划器、步骤定义器、抽取器、问答器各智能体通过思维链推理协同工作。对应的prompt可以再回顾下工作在《A-RAG: Scaling Agentic Retrieval-Augmented Generation via Hierarchical Retrieval Interfaces》,https://arxiv.org/pdf/2602.03442https://github.com/Ayanami0730/arag核心看几个点1、分层索引构建文本块级按1000tokens划分对齐句子边界句子级规则分词后通过预训练编码器生成嵌入向量关键词级查询时直接精确文本匹配不预设定索引【这里有坑其数据量大的时候还是要es这些】2、分层检索工具keyword_search基于关键词精确匹配按关键词出现频率和长度计算得分返回包含关键词的句子片段semantic_search基于余弦相似度计算句子嵌入匹配度聚合父文本块后返回Top-k结果chunk_read读取完整文本块内容补充搜索片段的缺失信息也就是扩展3、智能体循环基础框架采用ReAct-like架构迭代执行推理→工具调用→观察流程上下文追踪上维护已读文本块集合Cread避免重复检索和token浪费终止条件上模型自主决定回答时机或达到最大迭代次数后强制合成答案。其中有个很有意思出错的百分比推理出错为多见AI时代未来的就业机会在哪里答案就藏在大模型的浪潮里。从ChatGPT、DeepSeek等日常工具到自然语言处理、计算机视觉、多模态等核心领域技术普惠化、应用垂直化与生态开源化正催生Prompt工程师、自然语言处理、计算机视觉工程师、大模型算法工程师、AI应用产品经理等AI岗位。掌握大模型技能就是把握高薪未来。那么普通人如何抓住大模型风口AI技术的普及对个人能力提出了新的要求在AI时代持续学习和适应新技术变得尤为重要。无论是企业还是个人都需要不断更新知识体系提升与AI协作的能力以适应不断变化的工作环境。因此这里给大家整理了一份《2026最新大模型全套学习资源》包括2026最新大模型学习路线、大模型书籍、视频教程、项目实战、最新行业报告、面试题、AI产品经理入门到精通等带你从零基础入门到精通快速掌握大模型技术由于篇幅有限有需要的小伙伴可以扫码获取1. 成长路线图学习规划要学习一门新的技术作为新手一定要先学习成长路线图方向不对努力白费。这里我们为新手和想要进一步提升的专业人士准备了一份详细的学习成长路线图和规划。2. 大模型经典PDF书籍书籍和学习文档资料是学习大模型过程中必不可少的我们精选了一系列深入探讨大模型技术的书籍和学习文档它们由领域内的顶尖专家撰写内容全面、深入、详尽为你学习大模型提供坚实的理论基础。书籍含电子版PDF3. 大模型视频教程对于很多自学或者没有基础的同学来说书籍这些纯文字类的学习教材会觉得比较晦涩难以理解因此我们提供了丰富的大模型视频教程以动态、形象的方式展示技术概念帮助你更快、更轻松地掌握核心知识。4. 大模型项目实战学以致用当你的理论知识积累到一定程度就需要通过项目实战在实际操作中检验和巩固你所学到的知识同时为你找工作和职业发展打下坚实的基础。5. 大模型行业报告行业分析主要包括对不同行业的现状、趋势、问题、机会等进行系统地调研和评估以了解哪些行业更适合引入大模型的技术和应用以及在哪些方面可以发挥大模型的优势。6. 大模型面试题面试不仅是技术的较量更需要充分的准备。在你已经掌握了大模型技术之后就需要开始准备面试我们将提供精心整理的大模型面试题库涵盖当前面试中可能遇到的各种技术问题让你在面试中游刃有余。为什么大家都在学AI大模型随着AI技术的发展企业对人才的需求从“单一技术”转向 “AI行业”双背景。企业对人才的需求从“单一技术”转向 “AI行业”双背景。金融AI、制造AI、医疗AI等跨界岗位薪资涨幅达30%-50%。同时很多人面临优化裁员近期科技巨头英特尔裁员2万人传统岗位不断缩减因此转行AI势在必行这些资料有用吗这份资料由我们和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理现任上海殷泊信息科技CEO其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证服务航天科工、国家电网等1000企业以第一作者在IEEE Transactions发表论文50篇获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。资料内容涵盖了从入门到进阶的各类视频教程和实战项目无论你是小白还是有些技术基础的技术人员这份资料都绝对能帮助你提升薪资待遇转行大模型岗位。大模型全套学习资料已整理打包有需要的小伙伴可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】
图灵奖得主领衔,30多国100多位专家重磅《2026 国际人工智能安全报告》 通用人工智能正一边在数学奥赛拿金牌,一边被安全专家当作潜在失控变量。图灵奖得主 Yoshua Bengio 领衔的重磅《2026 国际人工智能安全报告》发布。这份由来自 30 多个国家和国际组织的 100 多位专家参与撰写, 像是给 AI 这把双刃剑量尺寸、称分量、想办… 2026/5/17 3:41:04
逆天!Mata用13个参数26字节让模型正确率从76%飙升至91% 逆天!用13个参数,26字节,还没有一条短信长,就教大模型提升数学推理能力。一个80亿参数的庞大语言模型,就像一座储存了海量知识的宏伟图书馆。现在,你需要教会它一项新技能——解数学应用题。传统方法需要对… 2026/5/17 3:41:03
小程序毕设项目:基于springboot+小程序的在线文创产品订购平台小程序(源码+文档,讲解、调试运行,定制等) 博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am… 2026/5/17 3:41:01
低代码如何促进数字化转型? 数字化转型这个话题,这些年被讨论得太多了。但一个尴尬的现实是:很多企业喊着转型三年,落地的系统不超过五个,其中真正跑起来的可能只有两三个。IT部门永远在排期业务部门永远在催上线老板永远觉得钱花出去了,但没看到… 2026/7/3 10:47:27
DLSS Swapper终极指南:一键智能切换游戏DLSS版本,轻松提升帧率性能 DLSS Swapper终极指南:一键智能切换游戏DLSS版本,轻松提升帧率性能 【免费下载链接】dlss-swapper 项目地址: https://gitcode.com/GitHub_Trending/dl/dlss-swapper 还在为游戏卡顿而烦恼吗?想获得更流畅的游戏体验却不知从何入手&a… 2026/7/3 10:47:27
用Markdown模式转为html实现在线预览和简易在线文档编辑功能 此功能具备将markdown格式的文件转换为html展示在页面上,并将修改markdown源码实现在线编辑的功能,并将自动生成目录树,切具备在鼠标位置插入图片功能,和导出word文档功能(目前导出的word文档有些样式有点问题… 2026/7/3 10:43:26
IIM-42652 IMU与TM4C129XKCZAD的6DoF运动追踪实现 1. 项目背景与核心概念解析在嵌入式系统和物联网设备开发中,运动追踪是一个基础但至关重要的功能。IIM-42652是TDK InvenSense推出的一款6轴惯性测量单元(IMU),它集成了3轴加速度计和3轴陀螺仪,能够提供完整的6自由度(6DoF)运动数据。而TM4C1… 2026/7/3 10:41:25
输入法词库转换神器:imewlconverter 20+格式互转完整指南 输入法词库转换神器:imewlconverter 20格式互转完整指南 【免费下载链接】imewlconverter ”深蓝词库转换“ 一款开源免费的输入法词库转换程序 项目地址: https://gitcode.com/gh_mirrors/im/imewlconverter 你是否曾经因为更换输入法而不得不放弃多年积累的… 2026/7/3 10:41:25
企业数字化最危险的假象:看起来有数据,其实没有形成可执行决策 导语 很多企业对“数据驱动决策”存在一个常见的认知偏差:只要搭建了数据中台、买了BI工具、存储了海量业务数据,就算完成了数字化转型,自然能实现高效决策。这其实是企业数字化进程中最危险的假象——“有数据”≠“能决策”。 我们在产品… 2026/7/3 10:39:24
如何5分钟快速上手XUnity.AutoTranslator:打破语言障碍的游戏翻译神器终极指南 如何5分钟快速上手XUnity.AutoTranslator:打破语言障碍的游戏翻译神器终极指南 【免费下载链接】XUnity.AutoTranslator 项目地址: https://gitcode.com/gh_mirrors/xu/XUnity.AutoTranslator 你是否曾经因为语言障碍而错过精彩的游戏剧情?面对日… 2026/7/3 0:01:58
3种策略管理Playnite便携版:从基础部署到高级维护的完整指南 3种策略管理Playnite便携版:从基础部署到高级维护的完整指南 【免费下载链接】Playnite Video game library manager with support for wide range of 3rd party libraries and game emulation support, providing one unified interface for your games. 项目地址… 2026/7/3 0:05:59
2026江苏三维扫描仪定制厂家:一条很现实的分水岭——“会用”和“用对” 在江苏制造业的三维扫描项目里,有一个很容易被忽略的分界线: 👉 会用设备,不等于用对设备。 尤其在江苏GOM三维扫描仪定制厂家、江苏蔡司3D扫描仪定制厂家项目中,这条分界线会直接决定系统最终是“工具”,还… 2026/7/3 0:07:59