1. 首页
  2. 人工智能
  3. 机器学习
  4. 全球机器学习技术大会钱泓锦RAG 2.0:记忆驱动的下一代检索增强系统

全球机器学习技术大会钱泓锦RAG 2.0:记忆驱动的下一代检索增强系统

上传者: 2025-08-15 01:16:38上传 PDF文件 17.09MB 热度 38次

记忆驱动的 RAG 2.0 挺有意思,尤其对做搜索或智能问答的你来说,值得关注。它不是单纯去知识库抓点数据,而是像有个“长记性”的 AI 助手,能记住更多历史信息,检索起来更精准,还能搞定长尾知识。

演讲里钱泓锦把 RAG 的升级路线讲得直白:1.0 主要靠向量检索,2.0 直接加了记忆功能,让外部知识量能撑到 128MB,环境上下文也有 128KB,这对前端调用 API 拉知识来说,缓存和延迟都会好不少。

场景上,比如你做个代码助手,它不仅能告诉你fetch怎么用,还能记得你之前是用在 React 项目里,下次回答更贴合。就像给 AI 加了“项目背景”,响应速度和相关性都更高。

要注意的是,RAG 2.0 也有挑战,比如上下文限制、内存溢出这些老问题没法完全躲开。用的时候,最好提前规划好数据分片和调用策略,不然 OOM 提示分分钟出现哦。

如果你常做需要整合多来源信息的功能,比如知识库搜索、智能客服,试试在后端接个 RAG 2.0,前端响应也会更聪明。

下载地址
用户评论