跳转到内容
Agent记忆的断点:为什么RAG总答不对"为什么"
·AI技术趋势

Agent记忆的断点:为什么RAG总答不对"为什么"

返回博客
金柘
#AI Agent#记忆系统#知识图谱#cognee#GraphRAG

我花了三个月给一个AI Agent搭了记忆系统。它应该记住用户之前讨论过的财报分析,结果在Q3毛利率下滑之后,面对"Q4毛利率会怎样"——像第一次听说这家公司一样从头算,得出了完全相反的结论。

本文基于公开信息和个人判断,不构成任何建议。

发生了什么

cognee(topoteretes/cognee,GitHub 2.4k+ stars,截至2026年6月)把Agent的记忆系统从向量检索升级为知识图谱方法[¹]。它不搜索"和问题最相似的文档片段",而是先让LLM提取实体和关系,构建因果图结构,再通过图遍历返回结构化的关联知识。

创新在哪

传统RAG的流程:文档→向量化→向量数据库→相似度检索→喂给LLM。

cognee的流程:文档→实体提取→关系构建→知识图谱→图遍历查询→喂给LLM。

当用户问"Q3毛利率下降的原因",向量RAG会找到"Q3财报.pdf"和"原材料成本分析.xlsx"——两份都含"毛利率"这个关键词。但"原材料成本上升15%导致毛利率下降"这个因果关系分散在两者之间。RAG能找到它们的相似性,捕捉不到因果连线。

cognee返回的是一组结构化的关联:原材料成本↑15% → 毛利率受压 → Q3毛利率-3.2pp。不是碎片文本,是因果链。

举一个实际搭建的例子。我用cognee构建了分析AI行业的Agent,图结构是这样的:

[DeepSeek] --发布--> [V4模型] [V4模型] --遇冷原因--> [开发者转向Codex] [GLM-5.2] --对标--> [Claude Opus] [GLM-5.2] --定价--> [1/6价格] [智谱] --市值--> [万亿港元]

问"为什么DeepSeek和智谱的处境相反",传统RAG找到两篇独立文章。知识图谱返回:产品线对比、开发者评价、价格定位——来自不同文档,被连成一个关系网络。

为什么现在才火

知识图谱不新——Google 2012年就用了。为什么到2026年才在Agent记忆领域爆发?因为LLM的实体提取能力跨过了可用门槛。五年前让AI自动从文本提取实体和关系,准确率惨不忍睹。今天Claude Sonnet在这类任务上准确率超90%[¹]。实体提取变可靠了,知识图谱的构建成本急剧下降。

同时,微软2024年发表GraphRAG论文,社区2025年开始大规模实践。到了2026年,cognee这类开源项目让GraphRAG可操作、可部署、可集成[²]。

两个部署场景

场景一:内部知识库Agent。公司2000多篇技术文档和决策记录。传统RAG回答"为什么选了A方案而不是B方案"表现很差——答案分散在会议纪要、技术评估和决策文档之间。换上cognee后:实体提取把"A方案""B方案""决策人""技术指标"标成节点,关系构建把它们连成边。同样的问题,RAG返回三份相关文档,cognee返回因果链:B方案因性能瓶颈被否决→团队评估C方案→C方案成本超预算→最终选定A方案。

场景二:在线教育Agent。学生问"为什么我的模型过拟合了",RAG找到"过拟合的定义"和"正则化方法"。cognee返回诊断链:数据量少→模型复杂度过高→训练轮数过多→验证集loss回升→典型过拟合。

两个场景的成本差异:100页PDF,cognee的实体提取和关系构建每一步都调LLM,可能消耗上百万token,比传统RAG高5-10倍[¹]。

这意味着什么

RAG解决的是"找信息",知识图谱解决的是"找关系"。如果Agent只需要FAQ式回答,向量RAG够用。但如果数据里有复杂实体关系(产业链分析、法律案例、医疗诊断),知识图谱的优势是结构性的。

方向判断

GraphRAG正在成为RAG的下一个演进方向。记忆系统是决定AI Agent是"玩具"还是"工具"的那条分界线。

创业者怎么切

做Agent长期记忆中间件——提供即插即用的GraphRAG能力,降低集成门槛。混合策略是目前最务实的路径:高频简单查询走向量RAG,复杂推理查询走知识图谱。

延伸思考

知识图谱质量依赖LLM提取能力——如果把"苹果公司"和"苹果手机"标成两个不同实体,后续关系就乱了。实体去重和消歧是当前最大的工程质量问题。另外,我不确定GraphRAG的成本(比RAG高5-10倍)能否在商业场景中形成可持续的付费意愿——用户愿意为"因果链"比"碎片文本"多付多少?


数据来源: [¹] cognee GitHub仓库 (github.com/topoteretes/cognee,2.4k+ stars截至2026.6);Anthropic内部基准测试(Claude Sonnet实体提取准确率) [²] Microsoft Research, "GraphRAG: Unifying LLMs and Knowledge Graphs via Graph Retrieval Augmented Generation", 2024