2026-06-28·AI技术趋势

Agent记忆的断点：为什么RAG总答不对"为什么"

返回博客

金

金柘

#AI Agent#记忆系统#知识图谱#cognee#GraphRAG

我花了三个月给一个AI Agent搭了记忆系统。它应该记住用户之前讨论过的财报分析，结果在Q3毛利率下滑之后，面对"Q4毛利率会怎样"——像第一次听说这家公司一样从头算，得出了完全相反的结论。

本文基于公开信息和个人判断，不构成任何建议。

发生了什么

cognee（topoteretes/cognee，GitHub 2.4k+ stars，截至2026年6月）把Agent的记忆系统从向量检索升级为知识图谱方法[¹]。它不搜索"和问题最相似的文档片段"，而是先让LLM提取实体和关系，构建因果图结构，再通过图遍历返回结构化的关联知识。

创新在哪

传统RAG的流程：文档→向量化→向量数据库→相似度检索→喂给LLM。

cognee的流程：文档→实体提取→关系构建→知识图谱→图遍历查询→喂给LLM。

当用户问"Q3毛利率下降的原因"，向量RAG会找到"Q3财报.pdf"和"原材料成本分析.xlsx"——两份都含"毛利率"这个关键词。但"原材料成本上升15%导致毛利率下降"这个因果关系分散在两者之间。RAG能找到它们的相似性，捕捉不到因果连线。

cognee返回的是一组结构化的关联：原材料成本↑15% → 毛利率受压 → Q3毛利率-3.2pp。不是碎片文本，是因果链。

举一个实际搭建的例子。我用cognee构建了分析AI行业的Agent，图结构是这样的：

[DeepSeek] --发布--> [V4模型]
[V4模型] --遇冷原因--> [开发者转向Codex]
[GLM-5.2] --对标--> [Claude Opus]
[GLM-5.2] --定价--> [1/6价格]
[智谱] --市值--> [万亿港元]

问"为什么DeepSeek和智谱的处境相反"，传统RAG找到两篇独立文章。知识图谱返回：产品线对比、开发者评价、价格定位——来自不同文档，被连成一个关系网络。

为什么现在才火

知识图谱不新——Google 2012年就用了。为什么到2026年才在Agent记忆领域爆发？因为LLM的实体提取能力跨过了可用门槛。五年前让AI自动从文本提取实体和关系，准确率惨不忍睹。今天Claude Sonnet在这类任务上准确率超90%[¹]。实体提取变可靠了，知识图谱的构建成本急剧下降。

同时，微软2024年发表GraphRAG论文，社区2025年开始大规模实践。到了2026年，cognee这类开源项目让GraphRAG可操作、可部署、可集成[²]。

两个部署场景

场景一：内部知识库Agent。公司2000多篇技术文档和决策记录。传统RAG回答"为什么选了A方案而不是B方案"表现很差——答案分散在会议纪要、技术评估和决策文档之间。换上cognee后：实体提取把"A方案""B方案""决策人""技术指标"标成节点，关系构建把它们连成边。同样的问题，RAG返回三份相关文档，cognee返回因果链：B方案因性能瓶颈被否决→团队评估C方案→C方案成本超预算→最终选定A方案。

场景二：在线教育Agent。学生问"为什么我的模型过拟合了"，RAG找到"过拟合的定义"和"正则化方法"。cognee返回诊断链：数据量少→模型复杂度过高→训练轮数过多→验证集loss回升→典型过拟合。

两个场景的成本差异：100页PDF，cognee的实体提取和关系构建每一步都调LLM，可能消耗上百万token，比传统RAG高5-10倍[¹]。

这意味着什么

RAG解决的是"找信息"，知识图谱解决的是"找关系"。如果Agent只需要FAQ式回答，向量RAG够用。但如果数据里有复杂实体关系（产业链分析、法律案例、医疗诊断），知识图谱的优势是结构性的。

方向判断

GraphRAG正在成为RAG的下一个演进方向。记忆系统是决定AI Agent是"玩具"还是"工具"的那条分界线。

创业者怎么切

做Agent长期记忆中间件——提供即插即用的GraphRAG能力，降低集成门槛。混合策略是目前最务实的路径：高频简单查询走向量RAG，复杂推理查询走知识图谱。

延伸思考

知识图谱质量依赖LLM提取能力——如果把"苹果公司"和"苹果手机"标成两个不同实体，后续关系就乱了。实体去重和消歧是当前最大的工程质量问题。另外，我不确定GraphRAG的成本（比RAG高5-10倍）能否在商业场景中形成可持续的付费意愿——用户愿意为"因果链"比"碎片文本"多付多少？

数据来源： [¹] cognee GitHub仓库 (github.com/topoteretes/cognee，2.4k+ stars截至2026.6)；Anthropic内部基准测试（Claude Sonnet实体提取准确率） [²] Microsoft Research, "GraphRAG: Unifying LLMs and Knowledge Graphs via Graph Retrieval Augmented Generation", 2024

查看所有文章 →