跳转到内容
AI技术趋势--Agent开始从自己犯的错里学了,130星项目指向下一个方向
·AI技术趋势

AI技术趋势--Agent开始从自己犯的错里学了,130星项目指向下一个方向

返回博客
金柘
#Agent#自学习#技能#AI进化#趋势

我让Claude Code帮我在一个项目里修了一个Bug——某种依赖版本冲突导致的构建失败。它花了15分钟找到原因、改了配置、验证通过。然后我关掉了终端。第二天同一个项目的另一个模块又出了一样的Bug——Claude Code完全不记得昨天修过。又花了15分钟。

本文是一篇行业分析,基于公开信息和作者个人判断。

发生了什么

2026年6月29日,一个叫self-learning-skills的项目在GitHub上线,130星。它做的事:AI Agent每完成一个任务,自动记录调试经验。下次遇到类似问题,直接用经验——不用重新踩坑。

同一天,Hermes Agent(206K星)也在做同一件事:从对话中提炼技能,跨会话复用。

两个独立事件指向同一个信号:Agent从"执行者"变成"学习者"。

具体怎么做

当前所有AI Agent都是"金鱼记忆"——关掉对话窗口,一切归零。下次打开,Agent不认识你、不认识项目、不认识上次犯的错。

self-learning-skills的做法:Agent每次完成任务后自动提取:

  • 任务描述+解决方案
  • 踩过的坑+怎么修的
  • 方案在什么条件下有效

存成结构化技能文件。下次遇到同类任务,先检索技能库,有就用,没有再从头来。

这和RAG不同。 RAG检索文档,self-learning检索"经验"。文档不会告诉你"这个地方容易出Bug因为XX库的v2.3有个隐藏bug"——但经验会。

能在哪些场景用

编程调试。 Agent修了一个Bug,自动记录原因和修复方式。下次同类Bug一秒出方案。

自动化运维。 服务器出故障,Agent自动记录故障模式→排查路径→修复方案。运维知识不再只在人脑里。

内容创作。 Agent帮你写了一篇效果好的文章,自动提取标题角度、结构模式、受众反应。

趋势判断

Agent的竞争从"谁更聪明"转向"谁记得住"。模型能力趋同(DeepSeek-V4-Pro和GLM-5.2差距不大),但谁能利用历史经验,谁就有数倍的效率差。

未来6个月,Agent技能库会变成标配——就像现在每个Agent都支持MCP工具。

对创业者的意义

如果你在用AI Agent写代码,现在就可以做一件事:每次Agent修完Bug,让它总结原因和修复方式,存成一个.md文件。不需要等self-learning-skills成熟——你现在就能手工做这件事。

延伸思考

技能的泛化能力。 经验是一个具体场景下的一次解决方案。下次"类似"的问题——有多类似才能命中技能库?如果依赖版本号变了、操作系统换了、代码仓库结构改了,上次的经验还适用吗?self-learning-skills目前只是一个130星的原型,它的"技能匹配"是什么算法、命中率多少——这些都不知道。

技能质量的衰减。 Agent自己的经验是Agent自己总结的。如果Agent在总结时犯了错误——把偶然成功的方案当成通用方案记录了——那这个"技能"不仅没用,还会误导下次的判断。谁来审查Agent自己总结的经验?还是说我们默认Agent总结的都是对的?


本文数据来源于GitHub仓库(self-learning-skills)及Hermes Agent官方文档。