
AI技术趋势--125K星的Agent项目才是一周前的事,现在又多了22K星和一套标准格式
一周前我写agency-agents的时候它123K星。今天125K——增长了2000星,不算多。但有意思的不是星数,是周边生态一周内发生了什么。
本文是一篇行业分析,基于公开信息和作者个人判断。
发生了什么
三个项目同时在7月3日登上GitHub Trending:
agentskills/agentskills(21.6K星)发布了Agent Skills的标准化格式规范。这不是又一个开源工具——这是Agent生态里第一次有人定义"一个Skill文件应该长什么样"。如果这个标准被广泛采用,Agent的可移植性问题就解决了一半。
affaan-m/ECC(225K星)是一个Agent性能优化系统,把Agent能力拆成四个维度:Skills(技能)、Instinct(本能)、Memory(记忆)、Safety(安全)。它不是让一个Agent变强——是在教人怎么系统地衡量和优化Agent。
browser-use/video-use(13.8K星)让AI Agent直接操作视频编辑工具。这是Agent从"文本→代码→图像"走向"视频操作"的标志。
三个项目放在一起看:标准化 + 性能优化 + 新领域扩展 = Agent从玩具走向生产力的三个支柱。
核心创新
之前的Agent生态有两条演化主线:状态管理(Harness→MCP→Skill)和工具调用(API→MCP Server→Multi-Agent Collaboration)。现在第三条线出现了:标准化和度量衡。
agentskills的格式规范定义了"一个Skill文件必须包含什么"——描述、触发条件、输入输出schema、依赖声明。这东西的价值不在技术实现,在生态效应。如果Claude Code和Codex CLI和Gemini CLI都认这个格式,一个Skill写一次就能在三个平台跑。
ECC的四维模型更有意思。它把"好Agent"的定义从"模型能力强"拆成了可量化的四个维度。Instinct(本能)指的是Agent在不确定情况下的默认行为模式——这是当前所有Agent评测都漏掉的一环。
能用在哪些场景
-
企业内部Agent仓库。 如果agentskills格式被采纳,企业可以建自己的内部Skill市场——员工各自维护自己的Skill,格式统一、可审计。
-
Agent评测框架。 ECC的四维模型可以直接作为Agent选型标准。不是"哪个Agent最强",是"哪个Agent在Safety维度得分最高"——这对于企业场景有直接价值。
-
视频生产自动化。 video-use让Agent直接操作DaVinci Resolve/Premiere。结合已有的AI自媒体流水线,从选题→脚本→素材→剪辑→发布的完整Agent链闭环了一半。
带来了什么变化
| 指标 | 一周前 | 现在 | 变化 |
|---|---|---|---|
| Agent标准化 | 无统一Skill格式 | agentskills 21.6K星 | 首次定义 |
| Agent评测 | 靠"感觉"和benchmark | ECC四维拆解 | 系统化 |
| Agent能力域 | 文本+代码+图像 | +视频操作 | 新领域 |
对创业者的意义
如果你在做多Agent产品——不管是内部工具还是对外服务——现在必须关注两件事:一是agentskills的格式会不会成为行业标准,如果会,你的Skill就要按它定义;二是ECC的评测框架可以帮你向客户解释"为什么选这个Agent而不是那个"。
延伸思考
当Agent Skill格式被标准化后,Agent之间的协作边界会不会被重新定义?现在的多Agent协作是"一个调度器+N个执行Agent"。如果每个Skill都有标准化的输入输出接口,Agent是否可以自己发现和调用其他Agent的Skill——像微服务那样?这是分布式Agent系统的第一步,但第一步往往最难。
本文数据来源于GitHub公开仓库及Hermes Agent每日简报,数据截至2026年7月3日。