
AI金融Agent双登GitHub热榜——2个项目同天上榜,我从API数据里看到了什么
6月29号晚上11点,我刷GitHub Trending差点从椅子上跳起来。
同一天,同一个细分领域,两个金融AI项目同时登顶:ai-berkshire(四大投资大师方法论+多Agent对抗分析)和Vibe-Trading(港大数据科学实验室的AI交易助手)。
这不是巧合。
事件
据GitHub Trending当日数据,ai-berkshire和Vibe-Trading同时上榜Top 10。ai-berkshire用一个多Agent架构实现巴菲特、芒格、段永平、李录四种投资哲学并行分析。Vibe-Trading由香港大学数据科学实验室开发,做AI辅助交易决策。
关键数据
- ai-berkshire:4个Agent并行对抗分析,成本是单Agent的3-5倍
- Vibe-Trading:港大数据实验室出品
- API调用量:我平台上Agent类客户日活200,调用量10万次/天;传统聊天应用日活5000,调用量8万次/天——Agent调用量是传统应用的10-50倍
- 用户粘性:Agent客户月留存率82%,传统应用45%
- 数据时间:2026年6月29日(GitHub Trending)
为什么值得关注
过去一年AI Agent主要在干一件事:写代码。Claude Code重构,Codex补全,Cursor改bug。
但ai-berkshire和Vibe-Trading做的事完全不同:帮用户"做决策"。
写代码和做决策的区别我亲身体会过。上个月让Claude写Python脚本爬年报,15分钟搞定,编译通过、测试通过。然后问"茅台现在能买吗?"——它给了一段"投资有风险"的套话。
为什么?写代码有标准答案——编译过就是过。投资决策没有。你只能在信息不完整的情况下做判断,三个月后才知道对错。
所以AI金融Agent的核心不是模型能力,是"思考框架"。
ai-berkshire的设计就体现了这点。Agent A用巴菲特的"护城河"逻辑分析——查茅台过去5年年报,毛利率连续在90%以上,ROE约25%,判断护城河很深。Agent B用芒格的"心智模型"——茅台的本质是社交货币,不是酒精饮料,估值应参考奢侈品而非消费品。Agent C(段永平)质疑:管理层增持了吗?如果管理层自己都不买,凭什么让我买?多个Agent互相辩论,最终输出一张对比表格:四大师的结论、分歧点、共识点。
从技术角度看,这是Agent架构从"单Agent串行推理"到"多Agent并行对抗"的升级。
我的快评
三个趋势在同时发生:
第一,Agent从"写代码"扩展到"做决策"不可逆。投资分析、法律研究、医疗诊断——任何需要综合信息后做判断的领域都会被渗透。一位做AI律师的朋友已经开始用多Agent架构分析合同条款:一个审甲方、一个审乙方、然后对抗辩论找漏洞。这套逻辑跟ai-berkshire一模一样。
第二,多Agent对抗会成为主流。单Agent串行推理就像一个人拍脑袋——你问茅台好不好,它直接给答案,没有辩论、没有质疑。多Agent对抗像团队头脑风暴——有人唱多、有人唱空。成本更高,但用户愿意为可靠性买单。
第三,"思考框架"比"模型能力"更重要。ai-berkshire的核心壁垒不是用了哪个模型——底层是GPT-4,我也能调。核心是把巴芒段李四大投资大师的思维模型编码成了Agent指令。框架可迁移、可标准化,模型只是底层引擎。
这跟我做API中转站的体感完全一致。Agent类客户是我增长最快的类型——因为一个Agent请求背后可能是50次API调用(搜索→提取数据→计算→对比→生成结论)。模型会越来越便宜,但好用的Agent永远稀缺。
延伸思考
多Agent对抗的共识机制怎么定? 四个Agent给出不同结论时,怎么判断哪个对?如果是按置信度投票——那每个Agent的置信度是怎么算的?是模型自己输出的logit,还是外部评估?ai-berkshire的README提了一句"多方博弈后给出结论",但没有解释博弈机制。如果简单平均四个Agent的分数,那跟一个Agent做四次推理有什么区别?
AI金融Agent会不会放大"回音室效应"? 如果四个Agent都基于同一套训练数据(比如都读过巴芒写的书),它们的"辩论"其实是四个接受了同样前提的人在讨论——不存在真正的异见。那这个对抗的意义在哪?
后果
Agent从"写代码"扩展到"做决策",API调用量按10-50倍增长——Agent类客户将成为API平台增长最快的收入来源。用户粘性从传统应用的45%跳到82%,决策类Agent的迁移成本远高于工具类,先发者护城河更强。壁垒从"用哪个模型"转移到"编码了什么思考框架"——模型降价反而加速了Agent层的竞争。
本文数据来源于互联网公开信息(GitHub Trending, 自营MaaS平台数据),仅供行业趋势参考。