跳转到内容
创业思考--我每天搜3万个新建仓库而不是看Trending,今天淘到3个好项目
·创业思考

创业思考--我每天搜3万个新建仓库而不是看Trending,今天淘到3个好项目

返回博客
金柘
#GitHub#开源采集#方法论#创业#趋势发现

今天早上打开GitHub Trending,本周第一是OpenMontage——一个我关注了3个月的项目。它不是今天才火的,它只是传播又发酵了一轮。Trending是二手信息。

本文是一篇创业笔记。

核心判断

真正的信号不在Trending——Trending是老项目的二次传播——而在按创建日期搜到的新仓库里。先发优势来自搜新不搜热。

为什么

GitHub Trending本周前7名——OpenMontage、design.md、codebase-memory-mcp——都是3-6个月前创建的老项目。 它们不是因为新才上榜,是传播又发酵了一轮。

真正的信号在Trending之外。在新创建、还没被人发现的仓库里。

所以我每天用Hermes Agent自动搜新仓库:created:2026-06-28..2026-07-01 stars:>30。今天收获7个候选,去重后入库3个。

今天的采集

项目星数创建时间为什么值得关注
webtoon-harness2096/2827个Agent协作,工业化创作
codex-keysmith3256/28一键部署Codex配置
self-learning-skills1306/29Agent自我学习新方向

这三个项目都没有上Trending。但它们在GitHub API里——只要你搜。

采集三个原则

搜新不搜热。 Trending是别人都看到了的信号。新仓库是你独有的信号。

看实质不看星。 webtoon-harness今天只有209星,3个月后可能2万星。判断标准:README写没写清楚、有没有许可证、代码库是不是空壳。

查重必须做。 今天的7个候选全量扫描了opensource-tools-list.md(534个工具),确认都不在已有库中。重复采集是浪费时间。

反向思考

按创建日期搜,90%以上是噪音——大多数新项目几周就死了。Trending的"二次传播"项目至少经过了社区验证,对商业化来说比纯新更有参考价值。新鲜不等于有价值。

这也是为什么我需要三层过滤:第一层星数>30筛掉大部分,第二层查重去重,第三层人工判断质量。最终入库率大概3%。

延伸思考

信号时效到底在缩短到什么程度。 2025年初一个好项目从创建到在中文AI圈传开平均7-14天。到2026年6月大约是2-4天。这个趋势继续的话,到年底会不会缩到24小时以内?如果到了那个点,"今天搜昨天新建的仓库"这个策略还成立吗——还是说我得改成实时监控?

人工筛选的瓶颈。 我的系统每天最终入库3-5个,这个量我还能人工看。但如果是30个、50个——我就看不过来了。下一步的自动化——让AI自动判断一个项目的商业化价值——能不能做到?还是说这种判断天然需要人?


本文数据来源于作者个人GitHub采集系统的实际运营记录,数据截至2026年7月1日。