
OpenAI自研推理芯片Jalapeño:代工成本降30%,但真正的意图不是省钱
如果你是依赖大模型API做产品的创业公司,这条消息利好——API价格还会降。但如果你在做AI基础设施,这条消息值得警惕:当OpenAI和Google都在自研芯片,你只能在它们搭的平台上做应用。
本文是一篇行业分析,基于公开信息和作者个人判断,不代表任何机构观点。
发生了什么
6月25日,TechCrunch和Solidot报道:OpenAI发布首款自研推理芯片Jalapeño,由博通代工制造。从2023年Sam Altman融资7万亿美元建芯片厂(后被证伪,但能说明野心),到2024年挖来前Google TPU团队工程师,到2025年和博通签代工协议——OpenAI的芯片战略筹备了至少两年。Jalapeño不走2nm/3nm先进制程,而是走博通成熟制程路线,绕开了先进制程的供应链排队。

核心创新
Jalapeño选择了一个精准的切入点:不做通用训练芯片,只做推理芯片。推理是重复性负载——每一次token生成都是同样的矩阵乘法运算。定制芯片可以砍掉H100里那些不需要的通用计算单元,专注矩阵乘法加速,大幅压低每token成本。
更大的战略意图是供应链安全。全球先进制程产能被苹果、NVIDIA、AMD三家包圆,OpenAI排不到优先级。走博通成熟制程路线,是把垂直整合的供应链可控性放在技术先进性前面的战略选择。
谁能获益、谁被冲击
- 依赖大模型API做产品的创业公司:利好。大公司自研芯片会把API价格继续往下压。我在运营API中转站,模型价格每季度降15-30%,消费者端的成本只会更低
- AI基础设施领域的创业公司:警惕。当大公司掌控了底层硬件,你只能在它搭的平台上做应用层
- DeepSeek等独立模型公司:芯片自研不是选择是必须。用更少GPU训练更大模型靠的是极致优化,但优化的天花板很低(来源:DeepSeek技术报告中的算力效率曲线分析)
竞争格局变化
| 维度 | 当前状态 | 趋势 | 判断依据 |
|---|---|---|---|
| OpenAI推理成本 | 依赖英伟达H100/B200 | 自研芯片降30%代工成本 | TechCrunch 6月25日报道 |
| 大厂芯片布局 | Google(TPU)、Amazon(Trainium)、微软(Maia)、Meta(MTIA)、OpenAI(Jalapeño) | 五家均已自研 | 各公司公开技术博客 |
| API价格 | 每季度降15-30% | 持续下行 | 各平台定价页面追踪 |
| 中小厂商GPU成本 | 按目录价买H100 | 与大厂成本差5-10倍 | NVIDIA公开定价vs自研芯片代工成本推算 |
| 先进制程产能 | 苹果+NVIDIA+AMD包圆 | OpenAI走博通成熟制程绕开 | 台积电产能分配公开信息 |
(数据来源:TechCrunch报道、Solidot报道、各公司技术博客、公开定价信息)
方向判断
OpenAI不会是最后一个自研芯片的AI公司。大公司都在做芯片,但"自研芯片"对小公司来说不是机会——是越来越大的竞争劣势。大公司用自研芯片把推理成本压到极低,通过API低价倾销。中小公司还在按目录价买H100——成本差5-10倍。
对创业者的意义
我在运营API中转站的切身体感:模型价格持续下跌对我们短期是利好。但价格下降的底层驱动力如果来自芯片自研,那要提前问自己一个问题——当DeepSeek也自研芯片时,渠道价的价差空间还有吗?我的判断是:短期继续聚合更多模型,中期转向做"模型选择+工作流"增值服务,而不是"转手赚差价"。
延伸思考
三件事。第一,Jalapeño什么时候能实际影响API价格?芯片从首发到量产、从量产到大规模部署、从部署到影响对外API定价,每一步都是年为单位。第二,DeepSeek会不会也走自研芯片路线?他们的工程文化是用软件优化压榨硬件算力,但软件优化的天花板已经被多次逼近——V3和V4的算力效率提升幅度在递减。第三,如果推理成本趋近于零,上层应用的价值会不会反而被压缩——当每次API调用几乎免费,你卷的是模型质量还是产品体验?