跳转到内容
OpenAI自研推理芯片Jalapeño:代工成本降30%,但真正的意图不是省钱
·AI技术趋势

OpenAI自研推理芯片Jalapeño:代工成本降30%,但真正的意图不是省钱

返回博客
金柘
#OpenAI#芯片#Jalapeño#垂直整合#NVIDIA#AI基础设施

如果你是依赖大模型API做产品的创业公司,这条消息利好——API价格还会降。但如果你在做AI基础设施,这条消息值得警惕:当OpenAI和Google都在自研芯片,你只能在它们搭的平台上做应用。

本文是一篇行业分析,基于公开信息和作者个人判断,不代表任何机构观点。

发生了什么

6月25日,TechCrunch和Solidot报道:OpenAI发布首款自研推理芯片Jalapeño,由博通代工制造。从2023年Sam Altman融资7万亿美元建芯片厂(后被证伪,但能说明野心),到2024年挖来前Google TPU团队工程师,到2025年和博通签代工协议——OpenAI的芯片战略筹备了至少两年。Jalapeño不走2nm/3nm先进制程,而是走博通成熟制程路线,绕开了先进制程的供应链排队。

OpenAI垂直整合路径
OpenAI垂直整合路径

核心创新

Jalapeño选择了一个精准的切入点:不做通用训练芯片,只做推理芯片。推理是重复性负载——每一次token生成都是同样的矩阵乘法运算。定制芯片可以砍掉H100里那些不需要的通用计算单元,专注矩阵乘法加速,大幅压低每token成本。

更大的战略意图是供应链安全。全球先进制程产能被苹果、NVIDIA、AMD三家包圆,OpenAI排不到优先级。走博通成熟制程路线,是把垂直整合的供应链可控性放在技术先进性前面的战略选择。

谁能获益、谁被冲击

  • 依赖大模型API做产品的创业公司:利好。大公司自研芯片会把API价格继续往下压。我在运营API中转站,模型价格每季度降15-30%,消费者端的成本只会更低
  • AI基础设施领域的创业公司:警惕。当大公司掌控了底层硬件,你只能在它搭的平台上做应用层
  • DeepSeek等独立模型公司:芯片自研不是选择是必须。用更少GPU训练更大模型靠的是极致优化,但优化的天花板很低(来源:DeepSeek技术报告中的算力效率曲线分析)

竞争格局变化

维度当前状态趋势判断依据
OpenAI推理成本依赖英伟达H100/B200自研芯片降30%代工成本TechCrunch 6月25日报道
大厂芯片布局Google(TPU)、Amazon(Trainium)、微软(Maia)、Meta(MTIA)、OpenAI(Jalapeño)五家均已自研各公司公开技术博客
API价格每季度降15-30%持续下行各平台定价页面追踪
中小厂商GPU成本按目录价买H100与大厂成本差5-10倍NVIDIA公开定价vs自研芯片代工成本推算
先进制程产能苹果+NVIDIA+AMD包圆OpenAI走博通成熟制程绕开台积电产能分配公开信息

(数据来源:TechCrunch报道、Solidot报道、各公司技术博客、公开定价信息)

方向判断

OpenAI不会是最后一个自研芯片的AI公司。大公司都在做芯片,但"自研芯片"对小公司来说不是机会——是越来越大的竞争劣势。大公司用自研芯片把推理成本压到极低,通过API低价倾销。中小公司还在按目录价买H100——成本差5-10倍。

对创业者的意义

我在运营API中转站的切身体感:模型价格持续下跌对我们短期是利好。但价格下降的底层驱动力如果来自芯片自研,那要提前问自己一个问题——当DeepSeek也自研芯片时,渠道价的价差空间还有吗?我的判断是:短期继续聚合更多模型,中期转向做"模型选择+工作流"增值服务,而不是"转手赚差价"。

延伸思考

三件事。第一,Jalapeño什么时候能实际影响API价格?芯片从首发到量产、从量产到大规模部署、从部署到影响对外API定价,每一步都是年为单位。第二,DeepSeek会不会也走自研芯片路线?他们的工程文化是用软件优化压榨硬件算力,但软件优化的天花板已经被多次逼近——V3和V4的算力效率提升幅度在递减。第三,如果推理成本趋近于零,上层应用的价值会不会反而被压缩——当每次API调用几乎免费,你卷的是模型质量还是产品体验?