2026-06-29·AI技术趋势

OpenAI自研推理芯片Jalapeño：代工成本降30%，但真正的意图不是省钱

返回博客

金

金柘

#OpenAI#芯片#Jalapeño#垂直整合#NVIDIA#AI基础设施

如果你是依赖大模型API做产品的创业公司，这条消息利好——API价格还会降。但如果你在做AI基础设施，这条消息值得警惕：当OpenAI和Google都在自研芯片，你只能在它们搭的平台上做应用。

本文是一篇行业分析，基于公开信息和作者个人判断，不代表任何机构观点。

发生了什么

6月25日，TechCrunch和Solidot报道：OpenAI发布首款自研推理芯片Jalapeño，由博通代工制造。从2023年Sam Altman融资7万亿美元建芯片厂（后被证伪，但能说明野心），到2024年挖来前Google TPU团队工程师，到2025年和博通签代工协议——OpenAI的芯片战略筹备了至少两年。Jalapeño不走2nm/3nm先进制程，而是走博通成熟制程路线，绕开了先进制程的供应链排队。

核心创新

Jalapeño选择了一个精准的切入点：不做通用训练芯片，只做推理芯片。推理是重复性负载——每一次token生成都是同样的矩阵乘法运算。定制芯片可以砍掉H100里那些不需要的通用计算单元，专注矩阵乘法加速，大幅压低每token成本。

更大的战略意图是供应链安全。全球先进制程产能被苹果、NVIDIA、AMD三家包圆，OpenAI排不到优先级。走博通成熟制程路线，是把垂直整合的供应链可控性放在技术先进性前面的战略选择。

谁能获益、谁被冲击

依赖大模型API做产品的创业公司：利好。大公司自研芯片会把API价格继续往下压。我在运营API中转站，模型价格每季度降15-30%，消费者端的成本只会更低
AI基础设施领域的创业公司：警惕。当大公司掌控了底层硬件，你只能在它搭的平台上做应用层
DeepSeek等独立模型公司：芯片自研不是选择是必须。用更少GPU训练更大模型靠的是极致优化，但优化的天花板很低（来源：DeepSeek技术报告中的算力效率曲线分析）

竞争格局变化

维度	当前状态	趋势	判断依据
OpenAI推理成本	依赖英伟达H100/B200	自研芯片降30%代工成本	TechCrunch 6月25日报道
大厂芯片布局	Google(TPU)、Amazon(Trainium)、微软(Maia)、Meta(MTIA)、OpenAI(Jalapeño)	五家均已自研	各公司公开技术博客
API价格	每季度降15-30%	持续下行	各平台定价页面追踪
中小厂商GPU成本	按目录价买H100	与大厂成本差5-10倍	NVIDIA公开定价vs自研芯片代工成本推算
先进制程产能	苹果+NVIDIA+AMD包圆	OpenAI走博通成熟制程绕开	台积电产能分配公开信息

（数据来源：TechCrunch报道、Solidot报道、各公司技术博客、公开定价信息）

方向判断

OpenAI不会是最后一个自研芯片的AI公司。大公司都在做芯片，但"自研芯片"对小公司来说不是机会——是越来越大的竞争劣势。大公司用自研芯片把推理成本压到极低，通过API低价倾销。中小公司还在按目录价买H100——成本差5-10倍。

对创业者的意义

我在运营API中转站的切身体感：模型价格持续下跌对我们短期是利好。但价格下降的底层驱动力如果来自芯片自研，那要提前问自己一个问题——当DeepSeek也自研芯片时，渠道价的价差空间还有吗？我的判断是：短期继续聚合更多模型，中期转向做"模型选择+工作流"增值服务，而不是"转手赚差价"。

延伸思考

三件事。第一，Jalapeño什么时候能实际影响API价格？芯片从首发到量产、从量产到大规模部署、从部署到影响对外API定价，每一步都是年为单位。第二，DeepSeek会不会也走自研芯片路线？他们的工程文化是用软件优化压榨硬件算力，但软件优化的天花板已经被多次逼近——V3和V4的算力效率提升幅度在递减。第三，如果推理成本趋近于零，上层应用的价值会不会反而被压缩——当每次API调用几乎免费，你卷的是模型质量还是产品体验？

查看所有文章 →