
AI技术趋势--9个月从图纸到流片,OpenAI自研芯片Jalapeño暴露了什么
一家软件公司从零造芯片,9个月从图纸到流片。博通全程陪跑,三星代工。这不是"AI公司转型做硬件"的故事——这是一条每个大模型公司都在暗中布局的路径。
本文是一篇行业分析,基于公开信息和作者个人判断。
发生了什么
2026年6月24日,第一财经和36氪先后报道OpenAI首款自研推理芯片Jalapeño完成流片。从立项到交给三星代工,只用了9个月。博通提供了完整的芯片设计合作。与此同时,OpenAI同步披露了多代计算平台计划——Jalapeño只是第一代。
这颗芯片聚焦推理任务而非训练。推理是AI应用落地后的核心负载——用户每次问ChatGPT一个问题,背后跑的是一次推理。训练是一次性的,推理是持续性的。控制推理成本,等于控制AI服务的生命线。
核心创新
Jalapeño的核心不是硬件性能——是垂直整合的意愿。
之前的AI产业链分工很清晰:OpenAI负责模型和产品,英伟达负责芯片,云厂商负责基建。Jalapeño打破了这个分工。OpenAI现在控制着模型→芯片→应用的完整链条。
从技术路径看,OpenAI选了一条比DeepSeek更激进的路线。DeepSeek走的是"用成熟芯片做极致优化"——MoE架构只激活部分参数,KV-Cache压缩75%,三层推理引擎协同。OpenAI走的是"自己设计芯片"——从IP核开始定制。
两条路都在降推理成本,但方向相反:一条是软件定义硬件,一条是硬件定义软件。两条路谁更优,取决于谁跑得更快。
能用在哪些场景
-
AI服务商的成本控制。 推理成本每季度降15-30%的背景下,谁能先拿到更底层的能力就是把定价权握在手里。
-
API中转平台的生存策略。 我们对灿海星图的定位就是聚合多家模型——OpenAI去英伟达化以后,模型API的定价结构会重新洗牌。对中转站来说,这意味着一轮新的议价窗口。
-
中小企业AI选型。 如果推理成本降到现在的三分之一,今天用不起AI的场景(客服全量AI化、生产线实时质检)会突然变得可行。
带来了什么变化
| 指标 | 之前 | 之后 | 影响 |
|---|---|---|---|
| OpenAI芯片依赖 | 100%外部(英伟达) | 推理自研+训练外购 | 议价权从英伟达转移到OpenAI |
| 芯片设计周期 | 业界平均18-24个月 | 9个月内 | 博通的IP复用体系被验证 |
| 推理成本预期 | 每季度降15-30% | 可能加速到降25-40% | 加速AI应用落地 |
| 产业分工 | 设计/制造/应用三层分离 | 应用层向上整合设计 | 重划产业边界 |
这是未来的方向吗?
是的。但"是"不是因为OpenAI——是因为英伟达的垄断溢价已经到了一个临界点。当一个B2B公司(英伟达)的利润率超过它的客户(所有AI公司),客户一定会想办法绕开。
DeepSeek绕开英伟达的方式是"用更聪明的算法榨干现有芯片",OpenAI绕开的方式是"自己设计芯片"。两条路不是一个方向的两个版本——它们是两个时代的选择。先用软件优化活下来,再用硬件定制活得好。
但我不确定的是:OpenAI有多代计算平台计划——这意味着Jalapeño只是第一步。如果OpenAI三年内造出一整套从训练到推理的芯片家族,它对产业链的控制力会超过任何一家英伟达的客户。
对创业者的意义
如果你是AI应用层的创业者,这件事最直接的意义是:推理成本会继续降。提前规划今天"太贵"的AI场景——客服、质检、内容审核、教育辅导——这些场景的拐点可能在12-18个月内到来。
第二层意义:API价格战会加剧。模型能力趋同的前提下,成本结构决定定价空间。自研芯片的玩家(OpenAI、Google)比纯模型公司多了"芯片利润"和"芯片成本"两个调节空间。
延伸思考
OpenAI用博通现成的IP,9个月流片。如果下一代需要从IP核层重构——时间还能是9个月吗?这枚芯片最终是一张通向「软硬一体」的船票,还是一次昂贵的品牌公告——这个答案,可能比芯片本身更重要。
另外,三星代工能否稳定量产是一个完全独立的问题。三星的先进制程良率在过去两年不如台积电。如果良率波动,Jalapeño的成本优势可能直接被吃掉。
本文数据来源于第一财经、36氪、Techmeme公开报道及公开GitHub仓库,数据截至2026年7月2日。