2026.06.25 ChatGPT

OpenAI Jalapeño（ハラペーニョ）とは｜初の自社AI推論チップと脱Nvidia戦略

OpenAIは2026年6月24日、半導体大手Broadcom（NASDAQ: AVGO）と共同開発した初の自社設計AIチップ「Jalapeño（ハラペーニョ）」を発表しました。GPUではなく大規模言語モデル（LLM）の推論に特化したASICで、OpenAIはこれを「インテリジェンス・プロセッサ」と呼びます。本記事では、発表の事実関係、GPUではなくASICを選んだ技術的な理由、Google・Amazon・Microsoftの自社チップと並べたときの位置づけ、そして日本企業が推論コストとベンダー戦略の観点で何を読み取るべきかを、公式発表と各社報道の一次情報に基づいて整理します。確認できる事実だけを根拠にし、推測ははっきり切り分けました。

1 まとめ：Jalapeñoが示すOpenAIのフルスタック戦略と脱Nvidiaの要点
2 OpenAI Jalapeño（ハラペーニョ）の概要と2026年6月発表の事実関係
3 GPUではなくASICを選んだ理由とJalapeñoの設計思想
4 約9か月でのテープアウトと電力性能｜性能主張の正しい読み解き方
5 Google・Amazon・Microsoftの自社チップと比べたJalapeñoの位置づけ
- 5.1 TPU・Trainium・Maia・MTIAと並ぶ自社チップ化の潮流
- 5.2 Broadcomを軸とする競合構図とMarvell・Cerebrasの推論勢
6 日本企業がJalapeño発表から読むべき推論コストとベンダー戦略の論点
7 OpenAI Jalapeño（ハラペーニョ）に関するよくある質問
8 関連記事

まとめ：Jalapeñoが示すOpenAIのフルスタック戦略と脱Nvidiaの要点

Jalapeñoは、OpenAIがゼロから設計しBroadcomが製造を担う推論専用のASICです。新しいモデルを学習させるトレーニング用ではなく、ChatGPTやCodexの応答を生成する推論工程のコストと速度を改善するために作られました。初期設計から製造テープアウトまで約9か月で到達し、早期テストでは電力性能（performance per watt）が現行の最先端を大きく上回るとOpenAIは説明していますが、これは自社の初期値で、詳細な技術レポートは数か月後とされています。2026年内に初期展開を始め、Broadcomとの複数年契約に基づき最終的に10ギガワット規模の計算基盤を目指します。

日本企業にとって、Jalapeñoは今すぐ調達する対象ではありません。読み取るべきは中期の論点です。推論コストが下がればOpenAIのAPI料金やAI内製の損益分岐が動き、単一GPUベンダーへの依存を前提にした調達計画は見直しの余地が出ます。一方で量産の本番は2027〜2028年であり、性能主張も独立検証を待つ段階です。発表当日に投資判断やベンダー切り替えを急ぐ必要はありません。

OpenAI Jalapeño（ハラペーニョ）の概要と2026年6月発表の事実関係

まず、何がいつ発表され、誰が関わっているのかという事実関係を確定させます。憶測を避け、公式発表と複数の報道で一致している点だけを示します。

2026年6月24日に発表されたOpenAI初の自社設計AIチップ

OpenAIとBroadcomは2026年6月24日（米国時間水曜）、Jalapeñoを公開しました。OpenAIにとって初めて自社設計したAIチップであり、設計の主導権はOpenAIが握っています。物理サンプルはBroadcomのHock Tan CEOから、OpenAIのSam Altman CEOとGreg Brockman社長へ手渡されました。両社の連携は2025年10月に複数年契約として公表されており、今回はその最初の具体的な成果にあたります。

「インテリジェンス・プロセッサ」＝LLM推論に特化したASIC

OpenAIはJalapeñoを「インテリジェンス・プロセッサ」と呼び、技術分類としてはASIC（特定用途向け集積回路）に位置づけています。GPUのような汎用アクセラレータではありません。担うのはLLMの推論、つまり学習済みモデルがユーザーの入力に応答を返す工程です。新しいモデルを学習させるトレーニング用ではない点が、Nvidiaの主力GPUとの最大の違いになります。設計はOpenAIが持つモデル・カーネル・サービング基盤の知見を起点に、ゼロから組み上げられたとされています。

OpenAI設計・Broadcom実装・Celestica統合という3社分担

開発はおおむね3社で役割が分かれています。OpenAIがチップのコア設計を担い、Broadcomがシリコン実装とネットワーキング技術（Tomahawkネットワーキングシリコンを含む）を提供し、カナダのCelesticaがボード・ラック・システム統合を受け持ちます。ハードウェア部門を率いるのはRichard Ho氏です。OpenAIが「フルスタック」と呼ぶのは、モデルや製品だけでなく、その下のチップ・カーネル・メモリ・ネットワーク・スケジューリングまで同じ目標に合わせて設計する構図を指します。

GPUではなくASICを選んだ理由とJalapeñoの設計思想

ニュース速報では触れられにくいのが「なぜGPUでなくASICなのか」という核心です。両者の違いを整理したうえで、OpenAIの設計判断を読み解きます。

ASICとGPUの違い｜汎用性を捨てて電力効率を取る選択

ASICは特定の処理向けに回路を設計した専用チップで、GPUのように幅広い処理をこなす汎用性はありません。その代わり、用途を絞ることで電力効率と単位コストを下げやすくなります。Jalapeñoの場合、対象をLLM推論一本に絞ったことが設計の前提です。

観点	ASIC（Jalapeño）	GPU（Nvidia等）
設計思想	LLM推論という特定用途に特化	汎用・幅広い処理に対応
柔軟性	低い（用途が限定される）	高い（学習・推論・他用途）
電力効率	高くしやすい（用途特化のため）	相対的に低い
単位コスト	量産時に下げやすい	高め（ベンダーのマージン）
主な対象	推論（Jalapeñoの場合）	学習と推論の両方
設計の主導権	自社で握れる	チップベンダーに依存

柔軟性ではGPUが、用途が固定された推論の効率ではASICが有利になります。OpenAIは推論という安定した大量処理に対象を限定し、ASIC側の利点を引き出す判断をしました。汎用性を手放すのは、用途が定まっているからこそ受け入れられるトレードオフです。

データ移動を抑え理論ピークに近い実効性能を狙う設計

OpenAIは、Jalapeñoのアーキテクチャがデータ移動を減らし、計算・メモリ・ネットワークの資源配分を調整することで、理論上のピーク性能に近い実効利用率を引き出すと説明しています。AIチップでは、カタログ上のピーク性能と実際に出る性能の差が問題になりがちです。その差を埋める設計を主眼に置いた、という主張になります。Broadcomのネットワーキング技術は、この実効性能を大規模なデータセンターで保つために組み込まれています。

学習ではなく推論に絞った理由とNvidia依存という背景

推論に絞った背景には、コスト構造があります。学習は一時的に巨大な計算を要する一方、推論は数億単位の日々の応答として継続的に発生する。わずかな効率改善でも積み上がれば大きな差になります。Jalapeñoが想定するのはChatGPTやCodexのような実運用ワークロードで、たとえばAIコード生成エンジンであるCodexの仕組みを支える応答処理が対象です。学習についてはNvidiaが引き続き主要パートナーだとOpenAIは明言しており、今回の動きはNvidiaとの決別ではなく、推論という一点で依存度を下げる試みと位置づけられます。

約9か月でのテープアウトと電力性能｜性能主張の正しい読み解き方

Jalapeñoの話題は開発速度と性能主張に集中しています。ただし発表時点の数値は自社のものです。何が確かで何が未確定かを切り分けます。

設計からテープアウトまで約9か月という開発速度の意味

OpenAIとBroadcomは、初期設計から製造テープアウトまでを約9か月で完了したとしています。高性能な先端半導体でこの規模のテープアウトは通常もっと長くかかるため、両社はこれを史上最速級のASIC開発サイクルだと述べています。速度を支えたのは、ハードとソフトの密な共同開発に加え、設計と調整の工程の一部にOpenAI自身のAIモデルを用いた点です。利用者が使うのと同じモデルが、次世代モデルを動かすハードの設計を助けたという循環が起きています。

「電力性能が現行最先端超え」という自社主張の読み方

OpenAIは早期テストで、Jalapeñoの電力性能が現行の最先端を大きく上回ると説明し、熱性能も想定以上だとしています。ここは慎重に読む必要があります。これはOpenAIの初期測定であり、独立した第三者ベンチマークではありません。詳細な技術レポートは数か月後とされ、具体的な数値は未公開です。発表時のベンダー自己申告は、独立検証が出るまで割り引いて受け取るのが妥当でしょう。推論コストを「約50%削減」とする数字も、Bloombergの報道として伝えられたもので、OpenAIの公式発表に明記された値ではありません。

GPT-5.3-Codex-Sparkでのラボ稼働と未公開ベンチの留意点

現時点でJalapeñoはエンジニアリングサンプルの段階にあり、OpenAIのラボで本番想定の周波数・電力でMLワークロードを実行しています。動作対象にはGPT-5.3-Codex-Sparkが含まれます。実際のモデルで動いている事実は前進ですが、ラボ稼働と量産は別物です。たとえばGPT-5.3 Instantが全ユーザーへ展開された経緯のように、モデル側の改善が利用者に届くまでには段階があり、チップも同様に商用展開までの距離が残っています。

Google・Amazon・Microsoftの自社チップと比べたJalapeñoの位置づけ

Jalapeñoは突然現れた例外ではありません。主要なクラウド・AI各社はすでに自社シリコンを持っています。競合構図の中に置くと、この発表の意味が見えてきます。

TPU・Trainium・Maia・MTIAと並ぶ自社チップ化の潮流

大規模にAIを動かす企業が自前のチップを設計する流れは数年前から続いており、その中でOpenAIはむしろ後発です。

企業	自社チップ	主な対象
OpenAI	Jalapeño	推論
Google	TPU	学習・推論
Amazon	Trainium／Inferentia	学習／推論
Microsoft	Maia	学習・推論
Meta	MTIA	推論中心

各社に共通する論理は単純です。この規模では、Nvidiaのマージンを払い続けるより自社設計のほうが安くつく。OpenAIのJalapeñoも、推論という最もコストが効く一点に絞って同じ判断を下しました。後発である分、推論特化という明確な狙いを持って参入した点が特徴になります。

Broadcomを軸とする競合構図とMarvell・Cerebrasの推論勢

見落とされやすいのが、カスタムシリコンの裏方としてのBroadcomの存在です。BroadcomはGoogleのTPUをはじめ多くの自社チップの設計・製造を支えており、Jalapeñoもその一つに加わりました。AIラボがチップを「自社設計」と呼んでも、実装の中核を担うのはBroadcomであることが多いという構図です。推論分野ではMarvellが推論向けチップを手がけ、OpenAI自身もNvidia以外にCerebrasを推論で使い始めています。Nvidia一強だった推論市場に、複数の選択肢が並び始めた局面といえます。

日本企業がJalapeño発表から読むべき推論コストとベンダー戦略の論点

ここからは立場を明確にします。Jalapeñoは日本企業が直接買うチップではありませんが、放置してよい話でもありません。判断に効く論点を3つに絞ります。

推論コスト低下がAPI料金とAI内製の判断に与える波及

最も実務に効くのは推論コストです。OpenAIが自社チップで推論コストを下げられれば、その効果はAPI料金やChatGPTの提供条件に時間差で反映される可能性があります。報道される削減幅の数字は未確定ですが、確実なのは、推論の単価が下がる方向に業界が動いているという事実です。自社でGPUを抱えてAIを内製するか、API経由で使うかの損益分岐は、この単価低下で動きます。結論を急がず、API単価の改定を四半期ごとに監視し、内製計画の前提に織り込む程度が現時点での現実的な対応になります。

単一GPUベンダー依存を見直す調達・マルチベンダー視点

もう一つは調達のリスク分散です。OpenAIですらNvidia一社依存を避け、Broadcom・AWS Trainium・AMD・Cerebrasへと供給元を広げています。世界最大級の計算購入者が単一ベンダー依存を是正している事実は、自社のAI基盤を一つのクラウドや一つのGPUに固定することのリスクを示唆します。ただし、これは全社でマルチクラウド化を進めよという話ではありません。供給制約や価格高騰が事業の生命線に直結する用途に限って代替経路を確保しておく、という優先順位づけが妥当です。

日本企業がいま動くべき場面と過剰反応を避けるべき場面

立場を言い切ります。いま動くべきなのは、推論コストが原価の大きな割合を占めるAIプロダクトを自社で運営している企業です。この場合、API単価の改定とベンダー多様化は損益に直結するため、監視体制を持つ価値があります。逆に、社内でChatGPTを補助的に使う程度の企業が、この発表を受けてインフラ戦略を組み替えるのは過剰反応です。量産の本番は2027〜2028年で、性能も独立検証待ちです。発表当日に投資判断やベンダー切り替えへ走るのは、最も避けたい失敗パターンになります。事実の確定と技術レポートの公開を待ってから動いても遅くありません。

OpenAI Jalapeño（ハラペーニョ）に関するよくある質問

発表直後に検索されている疑問を、現時点で確認できる事実の範囲で簡潔に答えます。

JalapeñoはNvidiaのGPUを置き換えるのですか？

全面的な置き換えではありません。Jalapeñoは推論専用で、新しいモデルを学習させるトレーニングは対象外です。OpenAIは学習についてNvidiaを引き続き主要パートナーと位置づけています。今回の狙いは、日々大量に発生する推論工程に限ってNvidia依存を下げ、コストと供給の自由度を高めることです。Nvidiaとの決別ではなく、推論という一点で選択肢を増やす動きと理解するのが正確です。

Jalapeñoはいつから実際に使えるようになりますか？

OpenAIは2026年内に初期展開を始める計画です。Broadcomは2026年末までにMicrosoftなどの一部で商用利用が始まるとし、本格的な量産は2027年から、2028年に本格化すると説明しています。現在はエンジニアリングサンプルがラボで稼働している段階で、一般の開発者や企業がすぐ手に取れるものではありません。当面はOpenAIの社内インフラで使われ、その効果がサービス品質や料金へ間接的に表れる形になります。

ASICとGPUは結局どちらが優れているのですか？

優劣ではなく用途で決まります。ASICは用途を絞った処理で電力効率と単位コストに優れ、Jalapeñoのような推論の大量処理に向いています。GPUは学習を含む幅広い処理を一台でこなせる柔軟性が強みで、用途が定まらない研究開発や多様なワークロードに強い。安定した大量推論ならASIC、変化の多い処理ならGPU、という使い分けが実態に近い判断軸です。

日本企業もJalapeñoを購入・利用できますか？

チップ単体を直接購入する形は、現時点で示されていません。OpenAIとBroadcomの発表では、Jalapeñoは業界全体の現在・将来のLLMに対応する設計だとされ、外部への提供可能性に触れていますが、具体的な販売形態は未定です。日本企業が当面接するのは、OpenAIのAPIやChatGPTを通じて間接的に推論基盤の効率改善を受け取る形になります。直接調達を前提に計画を立てる段階ではありません。

OpenAIが自社チップを持つと利用者には何が変わりますか？

期待されるのは、応答速度・コスト・安定供給の3点です。推論基盤を自社で設計できれば、ChatGPTの応答が速くなり、APIの提供コストが下がり、需要が集中する時間帯でもアクセスが安定しやすくなる可能性があります。ただしこれらは展開が進んだ後の話で、発表当日に体感が変わるわけではありません。利用者側は、今後数四半期のサービス改定や料金変更という形で効果を確認していくことになります。

Azure OpenAI Serviceとは？その概要と特徴を徹底解説：企業がOpenAIのモデルをクラウド経由で使う基盤を整理しており、推論コストの低下が法人利用に与える影響を考える材料になります。
GPT-5.2の概要とは：最新AIモデルの特長と業界内での位置づけを徹底解説：Jalapeñoが動かす対象であるOpenAIの最新モデルの実力を押さえると、チップ側の意味がより立体的に理解できます。

資料請求