2026.06.24 AI

国産生成AI基盤モデル「PLaMo 3.0 Prime」とは｜2026年最新の性能・料金・使い分け

国産生成AI基盤モデル「PLaMo 3.0 Prime」は、2026年6月22日に株式会社Preferred Networks（PFN）が正式リリースした日本語特化の大規模言語モデル（国産LLM）です。事前学習からトークナイザまでを自社で開発したフルスクラッチのモデルで、複雑な思考を担うReasoning（推論）モデルと、高速応答のNon-reasoning（非推論）モデルを用途ごとに切り替えられます。この記事では、2026年3月のβ版から正式版への変更点、Standard・Provider・Freeの料金プラン、15種類のベンチマークで見えた得意・不得意、NTTのtsuzumiやRakuten AIなど他の国産LLMとの違い、そしてChatGPTやClaudeとの使い分けまでを、PFNの公式リリースと技術ブログをもとに整理します。

1 まとめ：日本語業務・データ主権・コストで捉えるPLaMo 3.0 Primeの選びどころ
2 PLaMo 3.0 Primeの概要とフルスクラッチで開発された国産基盤モデルの意味
3 β版（2026年3月）から正式版で強化された推論性能・非推論モデル・安全性
4 ReasoningモデルとNon-reasoningモデルの違いと256kコンテキストの活かし方
5 Standard・Provider・Freeの料金プランと独自トークナイザによるコスト優位
6 15種類のベンチマークで見る日本語業務での得意領域と不得意領域
7 tsuzumi・Rakuten AI・ELYZAなど他の国産LLMとPLaMo 3.0 Primeの違い
8 API・Amazon Bedrock・Snowflake・オンプレミスの提供形態とデータ主権の強み
9 PLaMo 3.0 Primeを採用すべき企業と採用を避けるべき場面の判断基準
10 よくある質問
11 関連記事

まとめ：日本語業務・データ主権・コストで捉えるPLaMo 3.0 Primeの選びどころ

PLaMo 3.0 Primeの選びどころは、性能の絶対値ではなく「日本語業務・データ主権・コストの3点をまとめて満たせるか」にあります。機密性の高い日本語文書を扱い、APIコストを読みたい中堅・中小企業や、データを国外へ出しにくい自治体・公共領域にとって、現実的な選択肢になります。逆に英語主体の業務や最高難度の数学・科学推論が中心なら、GPT-5系やClaudeなど海外モデルのほうが向きます。

始め方の順序はシンプルです。まずFreeプランで日本語の要約や問い合わせ対応を試し、Standardプラン（入力60円・出力250円／100万トークン）でAPIの安定性とコストを確かめてから本番に組み込みます。海外モデルを一律に置き換えるのではなく、用途で振り分けるハイブリッド運用が出発点です。

PLaMo 3.0 Primeの概要とフルスクラッチで開発された国産基盤モデルの意味

2026年6月22日リリースのPLaMo 3.0 Primeの開発元と基本情報

PLaMo 3.0 Primeは、PFN（本社：東京都千代田区、代表取締役社長：岡野原大輔）が2026年6月22日に提供を開始した、PLaMoシリーズの最新フラッグシップです。2026年3月に公開したβ版をもとに、モニター企業の利用や社内評価で得た知見を反映し、企業の実務利用に耐える水準へ仕上げています。提供はクラウドAPIとオンプレミスの両方に対応し、ReasoningモデルとNon-reasoningモデルを必要に応じて使い分けられます。

「フルスクラッチ開発」が海外モデルの日本語追加学習と異なる理由

「国産AI」と呼ばれるサービスの多くは、LlamaやMistralといった海外のオープンモデルを日本語データで追加学習（ファインチューニング）したものです。この方式では、モデルの設計思想・学習データの中身・トークナイザの構造が海外由来のまま残ります。PLaMo 3.0 Primeはここが違い、事前学習・トークナイザ・推論（Reasoning）訓練までを自社内で完結させた「フルスクラッチ」開発です。日本語の処理効率やコスト構造に直結するトークナイザを自前で持つことが、後述するコスト優位の土台になっています。

PLaMo Prime・Lite・金融特化・翻訳の中での3.0 Primeの位置づけ

PLaMoは用途別に複数のモデルを展開しており、3.0 Primeはその最上位にあたります。

PLaMo Prime：商用版のフラッグシップ。汎用的な業務利用を想定（本記事の3.0 Primeはこの系列）
PLaMo Lite：自動車や製造設備などエッジデバイス向けに軽量化した小規模言語モデル
金融特化PLaMo：日本の金融知識を追加学習したモデル
PLaMo翻訳：日本語の翻訳に特化したモデル

同じPLaMoでも狙う環境が異なるため、まず「クラウド／オンプレで汎用的に使うフラッグシップ＝3.0 Prime」と押さえると、他モデルとの混同を避けられます。

β版（2026年3月）から正式版で強化された推論性能・非推論モデル・安全性

強化学習のステップ数を約2倍に延長した推論能力の底上げ

正式版では、β版で導入した強化学習を、コーディング・長コンテキスト・対話などのデータを増やして継続しました。学習のステップ数はβ版比で約2倍です。結果として、PFNが追跡する15種類のベンチマークのほぼすべてで、推論モデルはβ版を、非推論モデルは旧モデルのPLaMo 2.2 Primeを上回っています。推論の底上げは数値で確認されており、感覚的な「賢くなった」ではない点が正式版の特徴です。

モニター企業の要望から新規開発された高速応答のNon-reasoningモデル

β版は推論モデルのみの提供でした。モニター企業からの「性能は十分でよいので応答が速いモデルが欲しい」という声を受け、正式版では推論モデルの開発で得た学習パイプラインを取り込み、非推論モデルを作り直して追加しています。ユーザーは1つのモデルに対して推論／非推論を切り替えられるため、タスクの重さに合わせて速度とコストを調整できます。

NICT提供データとHELM Safetyで確認された安全性能の水準

安全性の訓練には、国立研究開発法人情報通信研究機構（NICT）から提供を受けた安全性データを使っています。評価はスタンフォード大学基盤モデル研究所のHELM Safety（BBQ・SimpleSafetyTests・HarmBench・XSTest・Anthropic Red Teamの5ベンチを統合し、暴力・詐欺・差別・性的表現・ハラスメント・欺瞞の6カテゴリを網羅）で行い、海外モデルと同程度以上の結果を示しました。ただしPFNは、非推論モデルの一部カテゴリで過剰拒否や危険なプロンプトへの応答が残ると明言しており、安全性はなお改善途上です。「国産だから安全」ではなく、公開ベンチの数値で確認できる点が評価軸になります。

ReasoningモデルとNon-reasoningモデルの違いと256kコンテキストの活かし方

Reasoningモデルが向く複雑な判断・数理アルゴリズム問題の具体例

Reasoningモデルは、回答前に段階的な思考を挟んで結論を導きます。複数の条件を整理する必要がある法律文書の解釈、リスク評価、数理・アルゴリズム問題、専門性の高い質問応答、業務上の意思決定支援に向きます。APIでは推論を有効化するパラメータ（reasoning_effort）に「medium」を指定して使う設計です。指示への追従精度が、深い思考を通じて上がる傾向があります。

Non-reasoningモデルが向く要約・問い合わせ対応など高速処理の用途

Non-reasoningモデルは応答速度を優先します。社内文書の要約、定型的な問い合わせ対応、情報抽出、分類、チャットボットなど、深い推論より処理量とレスポンスが効く業務に向きます。短文の言い換えや定型対応にReasoningモデルを使うと回答時間とコストが膨らむため、軽いタスクは非推論側に寄せるのが基本方針です。

コンテキスト長64Kから256Kへの拡張で広がる長文処理とエージェント用途

コンテキスト長は、β版の64KからYaRNと継続事前学習によって256Kへ拡張されました。日本語ではおおよそ47万字前後（独自トークナイザの約1.85文字／トークンで換算）にあたり、長い契約書や就業規則の全文を読み込んだ質疑応答、数十ページの社内レポートの一括要約、複数の議事録をまたいだ整合性チェックが1回の入力で扱えます。AIエージェントが長いツール利用履歴を保持するうえでも、この長さが効きます。同価格帯・同性能帯のモデルと並べると次の位置づけです。

モデル	コンテキスト長	区分
PLaMo 3.0 Prime	256K	本モデル
Qwen3.6-27B	256K	同性能帯オープン（同等）
Claude Haiku 4.5	200K	同価格帯クローズド
gpt-oss-120b	128K	同性能帯オープン
GPT-5.4 Mini	400K	同価格帯クローズド
DeepSeek V4 Pro / GPT-5.5 Pro	1M	上位帯（PFNも差を認める）

256Kは同価格帯のClaude Haiku 4.5（200K）を上回り、実務の長文処理では十分競争力があります。一方、1M級が必須となる超長文や大規模コードベース全体の一括処理では、上位帯の海外モデルにまだ届きません。

Standard・Provider・Freeの料金プランと独自トークナイザによるコスト優位

Standardプランの入力60円・出力250円（100万トークン）の料金体系

Standardプランは、100万トークンあたり入力60円・出力250円です。出力は1回あたり最大12万8000トークンまで扱えます。一般法人や個人が従量課金で使う標準プランで、後述のベンチマーク評価のコスト試算もこのStandardプランの単価をもとに算出されています。料金プランは用途と規模で次の3種に分かれます。

プラン	入力（100万トークン）	出力（100万トークン）	対象
Standard	60円	250円（出力最大12.8万トークン）	一般法人・個人
Provider	個別見積	個別見積	AIサービス提供者・大量利用
Free	無料（利用量制限あり）	無料（利用量制限あり）	試験利用

ProviderプランとFreeプラン・7月31日までの無料クレジットの条件

Providerプランは、AIサービス提供者や大量利用向けに用途・規模に応じて個別に見積もる形です。Freeプランは利用量に制限があるものの無料で試験利用でき、PLaMo Chat（plamo.preferredai.jp）から登録できます。さらにリリースキャンペーンとして、2026年7月31日までに新規登録すると1,000万トークン相当のクレジットが付与されます。日本語の要約や比較評価であれば、追加費用なしで相当量の検証ができる規模です。

独自トークナイザの日本語1文字約0.54トークンが生むコスト差

APIの料金はトークン単位で決まるため、同じ日本語テキストを何トークンに分割するかがコストを左右します。PLaMo 3.0 Primeの独自トークナイザは、日本語を1文字あたり約0.54トークン（1トークンあたり約1.85文字）で処理します。第三者（Legalscape）の比較検証では、GPT系の約1.17文字/トークン、Claude系の約1.02文字/トークンと比べ、同じ日本語テキストで消費トークンが約45〜55%少ない計算です。単価だけでなくトークン消費そのものが少ないため、日本語業務を回すほど運用コストの差が積み上がります。

同価格帯の海外クローズドモデル（GPT-5.4 Mini・Claude Haiku 4.5）との費用比較

PFNはStandardプランの単価で評価コストを算出し、同価格帯のGPT-5.4 MiniやClaude Haiku 4.5、同性能帯のオープンモデル（gpt-oss-120b、Qwen3.6-27B）と比較しています。その結果、日本語の指示追従やコーディングで競争力のあるスコアを、より低い推論コストで出せると示しました。海外モデルの料金体系や仕組みを押さえておくと比較しやすく、API連携の前提としてはAnthropic API（Claude）の概要と基本的な仕組みも参考になります。日本語中心で量をこなす業務ほど、PLaMo側のコスト優位が効いてきます。

15種類のベンチマークで見る日本語業務での得意領域と不得意領域

指示追従・対話・ツール利用・医療分野で競合と並ぶ得意領域

PFNが評価した15種類のベンチマークのうち、PLaMo 3.0 Primeが競合と同等以上を示したのは次の領域です。日本語・英語の指示追従（IFBench／JFBench）、対話（MT-bench／Japanese MT-bench）、外部ツール使用（BFCL v4）、医療分野の質問応答（MedRECT・医師国家試験）、そして安全性（HELM Safety）。とくに日本語の指示追従と対話の自然さは、同価格帯の海外クローズドモデルを上回る場面があると報告されています。社内文書の要約や問い合わせ対応のように「日本語で指示どおりに動く」業務が、最も強みの出る使い方です。

コード生成性能（LiveCodeBench）の評価と実務での使いどころ

コード生成はLiveCodeBench v5（2024年8月〜2025年2月のデータ）で評価され、正式版でコード生成・修正の能力が強化されました。外部ツールの呼び出しや複数ステップの処理と組み合わせれば、業務システムと連携する自律的なAIエージェントとしても使えます。コード生成AIの得意・不得意を整理したコード生成AIのメリットとデメリットと合わせて読むと、どの工程を任せ、どこを人がレビューすべきかの線引きがつけやすくなります。

Web探索・長コンテキスト・数学推論・日本の法令に残る不得意領域

一方でPLaMo 3.0 Primeが劣る領域も明確です。Web検索付きの質問応答（BrowseComp-Plus）、長コンテキストの推論（LongBench v2）、数学的推論（AIME 2024）、STEM分野（GPQA-Diamond）、日本の法令分野（lawqa_jp）では海外モデルに及ばず、PFN自身も改善が必要と述べています。リアルタイムの情報検索が前提の業務、最高難度の数学・科学の問題、込み入った法令解釈を主軸にするなら、現時点では海外の上位モデルを選んだほうが確実です。得意・不得意を分けて見れば、「日本語の実務に寄せて使う」という判断にぶれがなくなります。

tsuzumi・Rakuten AI・ELYZAなど他の国産LLMとPLaMo 3.0 Primeの違い

NTT tsuzumi・Rakuten AI・ELYZA・NEC cotomiの開発方針の違い

国産LLMと一口に言っても、開発元と方針はさまざまです。代表的なモデルを各社の公表内容にもとづいて並べると、次のように整理できます。

モデル	開発元	基盤の方針（公表ベース）
PLaMo 3.0 Prime	Preferred Networks	フルスクラッチ開発
tsuzumi	NTT	自社開発の日本語特化LLM
cotomi	NEC	自社開発のLLM
Rakuten AI	楽天	海外オープンモデルを基盤に開発
ELYZA	ELYZA	Llama系を日本語で追加学習

フルスクラッチか海外モデル追加学習かで分かれる国産LLMの分類

国産LLMを見分ける軸の1つが、「土台から自前で作ったか」「海外モデルを日本語で追加学習したか」です。後者は開発が速く性能も出やすい反面、学習データの中身やトークナイザの構造は海外由来のまま残ります。PLaMo 3.0 Primeはフルスクラッチを選び、NICTの日本語データや経済産業省・NEDOのGENIAC第3期の成果を取り込んで、日本語前提の設計を貫いています。どちらが優れているという話ではなく、データ主権やトークン効率を重視する用途ではフルスクラッチ側に分があります。

日本語性能・コスト・提供形態で見たPLaMo 3.0 Primeの差別化点

他の国産LLMと比べたときのPLaMo 3.0 Primeの差別化点は、単独の機能ではなく組み合わせにあります。日本語性能とトークン効率によるコスト優位、推論／非推論を切り替えられる2モデル構成、そしてクラウドAPI・Amazon Bedrock・Snowflake・オンプレミスという提供形態の幅です。デジタル庁が整備する生成AI利用環境「源内」で試用される国内LLMの1つにPLaMoシリーズ（PLaMo 2.0 Prime）が選ばれている点も、公共・大企業領域での実績として他モデルとの比較材料になります。

API・Amazon Bedrock・Snowflake・オンプレミスの提供形態とデータ主権の強み

API・Amazon Bedrock・Snowflake・オンプレミスの4提供形態と選択の判断軸

PLaMo Primeは次の4つの形態で提供され、データの置き場所と既存環境への合わせやすさで選び分けます。

クラウドAPI（PLaMo Platform）：最短で試せる標準的な利用形態。まずここから始めるのが基本
Amazon Bedrock Marketplace：AWS上の他モデルと同じ評価条件で並べて検証したい場合
Snowflake：データ基盤としてSnowflakeを使っており、データを移さず使いたい場合
オンプレミス：機密データを社外に一切出さない構成にしたい場合

「すでにどの基盤を使っているか」と「データをどこまで外に出せるか」の2点で、ほぼ形態が決まります。

構造化出力とツール連携による既存業務システムへの組み込み

正式版では構造化出力（Structured Output）に対応しました。応答を指定したデータ構造に必ず沿わせる機能で、従来のプロンプトによる形式指定より出力が安定し、既存システムや外部APIとの連携が組みやすくなります。APIはOpenAI互換で、エンドポイントとモデル名を差し替えるだけで既存コードから呼び出せます。

base_url = "https://api.platform.preferredai.jp/v1" / model = "plamo-3.0-prime"

kintoneやSalesforce、Slackなどへの組み込みも、この互換性と構造化出力を前提にすると技術的な障壁が下がります。

オンプレミス展開でデータを社外に出さない構成と導入時の前提

オンプレミス展開は、機密データを一切外部へ送らない環境を作れる点が最大の利点です。ただしモデルを自社で動かすため、相応のGPUサーバーと運用体制が前提になり、初期投資と運用負荷は小さくありません。従業員規模の小さい企業では過剰投資になりやすいため、まずStandardプランのAPIで効果を確かめ、コンプライアンス要件が厳しくなった段階でオンプレミスを検討する順序が現実的です。導入費用やGPU要件はケースで変わるため、Providerプランを含めPFNへの個別確認が必要です。

デジタル庁「源内」採用・GENIAC・NICT連携が示す公共調達での信頼性

デジタル庁が整備するガバメントAIの利用環境「源内」では、PLaMoシリーズのPLaMo 2.0 Primeが、2026年8月頃から試用される国内LLMの1つに選定されています（2026年3月選定）。PLaMo 3.0 Primeの開発にはNICTとの共同研究で得た事前学習モデルが使われ、事後学習には経済産業省・NEDOのGENIAC第3期の成果が活用されています。約800の自治体が導入するQommonsAIや法人向けのTachyon 生成AI、国産AI構築プラットフォームmiiboにも標準搭載されており、国策プロジェクトと結び付いた開発であることは、政府調達や自治体システムで採用を検討する際の信頼材料になります。

PLaMo 3.0 Primeを採用すべき企業と採用を避けるべき場面の判断基準

機密性の高い日本語業務とコスト管理を重視する企業に向く理由

PLaMo 3.0 Primeが向くのは、扱う情報が日本語中心で、かつ機密性が高く、APIコストを読みたい組織です。契約書・就業規則・未公表の社内文書を扱う業務、月次のAI利用料を管理したい中堅・中小企業、データを国外に出しにくい自治体・公共領域がその典型です。トークン効率によるコスト優位と、必要ならオンプレミスへ寄せられる提供形態が、この3条件にそのまま噛み合います。

英語主体の業務や最高難度のSTEM推論で採用を避けるべき場面

次の場合は、現時点でPLaMo 3.0 Primeを主軸に据えないほうがよい、と言い切れます。第一に、英語のメール作成や海外論文の要約など英語アウトプットが中心の業務。これは依然ChatGPTやClaudeが強い領域です。第二に、AIME型の数学やGPQA-Diamond級のSTEM推論を主軸にするケース。ベンチマーク上も海外上位モデルに及びません。第三に、リアルタイムのWeb検索が前提の調査業務や、1M級のコンテキストが必須となる超長文処理。これらは無理にPLaMoへ寄せると、出力品質を落とすだけです。「国産だから全部これで」という縛りが、最も避けるべき失敗パターンになります。

ChatGPT・Claudeとの併用（ハイブリッド運用）が現実解になる条件

多くの企業にとっての現実解は、1つに絞ることではなく、用途で振り分けるハイブリッド運用です。機密度・言語・コストの3軸で振り分け、機密の日本語業務はPLaMo 3.0 Prime、英語や最新情報のリサーチは海外モデル、という線引きにすると現場が迷いません。GPT-5系の機能更新など海外モデルの最新動向も定期的に把握しておくと、振り分けの判断軸を保てます。最初に「外に出せるか出せないか」を決めるだけで、運用ルールの骨格が固まります。

よくある質問

PLaMo 3.0 Primeや国産LLMについて、検索で多く見られる疑問に簡潔に答えます。

日本製の生成AI（国産LLM）にはどのようなものがありますか？

代表的なものに、PFNのPLaMo、NTTのtsuzumi、楽天のRakuten AI、ELYZA、NECのcotomiなどがあります。土台から自社開発するフルスクラッチ型（PLaMo、tsuzumiなど）と、海外のオープンモデルを日本語で追加学習する型（Rakuten AI、ELYZAなど）に大きく分かれます。データ主権やトークン効率を重視するならフルスクラッチ型、開発スピードや汎用性能を重視するなら追加学習型が選択肢になります。

PLaMo 3.0 Primeは無料で使えますか？

利用量に制限のある無料のFreeプランが用意されており、PLaMo Chat（plamo.preferredai.jp）から試せます。加えて2026年7月31日までに新規登録すると、1,000万トークン相当のクレジットが付与されます。本番運用の前に、まずFreeプランやクレジットで日本語要約や問い合わせ対応を試し、安定性を確認してからStandardプランへ移行するのがおすすめです。

PLaMo 3.0 PrimeはChatGPTやClaudeより賢いのですか？

評価軸によります。日本語の指示追従・対話・ツール利用・医療分野・安全性では、同価格帯のGPT-5.4 MiniやClaude Haiku 4.5と競争力のあるスコアを、より低い推論コストで出しています。一方、Web探索・長コンテキスト・数学推論・STEM分野では海外上位モデルが上回ります。「日本語業務を低コストで」という軸なら有力ですが、英語や最高難度の推論では海外モデルが優位です。

社内の機密データを安全に扱える国産AIはどれですか？

PLaMo 3.0 Primeはオンプレミス展開に対応しており、データを社外へ出さない構成を作れます。ただしクラウドAPIに機密情報を入力する場合は、利用規約の確認や必要に応じたデータ処理の取り決めが要ります。「国産＝学習データが日本語中心」という意味であって、データの取り扱いが自動的に国内法準拠になるわけではない点に注意が必要です。機密性を最優先するなら、オンプレミス構成での導入を検討してください。

PLaMo 3.0 Primeはどの業界や自治体で使われていますか？

約800の自治体が導入するQommonsAIや、法人向けのTachyon 生成AI、国産AI構築プラットフォームmiiboに標準搭載されています。さらにデジタル庁の生成AI利用環境「源内」では、PLaMoシリーズ（PLaMo 2.0 Prime）が試用される国内LLMの1つに選ばれており、自治体・公共領域での利用が想定されています。製造業をはじめとする企業の社内文書処理や問い合わせ対応など、日本語業務全般での活用が広がっています。

GPT-5.2の概要と特長：PLaMo 3.0 Primeと使い分ける海外モデルの最新動向を把握するための参考記事です。

資料請求