2026.06.30 AI

中国AI「GLM-5.2」とは？Z.ai開発LLMの性能・使い方・導入判断【2026年版】

中国AI「GLM-5.2」は、清華大学発のZ.ai（旧Zhipu AI）が2026年6月13日に投入したコーディング特化の大規模言語モデルです。約744Bの混合エキスパート（MoE）構成、100万トークンの文脈、MITライセンスでのオープンウェイト公開を3つの軸とし、商用フロンティアの約10分の1というコストで注目を集めました。この記事では、GLM-5.2の正体と「GLM」という名前の整理、公称ベンチマークの読み方、Claude Codeからの使い方とコスト、そして日本企業が中国製モデルを導入する際のガバナンス上の論点までを、2026年6月末時点の事実に基づいて解説します。

1 まとめ：GLM-5.2の実力と日本企業が取るべき導入スタンス
2 開発元Z.aiと多義語「GLM」の整理：中国製フラッグシップLLMの基礎
3 公称ベンチマークの数値と「独立検証待ち」の読み方：性能評価の実際
4 Claude Code連携とコストの実際：API・Coding Plan・自己ホストの選択
5 中国製モデルのガバナンス論点と、採用すべき/避けるべき場面の線引き
6 中国AI「GLM-5.2」に関するよくある質問
7 関連記事

まとめ：GLM-5.2の実力と日本企業が取るべき導入スタンス

GLM-5.2は「自分でダウンロードして動かせるモデルの中では現状トップクラス」という位置づけのモデルです。コーディング系の公称ベンチマークではGPT-5.5を上回る数値も示し、AnthropicのClaude Opus 4.8には僅差まで迫りました。一方で、公開直後のため独立した第三者による再現検証はまだ出そろっておらず、数値の多くはベンダーであるZ.aiの自己報告である点は前提として外せません。

日本企業にとっての現実的な答えは、いきなり主力を乗り換えることではありません。長文の一括レビューやコード生成といったコスト感度の高い工程からGLM-5.2を併用し、機密性の高い業務は引き続き商用モデルや自社統制下の基盤に残す。この「使い分け」が出発点です。中国製モデル特有のデータの所在・準拠法・学習データ非開示といった論点をどう扱うかで、採用してよい場面と避けるべき場面ははっきり分かれます。本文ではその線引きまで踏み込みます。

開発元Z.aiと多義語「GLM」の整理：中国製フラッグシップLLMの基礎

GLM-5.2を理解する第一歩は、誰が何のために作ったモデルなのかと、紛らわしい「GLM」という名前を切り分けることです。検索で迷子になりやすい論点を先に片付けます。

清華大発・香港上場のZ.ai（旧Zhipu AI）が出した中国製フラッグシップ

開発元のZ.aiは、2019年に清華大学から派生したスタートアップで、旧称は智譜AI（Zhipu AI）です。2026年1月には香港証券取引所に上場し（銘柄コード02513.HK）、ファウンデーションモデル企業として上場した点でも注目されました。中国国内では、DeepSeek・Moonshot（Kimi）・Alibaba（Qwen）と並ぶ生成AIの主要プレイヤーです。

「GLM」は「General Language Model」の略で、GLM-4.5、GLM-5、GLM-5.1と続いてきた系列の最新版がGLM-5.2にあたります。位置づけはコーディングと長時間のエージェント実行に振り切ったフラッグシップ。汎用チャットの最強を狙うのではなく、開発作業を長く回し続ける用途に最適化されているのが性格です。

探しているGLMはどれか：中国AI・統計・EV・Bosch測定器の4つの混同を切り分け

日本語で「GLM」と検索すると、中国AIのGLM-5.2はむしろ少数派です。検索結果は別物のGLMで埋まります。混同を避けるため、代表的な4つを整理します。

「GLM」の意味	正体	分野
GLM-5.2（本記事）	Z.ai（中国）の大規模言語モデル	生成AI・LLM
GLM	一般化線形モデル（Generalized Linear Model）	統計学・データ分析
GLM	グリーンロードモータース（京都の電気自動車メーカー）	EV・自動車
GLM400/GLM50など	Boschのレーザー距離計	計測機器

音響分野ではGenelecのスピーカー調整ソフトも「GLM」と呼ばれます。つまり、技術記事を読むときは「どのGLMの話か」を最初に確かめるのが安全です。本記事が扱うのは、表の最上段にある中国製の大規模言語モデルだけです。

GLM-5.1からの主な変更点：1M文脈・High/Max・約750B MoEの構成

GLM-5.2は、前世代のGLM-5.1とパラメータ規模をほぼ共有しつつ、長時間タスクへの適性を引き上げた更新です。中身を支える主な仕様は次のとおりです。

項目	GLM-5.1	GLM-5.2
文脈長	200,000トークン	1,000,000トークン（5倍）
思考努力レベル	単一	High / Max の2段階
アーキテクチャ	MoE 約744B（アクティブ約40B）	MoE 約744B（アクティブ約40B）＋DSA
ライセンス	MIT	MIT（オープンウェイト）

更新の核は2点です。実用可能な文脈長が200Kから100万トークンへ5倍に広がり、推論の深さを選ぶ「High／Max」の2段階が入りました。これにより、巨大なコードベースを丸ごと読ませたり、数百ステップに及ぶエージェント実行を最後まで安定させたりしやすくなった、とZ.aiは説明しています。総パラメータの表記は出典により744B・754B・756Bと割れますが、概ね約750B級、各トークンで使う活性パラメータは40B級です。

公称ベンチマークの数値と「独立検証待ち」の読み方：性能評価の実際

GLM-5.2の評価で最も注意が要るのは、出回っている数値の出所です。強い数字ほど、誰が測ったのかを確かめる価値があります。

公称値の要点：SWE-bench Pro 62.1・Terminal-Bench 2.1 81.0・Index 51

Z.aiが公開した主な公称スコアは、深いプログラミング能力を測るSWE-bench Proで62.1（GPT-5.5の58.6を上回る）、長時間のターミナル操作を測るTerminal-Bench 2.1で81.0です。第三者の集計サイトArtificial AnalysisのIntelligence Index v4.1では総合51で、これはオープンウェイト陣営の最高点にあたります。前世代GLM-5.1の40から11ポイントの世代間ジャンプです。長時間エンジニアリングを測るFrontierSWEでも74.4で、Claude Opus 4.8の75.1に肉薄しました。

数値を鵜呑みにしない：ベンダー公称と独立検証を分けて読む判断軸

重要なのは、これらの多くがベンダー自己報告だという点です。実際、GLM-5.2はリリース直後に公式ベンチの一部が出そろわず、Z.aiが6月16〜17日にかけて数値を追加公開した経緯があります。独立した再現検証は進行中で、推論ハーネスやトークン予算、ツール構成をそろえた横並び比較はまだ限られます。

採用を検討するなら、公称ランキングをそのまま信じず、自分のタスクで小さく走らせて公称値が再現するかを見るのが確実です。ベンチマークは測定条件で動きます。数字を「確定した順位」ではなく「狙いと注目度を示す材料」として読むのが、現時点での正しい距離の取り方です。

Claude Opus・GPT-5.5・DeepSeek/Kimiとの相対位置

総合では、クローズドソースの最上位とは僅差で競る位置です。Intelligence Index v4.1で総合順位を見ると、上位はClaude Fable 5、Claude Opus 4.8、GPT-5.5の高推論モードといった商用フラッグシップが占め、GLM-5.2はその直下につけます。比較の基準としてAnthropic側のモデルを押さえたい場合は、Claude Opusシリーズの概要とできることもあわせて参照すると、両者の距離感がつかみやすくなります。

オープンウェイト陣営の中では、同じ中国勢のDeepSeek V4 ProやKimi K2.6、AlibabaのQwen系を上回り、現状で頭ひとつ抜けた評価です。要点はこうです。中程度の複雑さの長距離タスクなら商用最上位と同列に競れる領域に入った。最も極端に難しいタスクでは依然として差が残る。この2つを分けて理解するのが実態に近い見方です。

Claude Code連携とコストの実際：API・Coding Plan・自己ホストの選択

性能の話の次は、どう使い、いくらかかるかです。GLM-5.2には大きく3つの入口があり、コストと運用負荷が大きく違います。

GLM Coding PlanとAPI料金：商用フロンティアの約1/10というコスト感

もっとも手軽な入口は、サブスクリプションのGLM Coding Planです。月額はLiteが18ドル、Proが72ドル、Maxが160ドルという水準で報じられ、APIキーを使う従量課金も用意されています。報道ベースの従量単価は、入力が100万トークンあたり約0.95〜2ドル、出力が約3〜6ドル。商用フロンティアモデルが入力5〜15ドル・出力30〜75ドルであることと比べると、同種の作業を概ね10分の1前後のコストで回せる計算です。月1万ドルのAPI支出が1,000〜2,000ドル規模に収まりうる、というのがコスト面の訴求点になっています。

ただし価格優位だけで選ばないのが肝心です。安さの裏側にある準拠法やサポート体制は、後半のガバナンスの章で扱います。

Claude Code・Clineへの接続：Anthropic互換エンドポイントの3ステップ

GLM-5.2が「Claude Codeに挿せる」と言われるのは、Z.aiがAnthropic互換のエンドポイント（https://api.z.ai/api/anthropic）を提供しているからです。接続の流れは概ね3ステップに整理できます。

Z.aiでAPIキーを発行する
Claude CodeやClineなどの接続先エンドポイントとモデル名（glm-5.2。100万トークンを使う場合は1M版の指定）を差し替える
推論モード（High／Max）を選ぶ。コーディングではMaxが推奨されています

対応ツールはClaude Code・Cline・OpenCodeなど主要なエージェント8本がリリース初日からそろい、既存のワークフローを止めずに切り替えられます。GLM-5.2の主戦場はあくまで開発作業です。Claude Codeのマルチエージェント型コードレビューのように、エージェントへ長時間タスクを任せる使い方と相性が良いモデルだと理解しておくと、用途を外しません。

自己ホストの壁：約750BモデルのVRAM要件と現実的な利用経路

「MITだから無料で気軽に動かせる」と単純化するのは危険です。重みファイルはMITライセンスで公開されましたが、約750B級のモデルはコンシューマー向けGPUに素直には収まりません。FP8版の重みだけで約750GB、量子化で削っても最小構成で200GB超のストレージが必要になり、推論には複数GPU構成（例として8基のH200など）が前提になります。家庭用GPUのVRAMが16〜32GBであることを思い出すと、桁が一つ二つ違う世界です。

結論として、多くのチームにとっての現実解はAPIまたはCoding Plan経由です。自己ホストが効いてくるのは、データを外に出せない事情があり、かつGPU基盤を確保できる組織に限られます。コード生成AIのメリットとデメリットを踏まえたうえで、どの経路が自社の制約に合うかを先に決めるのが順序です。

中国製モデルのガバナンス論点と、採用すべき/避けるべき場面の線引き

ここがシステム開発・コンサルティングの現場で最も問われる論点です。性能や価格より先に、データの所在と準拠法を確かめないと採用判断は動きません。立場をはっきりさせて整理します。

データの所在と中国法：API利用と自己ホストで変わるリスク

論点はモデルの良し悪しではなく、利用経路です。Z.aiのクラウドAPIを使う場合、やり取りするデータは中国の法域に置かれ、現地の法令の対象になります。一方、MITライセンスの重みを自社環境に落として動かす自己ホストでは、この準拠法の問題は基本的に外れます。同じGLM-5.2でも、入口が違えばデータガバナンス上の意味はまったく別物になる、という点を最初に分けてください。

さらに、Z.aiはGLM-5.2の学習データや出力モデレーションの詳細を網羅的には公開していません。中国国内のAIサービスには規制由来の出力制約が存在しますが、自己ホストしたオープンウェイトでそれがどう作用するかは運用設定によって変わります。特定の話題での挙動が業務に影響する用途なら、自分の環境で実際に確かめるのが確実です。

学習データ非開示とサプライチェーン：オープンウェイトを監査して使う前提

オープンウェイトは「提供元の記録に残らずに動かせる」自由と引き換えに、利用側が責任を負う構造です。第三者が配布する量子化版やGGUF、推論コードを無検証で本番に載せれば、それ自体がサプライチェーンの侵入経路になり得ます。実際、開発エコシステムではnpmのサプライチェーン攻撃（Shai-Hulud）のように、配布物経由で被害が広がった事例が繰り返し起きています。

GLM-5.2については、ソフトウェアの脆弱性発見ベンチマークで商用最上位級に並ぶ、という独立評価も報じられており、能力の高さ自体が攻守両面で使えることへの懸念につながっています。だからこそ、入手元の検証・重みのハッシュ確認・隔離環境での評価といった「監査して使う」運用を前提に置くべきモデルです。

採用してよい場面と、採用すべきでない場面の具体的な線引き

玉虫色を避けて言い切ります。採用してよいのは次のような場面です。公開情報や社内の非機密コードを対象にしたコード生成・大規模リファクタリング・長文ドキュメントの一括レビューなど、データの機微度が低く、コストとスループットが効く工程。ここではGLM-5.2の安さと1M文脈が素直に効きます。

逆に、採用すべきでない場面もはっきりしています。個人情報・顧客データ・未公開の機密情報を、Z.aiのクラウドAPIにそのまま投入する使い方は避けるべきです。データが中国の法域に渡るうえ、学習データやモデレーションの不透明さを自社で説明しきれないためです。官公庁・金融・医療など準拠法やデータ越境に厳しい領域で、自己ホストの統制を用意せずにAPIだけで進めるのも、この時点では時期尚早と判断するのが妥当です。要するに、機密データはAPIに乗せない・統制できない経路では使わない。この2点を守れる範囲が、現実的な採用ラインになります。

中国AI「GLM-5.2」に関するよくある質問

GLM-5.2の導入を検討する際に、検索で多く見られる疑問をまとめました。

GLM-5.2は無料で使えますか？

モデルの重みはMITライセンスで公開されているため、自分でダウンロードして自社環境で動かす分には、ライセンス料の意味では無料です。ただし約750B級を動かすには高性能なGPU基盤が必要で、運用コストは小さくありません。手軽に試すなら、月額18ドルからのGLM Coding PlanかAPI従量課金が現実的な入口です。「オープンウェイト＝タダで気軽に動く」とイコールではない点に注意してください。

GLM-5.2はClaude Codeで使えますか？

使えます。Z.aiがAnthropic互換のエンドポイントを提供しているため、Claude Codeの接続先をZ.aiのエンドポイントに差し替え、モデル名にglm-5.2を指定すれば、バックエンドをGLM-5.2に切り替えられます。Cline・OpenCodeなど主要なエージェントツールにもリリース初日から対応しています。

GLM-5.2とDeepSeekやGPT-5.5、Claudeでは性能はどちらが上ですか？

コーディング系の公称ベンチマークでは、GLM-5.2はGPT-5.5を上回る数値を示し、Claude Opus 4.8には僅差まで迫りました。オープンウェイト陣営ではDeepSeek V4 ProやKimi K2.6を上回り、現状トップクラスです。ただしこれらはベンダー公称や第三者集計が中心で、独立した横並び検証はまだ限定的です。最終的な優劣は自社タスクでの実測で確かめるのが確実です。

GLM-5.2は自分のPCで動かせますか？

一般的なノートPCやデスクトップでは、ほぼ動きません。約750B級のモデルはFP8でも重みだけで約750GB、量子化しても最小で200GB超を要し、複数GPU構成が前提になります。家庭用GPUのVRAM（16〜32GB程度）とは桁が違うため、個人で動かすより、API・Coding Plan・Ollamaのクラウド経由といったホスト型を使うのが現実的です。

中国製のGLM-5.2を業務で使っても情報セキュリティ上問題ないですか？

利用経路で答えが変わります。Z.aiのクラウドAPIを使う場合、データは中国の法域に渡るため、機密情報や個人情報をそのまま投入するのは避けるべきです。一方、MITの重みを自社環境で自己ホストすれば準拠法の問題は基本的に外れますが、学習データ非開示や配布物のサプライチェーンリスクは残ります。公開情報や非機密コードを対象に、監査して使う前提であれば、業務利用は十分に検討できます。

Claude Opus 4.5とは？Anthropicの最新モデル概要とできること：GLM-5.2の比較基準となる商用フロンティア側の実力を把握できます。
Azure OpenAI Serviceとは？OpenAI APIとの違い：企業がLLMをAPIで安全に利用する際の選択肢として、併用設計の参考になります。

資料請求