Mythos Previewを知りたい開発者が押さえるべき基本情報と位置づけ
目次
Mythos Previewを知りたい開発者が押さえるべき基本情報と位置づけ
2026年4月、Anthropicは同社史上もっとも高性能なフロンティアモデル「Claude Mythos Preview」を発表しました。一般公開ではなく、限定的なパートナー企業への提供という異例の形式で登場したこのモデルは、サイバーセキュリティ分野での防御利用を主目的としています。ソフトウェアの脆弱性発見能力がきわめて高く、主要OSやブラウザすべてにおいて深刻度の高い未知の欠陥を検出した実績が公表されました。ここではまず、Mythos Previewとは何なのかという基本的な情報を整理し、Anthropic製品ラインナップにおける位置づけを明らかにします。
Opus上位の新階層「Mythos」が示す製品戦略上の転換点
Anthropicはこれまで、各モデルをOpus(最大・最高性能)、Sonnet(中間)、Haiku(軽量・高速)の3階層で展開してきました。Mythosはこの階層の上に新設されたティアであり、Opusよりもさらに大規模かつ高性能なモデルとして位置づけられています。社内の開発ドキュメントでは「Capybara」というコードネームも使用されており、Opusを超える新しいモデル区分であることが明示されていました。
この階層追加は単なるスペック向上にとどまらず、Anthropicの製品戦略そのものの転換を意味します。従来はOpusが最上位として企業向けの高度なタスクを担っていましたが、Mythosクラスの登場により、特定の用途では専用のリリース管理とアクセス制御が必要になるほど能力が高まったことを示しています。フロンティアモデルが持つデュアルユース性──防御にも攻撃にも使える性質──に対して、段階的かつ慎重な提供方針を取る必要があるとAnthropicは判断しました。
2026年3月のデータ流出で判明したCapybaraコードネームとMythosの開発経緯
Mythos Previewの存在が初めて広く知られたのは、2026年3月下旬に起きたデータ流出がきっかけでした。Anthropicのコンテンツ管理システムに設定ミスがあり、公開準備中のブログ記事草稿が外部からアクセス可能な状態になっていたのです。Fortuneやセキュリティ研究者がこの情報を確認し、「Capybara」というコードネームで開発が進められていた新モデルの存在が明るみに出ました。
流出した草稿には、Capybaraが「これまでに開発した中でもっとも強力なAIモデル」であること、サイバーセキュリティ上のリスクを考慮して慎重なリリースを計画していることなどが記載されていました。Anthropicはこの流出を受けて公式にモデルの存在を認め、テスト段階にあることを説明しています。結果的に、この想定外の情報公開が正式発表を前倒しする一因となり、2026年4月7日のProject Glasswing発表につながったとみられています。
汎用フロンティアモデルでありながら一般非公開という異例のリリース形態の背景
Claude Mythos Previewは汎用モデルであり、サイバーセキュリティ専用に訓練されたわけではありません。しかし、コーディングと推論の能力が飛躍的に向上した結果、ソフトウェアの脆弱性発見と悪用においてほとんどの人間の専門家を上回る水準に到達しました。この能力が攻撃者の手に渡った場合のリスクを考慮し、Anthropicは一般公開を見送るという判断を下しています。
Anthropicのフロンティアレッドチーム・サイバーリードであるNewton Cheng氏は、「サイバーセキュリティ能力を理由に、一般提供の予定はない」と明言しました。代わりに、防御側が先にこの能力を活用できるよう、限定的なパートナーシップを通じて提供する方針が採られています。フロンティアAIの能力が攻撃に転用されるリスクに対して、防御側に時間的優位を与えるという考え方は、AI安全性を標榜するAnthropicならではのアプローチといえるでしょう。
API価格が入力25ドル・出力125ドルに設定された料金体系とOpus 4.6との費用差
Project Glasswingの参加組織には最大1億ドル分のAPI利用クレジットが提供されますが、クレジット消化後の料金は入力100万トークンあたり25ドル、出力100万トークンあたり125ドルと設定されています。これはAnthropicの既存モデルと比較してもかなり高額な価格帯であり、Mythosクラスの計算コストの大きさを反映した設定です。
現行のClaude Opus 4.6と比べると、Mythos Previewの料金は大幅に上回ります。ただし、脆弱性スキャンのように高い精度が求められるタスクでは、安価なモデルを何度も実行するよりも一度の高精度な分析のほうが費用対効果に優れる場合があります。とりわけゼロデイ脆弱性の発見は見逃しのコストが甚大であるため、料金単体ではなく発見精度とセットで評価する必要があるでしょう。利用を検討する組織にとっては、まずクレジット枠内での検証を行い、費用対効果を実測することが現実的な第一歩となります。
Bedrock・Vertex AI・Foundryの3基盤提供と利用条件
Mythos Previewは、Anthropic自身のClaude APIに加えて、Amazon Bedrock、Google CloudのVertex AI、Microsoft Foundryという3つのクラウドプラットフォームからもアクセス可能です。Google Cloudは公式ブログでプライベートプレビューとしての提供を発表しており、既存のVertex AIユーザーが自社環境内でモデルを利用できる体制を整えています。
この3プラットフォーム同時提供は、Project Glasswingのパートナー企業がそれぞれ異なるクラウド基盤を採用している現実を踏まえたものです。AWSを主力とする企業はBedrock経由で、Google Cloud環境の企業はVertex AI経由で、Microsoft環境の企業はFoundry経由でアクセスできるため、既存のセキュリティポリシーやデータガバナンスの枠組みを変更せずにMythosを導入できます。ただし、いずれのプラットフォームでも利用にはProject Glasswingへの参加承認が前提であり、一般のクラウドユーザーが自由にアクセスできるわけではありません。
SWE-bench Pro 77.8%が示すMythos Previewのコーディング性能
Claude Mythos Previewが注目を集める大きな理由の一つが、ソフトウェアエンジニアリング分野のベンチマークにおける圧倒的なスコアです。従来の最高性能モデルであったClaude Opus 4.6を大幅に上回り、公開されているどのモデルよりも高い数値を記録しています。ここではSWE-benchシリーズを中心に、コーディング性能の詳細を数値とともに確認していきます。
Verified 93.9%とPro 77.8%がOpusを大幅に引き離す実測値
Mythos PreviewはSWE-bench Verifiedで93.9%、SWE-bench Proで77.8%を記録しました。Opus 4.6のスコアはそれぞれ80.8%と53.4%であり、Verifiedでは13.1ポイント、Proでは24.4ポイントもの差がついています。SWE-bench Proは実際のソフトウェアエンジニアリングタスクの中でも特に難易度の高い問題セットであり、ここでの24ポイント以上の差は質的な能力の飛躍を意味します。
参考として、SWE-bench Proにおける他社モデルの公開スコアを見ると、Gemini 3.1 Pro登場時点でのリーダーであったGPT-5.3-Codexが56.8%でした。Mythos Previewの77.8%はこれを21ポイント以上上回っており、現行の公開モデルとは世代が異なるレベルの性能といえます。SWE-bench Verifiedの93.9%に至っては、公開モデルの最高スコアを13ポイント以上引き離す数値であり、もし一般公開されればリーダーボード全体が塗り替えられる水準です。
Terminal-Bench 2.0で82.0%を記録したエージェント型の実行精度
Terminal-Bench 2.0はエージェントがターミナル操作を通じて実際のソフトウェア開発タスクを遂行する能力を測定するベンチマークです。Mythos Previewは82.0%を記録し、Opus 4.6の65.4%を16.6ポイント上回りました。この評価では、Terminus-2ハーネスを使用し、適応的思考を最大努力レベルに設定、タスクあたり100万トークンの予算が割り当てられています。
さらに注目すべきは、タイムアウト制限を4時間に延長しTerminal-Bench 2.1のアップデートを適用した場合に、Mythos Previewのスコアが92.1%まで上昇した点です。これは、十分な計算リソースと時間を与えれば、ほぼすべてのターミナル操作タスクを遂行できることを示唆しています。エージェント型コーディングの実用性を考えると、この結果はCI/CDパイプラインへの統合やインフラ自動化といった分野での活用可能性を強く示すものといえるでしょう。
Multimodal 59.0%が従来比2倍超となったコード理解力
SWE-bench Multimodalは、テキストだけでなくスクリーンショットやUI画像などの視覚情報を含むソフトウェアエンジニアリングタスクを評価するベンチマークです。Mythos Previewは59.0%を記録し、Opus 4.6の27.1%に対して2倍以上のスコアを達成しました。Anthropicは内部実装を使用したと明記しており、公開リーダーボードのスコアとは直接比較できない点には留意が必要です。
とはいえ、27.1%から59.0%への飛躍は、マルチモーダル入力を伴うコーディングタスクにおいて質的な変化が起きたことを意味します。たとえば、バグ報告に添付されたスクリーンショットを読み取ってコードの修正箇所を特定する、UIデザインのモックアップから実装コードを生成するといったタスクで、従来モデルでは困難だった精度が実現可能になったと考えられます。フロントエンド開発やQAプロセスへの応用が見込まれる領域です。
Multilingual 87.3%に見る多言語プログラミング対応の限界
SWE-bench Multilingualは、Python以外のプログラミング言語を含むソフトウェアエンジニアリングタスクを評価します。Mythos Previewは87.3%を記録し、Opus 4.6の77.8%を9.5ポイント上回りました。複数言語への対応力が高いことは、実務環境でのポリグロットなコードベースの保守やレビューにおいて大きな利点となります。
ただし、9.5ポイントという差はSWE-bench ProやVerifiedほど大きくはありません。多言語対応については、各言語の訓練データ量やベンチマークの言語構成比による影響を考慮する必要があります。特定のマイナー言語やドメイン固有言語においては、依然として精度にばらつきがある可能性も否定できません。多言語コードベースへの適用を検討する場合は、対象言語での精度を個別に検証することが推奨されます。実務的には、JavaやTypeScript、Go、Rustといった主要言語であれば高い精度が期待できる一方、Haskellやエルランなどのニッチな言語では注意深い検証が欠かせないでしょう。
メモライゼーション疑惑への対処とベンチマーク信頼性を左右するスクリーニング手法
高スコアを記録したモデルに対しては、ベンチマーク問題を訓練データとして記憶(メモライゼーション)しているのではないかという疑念が常に付きまといます。Anthropicはこの懸念に対して明確な対処方針を示しており、SWE-bench Verified・Pro・Multilingualの各評価においてメモライゼーションスクリーニングを実施したことを公表しています。
具体的には、記憶の兆候が検出された問題のサブセットを除外した場合でも、Opus 4.6に対するMythos Previewの改善幅は維持されるとの報告がなされました。一方、Humanity’s Last Examについては、低い推論努力レベルでも高いスコアを維持する傾向があり、一定のメモライゼーションが存在する可能性をAnthropic自身が認めています。ベンチマークスコアを絶対的な指標として扱うのではなく、複数の評価を横断的に確認し、実際のタスクでの検証結果と照合する姿勢が利用者には求められるでしょう。
数千件のゼロデイ脆弱性を発見したサイバーセキュリティ能力と実証事例の詳細
Claude Mythos Previewがもっとも大きなインパクトを示したのが、サイバーセキュリティ分野での脆弱性発見能力です。Anthropicは、このモデルを使用してすべての主要OSと主要ブラウザを含む幅広いソフトウェアから、数千件のゼロデイ脆弱性を検出したと公表しました。ここでは公開されている具体的な事例とともに、その検出能力の実態を掘り下げます。
OpenBSDで27年間残存した脆弱性をリモートから再現した発見プロセスの具体例
もっとも象徴的な事例が、OpenBSDにおける27年間未発見だった脆弱性の検出です。OpenBSDはセキュリティ強化を最優先に設計されたOSとして知られ、ファイアウォールやクリティカルなインフラの運用に広く利用されています。そのOpenBSDにおいて、リモートから接続するだけでマシンをクラッシュさせることが可能な脆弱性をMythos Previewが発見しました。
27年間にわたって人間のセキュリティ専門家によるレビューをすり抜けてきたという事実は、AIモデルのコード解析能力が人間とは異なるアプローチで脆弱性を捉えることを示しています。Mythosはこの脆弱性を人間の介入なしに自律的に発見しており、パターンマッチングではなくコードの意味的な理解に基づいた推論が行われたと推測されます。従来のセキュリティ監査では見落とされがちなネットワークプロトコル処理部分の微妙な不整合を、モデルが論理的に追跡できた点が画期的でした。この脆弱性はすでにOpenBSDのメンテナーに報告され、パッチが適用済みとなっています。
FFmpegの16年物バグを500万回の自動テストが見逃した理由とMythosの検出手法
FFmpegは動画のエンコード・デコードを担うオープンソースライブラリであり、膨大な数のアプリケーションやサービスに組み込まれています。Mythos Previewは、このFFmpegのコード内に16年間潜んでいた脆弱性を発見しました。特筆すべきは、問題のあるコード行に対して自動テストツールが500万回以上の実行を行っていたにもかかわらず、一度も問題を検出できなかった点です。
従来の自動テストツール、とりわけファジングと呼ばれる手法は、ランダムな入力データを大量に生成してソフトウェアの異常動作を誘発する方式です。しかし、特定の条件の組み合わせでのみ発現するバグは、ランダム生成では到達しにくい入力空間に存在する場合があります。Mythosはコード全体の論理構造を理解したうえで脆弱性の発現条件を推論できるため、従来型のテストが苦手とするエッジケースを検出できたと考えられます。この事例は、AI支援型のコード解析が既存のセキュリティテストを補完する有力な手段であることを実証しました。
Linuxカーネルの複数脆弱性を連鎖させてroot権限を奪取した自律的エクスプロイト
Mythos Previewは、Linuxカーネルにおいて複数の脆弱性を自律的に発見し、それらを連鎖(チェーン)させることで、通常のユーザー権限からroot権限への昇格を実現するエクスプロイトを構築しました。単一の脆弱性を見つけるだけでなく、複数の問題を組み合わせて実際に悪用可能な攻撃シナリオを構成した点が、このモデルの能力の高さを端的に示しています。
権限昇格の脆弱性チェーンは、実際のサイバー攻撃において頻繁に使用される手法です。攻撃者はまず低権限のアクセスを獲得し、そこから複数の脆弱性を順番に利用してシステム全体の制御を奪います。Mythosがこのプロセスを人間の介入なしに自律的に遂行できたという事実は、防御側にとっての有用性と同時に、攻撃利用された場合のリスクの大きさも浮き彫りにしています。Linuxカーネルは世界のサーバーの大部分で稼働しているため、この発見のインパクトはきわめて広範です。
CyberGym 83.1%がOpus 66.6%を超えた脆弱性再現能力
CyberGymは、AIエージェントの脆弱性分析タスクにおける能力を定量的に評価するベンチマークです。Mythos PreviewはCyberGymで83.1%を記録し、Opus 4.6の66.6%を16.5ポイント上回りました。この差は、コーディングベンチマークでの改善幅と同等かそれ以上であり、サイバーセキュリティ特化型の能力が汎用的な推論能力の向上と連動して大きく伸びたことを示しています。
CyberGymは脆弱性の発見だけでなく、再現(リプロダクション)の精度も評価対象に含めた設計です。脆弱性を見つけるだけでなく、それが実際に悪用可能であるかを検証するプロセスまで含めた評価であり、実戦的な防御能力の指標として高い信頼性を持っています。MicrosoftもCTI-REALMという独自のセキュリティベンチマークで検証を実施し、従来モデルに対する大幅な改善が確認されたと発表しました。複数の独立した評価軸で一貫して高い性能が確認されている点は、能力の確からしさを裏づける重要な根拠といえるでしょう。
主要OS・ブラウザすべてで高深刻度の脆弱性を検出した網羅的スキャンの成果と報告体制
Anthropicは、Mythos Previewがすべての主要OSとすべての主要ブラウザにおいて高深刻度の脆弱性を発見したと発表しています。「数千件」のゼロデイ脆弱性という数字は、個別プロジェクトの脆弱性発見としてはかつてない規模であり、AIモデルによるコード解析のスケーラビリティを実証するものです。
脆弱性の報告体制についても注目すべき点があります。修正済みの脆弱性については、Anthropicのフロンティアレッドチームブログで技術的な詳細が公開されています。一方、修正が完了していない脆弱性については、詳細情報の暗号ハッシュのみを現時点で公開し、パッチ適用後に具体的な内容を開示する方針です。大量の脆弱性報告がオープンソースメンテナーに集中すると、無償で活動するボランティアに過大な負担がかかるという批判もあります。報告の優先順位付けとサポート体制の整備が今後の課題となることは間違いありません。Anthropicがこの問題にどう対処していくかは、AI支援型セキュリティの持続可能性を左右する重要な論点といえるでしょう。
Project Glasswingの仕組みと12社パートナー体制の狙い
Claude Mythos Previewの提供基盤となるのが、Project Glasswingと名づけられた大規模な防御セキュリティイニシアティブです。テクノロジー企業と金融機関を含む12のローンチパートナーが参画し、さらに40以上の追加組織がアクセス権を得ています。ここでは、このプロジェクトの具体的な構造と各パートナーの役割を整理していきましょう。
1億ドルのAPI利用クレジットとOSS団体への400万ドル寄付で構築する防御エコシステム
Project GlasswingにおけるAnthropicの資金コミットメントは、最大1億ドルのMythos Preview API利用クレジットと、OSS関連団体への400万ドルの直接寄付の2本柱で構成されています。1億ドルのクレジットはProject Glasswingのパートナーおよび追加参加組織全体に配分され、リサーチプレビュー期間中の相当量の利用をカバーする見込みです。
400万ドルの寄付の内訳は、Linux Foundationを通じたAlpha-OmegaおよびOpenSSFへの250万ドルと、Apache Software Foundationへの150万ドルです。Alpha-Omegaはオープンソースソフトウェアのセキュリティ改善を目的としたプロジェクトであり、OpenSSFはオープンソースのサプライチェーンセキュリティ強化を推進する団体として知られています。これらの資金提供は、脆弱性が発見された後にメンテナーが実際にパッチを作成・適用するための実務的なリソースを確保する狙いがあります。発見だけでなく修正までを支援する一貫した体制構築が、このエコシステムの要です。
CrowdStrike・Palo Alto等が担うセキュリティ専業企業の役割
Project Glasswingの12社のローンチパートナーには、CrowdStrike、Palo Alto Networks、Ciscoというセキュリティ分野の大手企業が名を連ねています。それぞれがエンドポイント防御、ネットワークセキュリティ、インフラセキュリティという異なる領域をカバーしており、Mythos Previewの能力を多角的に検証・活用する体制が整っています。
CrowdStrikeのCTO、Elia Zaitsev氏は、脆弱性が発見されてから悪用されるまでの時間が劇的に短縮されている現状に言及し、防御側がAIの能力を活用して先手を打つ必要性を強調しました。Palo Alto NetworksのCPTO、Lee Klarich氏は、Mythos Previewが従来モデルでは見逃されていた複雑な脆弱性の特定に成功したと述べています。CiscoのSVP兼Chief Security & Trust OfficerであるAnthony Grieco氏は、AIがインフラ防御の緊急性を根本的に変えたという認識を示しました。各社がそれぞれの顧客基盤と専門知識を持ち寄ることで、発見された脆弱性への対応スピードと網羅性を高める構造が意図されています。
Linux FoundationとApacheへの資金拠出が狙うOSS保守の底上げ
オープンソースソフトウェアは現代のソフトウェアスタックの大部分を構成しており、AIエージェントが新しいコードを書く際にもOSSが基盤として使われています。しかし、その保守を担うメンテナーの多くは無償のボランティアであり、セキュリティ専門家を雇う余裕のあるメンテナーはごく一部に限られているのが実情です。Linux Foundation CEOのJim Zemlin氏は、セキュリティ専門知識が大企業だけの特権であった状況を変える必要性を訴えています。
Alpha-OmegaとOpenSSFへの250万ドルの寄付は、特にクリティカルなOSSプロジェクトに対するセキュリティ監査と脆弱性修正のリソースを提供する目的です。Apache Software Foundationへの150万ドルは、Apacheプロジェクト群──HTTP Server、Kafka、Sparkなど世界規模で利用されるソフトウェア群──のセキュリティ対応を支援します。AI支援型のセキュリティがすべてのメンテナーにとってのツールとなることで、大企業と小規模プロジェクトの間に存在するセキュリティ格差を縮小する道筋が見えてきます。
JPMorganChaseの参画に見る金融インフラ防御の優先順位
テクノロジー企業が中心のパートナーリストの中で、金融機関として唯一名前が挙がっているのがJPMorganChaseです。同社のCISOであるPat Opet氏は、金融システムのサイバーセキュリティとレジリエンスの推進が同社のミッションの中核にあると述べ、次世代AI技術を防御目的で評価する機会としてProject Glasswingへの参加を位置づけています。
金融インフラは、サイバー攻撃の標的として常に上位に位置するセクターです。銀行システムの脆弱性が悪用された場合の経済的・社会的影響は甚大であり、独自の厳格な規制要件も存在します。JPMorganChaseの参画は、Mythos Previewの脆弱性発見能力が金融セクター固有のソフトウェアスタックにも有効かどうかを検証するテストケースとなります。同社は「厳格で独立したアプローチ」で評価を進めると表明しており、金融業界全体への展開可否を判断するための先行事例として注視されるでしょう。
90日以内の公開レポート義務と脆弱性開示プロセス標準化に向けたロードマップ
Project Glasswingには、成果の透明性を確保するための具体的なコミットメントが含まれています。Anthropicは発表から90日以内に、プロジェクトで得られた知見、修正された脆弱性、開示可能な改善内容について公開レポートを発行すると明言しました。パートナー企業も可能な範囲で情報とベストプラクティスを相互に共有する方針です。
さらに長期的には、セキュリティの主要組織と協力して、AI時代におけるセキュリティ実務の推奨事項をまとめる計画が示されています。具体的な対象領域としては、脆弱性開示プロセス、ソフトウェアアップデートプロセス、OSSとサプライチェーンのセキュリティ、セキュア・バイ・デザインの開発ライフサイクル、規制業界向け標準、トリアージの自動化、パッチ適用の自動化が挙げられています。中長期的には、官民を横断する第三者機関が大規模なサイバーセキュリティプロジェクトの推進主体となる可能性にも言及されており、Project Glasswingはそのための起点と位置づけられました。
Claude Opus 4.6との性能差を数値で比較して見えるMythos世代の技術的飛躍
コーディングベンチマークに加えて、Claude Mythos Previewは推論能力やエージェント操作といった幅広い領域でもOpus 4.6を上回るスコアを記録しています。ここではコーディング以外の主要ベンチマーク結果を横断的に比較し、Mythosクラスのモデルがどの程度の技術的飛躍を実現したのかを具体的に確認していきましょう。
GPQA Diamond 94.6%対91.3%に表れる大学院レベル科学推論の精度向上幅
GPQA Diamondは物理学・化学・生物学を対象とした大学院レベルの科学的推論能力を測定するベンチマークです。Mythos Previewは94.6%、Opus 4.6は91.3%を記録しました。差は3.3ポイントと数字上はわずかに見えますが、GPQA Diamondは上位スコア帯での改善に指数関数的な難度の上昇を伴う設計となっているため、この差は見かけ以上に大きな能力差を反映しています。
Opus 4.6の時点でGemini 3 Proを上回るスコアを出していたことを考えると、Mythos Previewは科学推論においても業界最高水準をさらに押し上げたといえます。研究機関での論文分析、製薬企業での化合物スクリーニング支援、教育機関での高度な質問応答など、専門性の高い科学的タスクにおいてMythosクラスの精度が求められる場面は少なくありません。GPQA Diamondでの高スコアは、こうした分野での実用性を裏づける材料の一つとなります。
HLE 56.8%がOpus 40.0%を大幅に上回る未解決問題への対応力
Humanity’s Last Examは、現行のAIモデルでは解けないように設計された超高難度のベンチマークです。Mythos Previewはツールなしの条件で56.8%を記録し、同条件のOpus 4.6(40.0%)を16.8ポイント上回りました。ツールを使用した条件ではさらにスコアが伸び、Mythos Previewが64.7%、Opus 4.6が53.1%という結果でした。
ツールなし条件のスコアは、外部検索やコード実行に頼らない純粋な推論能力を反映しているため、モデルの基礎的な知的能力の指標としてより信頼性が高いとされています。ただし、前述のとおりAnthropicはMythosが低い推論努力レベルでもHLEで高スコアを維持する傾向を認めており、メモライゼーションの可能性を排除していません。このベンチマーク単体での判断は避け、他の評価結果と総合して能力を評価することが望ましいでしょう。それでもなお、16.8ポイントという改善幅は、モデルの基礎的な推論力が大幅に強化されたことを裏づける有力な根拠の一つです。
BrowseComp 86.9%を約5分の1のトークンで達成した推論効率
BrowseCompはウェブブラウジングタスクにおけるAIエージェントの能力を評価するベンチマークで、Mythos Previewは86.9%、Opus 4.6は83.7%を記録しました。スコア差は3.2ポイントにとどまりますが、注目すべきはトークン消費量の違いです。Mythos PreviewはOpus 4.6の4.9分の1のトークン量で同等以上の成果を達成しています。
トークン消費量の削減は、実運用におけるコスト効率に直結します。Mythos Previewの入出力単価は高く設定されていますが、同じタスクに必要なトークン量が大幅に少なければ、結果的にタスクあたりの総コストは低下し得るでしょう。さらに、少ないトークンで高精度な結果を出せるということは、推論の効率が構造的に改善されたことを意味しており、単なるモデルの大規模化では説明できない質的な進歩が起きていることを示唆しています。ウェブ情報の収集・分析を伴うセキュリティ調査やOSINT(公開情報諜報)のタスクにおいても、この効率性の改善は大きな実務的メリットをもたらすと考えられるでしょう。
OSWorld 79.6%対72.7%に見るデスクトップ操作性能の進化
OSWorld-Verifiedは、デスクトップ環境でのGUI操作をAIエージェントがどの程度正確に遂行できるかを評価するベンチマークです。Mythos Previewは79.6%、Opus 4.6は72.7%で、6.9ポイントの差が確認されました。ファイル操作、アプリケーションの設定変更、ブラウザでの情報収集といったタスクが含まれており、実際のPC操作を模した環境での性能を測定しています。
79.6%というスコアは、デスクトップ操作タスクの約8割を正確に完了できることを意味します。RPA(ロボティック・プロセス・オートメーション)の高度化や、ITヘルプデスクの自動化といった分野での実用性が見込まれる水準です。特にサイバーセキュリティの文脈では、侵入テストの一部工程をエージェントに委譲する際の基盤能力として、デスクトップ操作スキルが必要になる場面があります。Mythos Previewの総合的なエージェント能力の高さは、こうした複合的なセキュリティタスクへの適用可能性を広げています。
コーディング・推論・エージェント3領域を横断した総合性能がもたらす実務インパクト
Mythos Previewの特徴は、単一領域での改善ではなく、コーディング・科学推論・エージェント操作という3つの主要領域すべてで一貫した性能向上を実現していることでしょう。以下の表は、各ベンチマークにおけるMythos PreviewとOpus 4.6のスコアをまとめたものです。
| 評価領域 | ベンチマーク | Mythos Preview | Opus 4.6 | 差分 |
|---|---|---|---|---|
| コーディング | SWE-bench Verified | 93.9% | 80.8% | +13.1 |
| コーディング | SWE-bench Pro | 77.8% | 53.4% | +24.4 |
| サイバーセキュリティ | CyberGym | 83.1% | 66.6% | +16.5 |
| 科学推論 | GPQA Diamond | 94.6% | 91.3% | +3.3 |
| 総合推論 | HLE(ツールなし) | 56.8% | 40.0% | +16.8 |
| エージェント | BrowseComp | 86.9% | 83.7% | +3.2 |
| エージェント | OSWorld-Verified | 79.6% | 72.7% | +6.9 |
すべての領域でOpus 4.6を上回っており、特にコーディングとサイバーセキュリティでの改善幅が突出しています。これは、Mythosクラスのモデルが一般提供された場合に、ソフトウェア開発・セキュリティ監査・研究支援といった幅広い業務で既存のワークフローに質的な変化をもたらす可能性を示しています。ただし、現時点では限定アクセスにとどまるため、実務への影響は今後のリリース判断に左右されるでしょう。
一般公開されない理由と今後のMythosクラスモデル展開を左右するセーフガード戦略
Claude Mythos Previewはきわめて高い性能を持ちながら、一般公開の予定がないと明言されています。その背景には、サイバーセキュリティ能力のデュアルユース性への懸念と、安全な展開を可能にするためのセーフガード開発の必要性があります。ここでは、非公開の理由と今後の展開戦略について掘り下げていきましょう。
攻撃側への能力拡散を防ぐため防御側に先行アクセスを与える段階的リリースの論理
Anthropicが採用している戦略は、防御側に先行アクセスを与えることで時間的な優位を確保し、攻撃者が同等の能力を入手する前にインフラの脆弱性を修正するというものです。AIモデルのサイバーセキュリティ能力は防御にも攻撃にも使えるため、一般公開すれば攻撃者にも同じツールが渡ることになります。
Anthropicはこの構造を「防御側の持続的な優位を確立する」ための施策と位置づけています。CrowdStrikeのZaitsev氏は、脆弱性の発見から悪用までの時間がかつて数か月だったものが分単位に短縮されている現状を指摘し、防御側が先に動く必要性を強調しました。Mythosクラスの能力が広く拡散する前に、できるだけ多くの重大な脆弱性を発見・修正しておくという考え方は合理的です。ただし、この時間的優位がどの程度持続するかは、他のAI開発企業のモデル性能の進歩速度に依存するため、恒久的な解決策ではないことも認識しておく必要があります。
次期Claude Opusモデルで導入予定のサイバーセキュリティ用セーフガードの設計方針
Anthropicは、Mythosクラスのモデルを将来的に安全に展開するために、まず次期Claude Opusモデルにサイバーセキュリティ用の新しいセーフガードを導入する計画です。Mythos Previewほどのリスクを伴わないOpusレベルのモデルでセーフガードの有効性を検証し、改良を重ねたうえでMythosクラスの展開に備えるという段階的なアプローチを取っています。
具体的なセーフガードの内容は現時点で詳細が公開されていませんが、モデルの最も危険な出力──たとえば特定のエクスプロイトコードの生成や、攻撃手順の詳細な説明──を検出してブロックする仕組みが含まれると考えられます。セキュリティ業務では攻撃手法の理解が防御に不可欠であるため、正当な防御目的の利用と悪意ある利用をどう区別するかが設計上の最大の課題になるでしょう。この課題への対処方法が、Mythosクラスの一般提供時期を左右する重要な要素です。
Cyber Verification Programによる専門家向けアクセス制御
Anthropicは、セーフガード導入後に正当なセキュリティ専門家が業務に支障なくモデルを使えるよう、Cyber Verification Programの立ち上げを予告しています。セーフガードがセキュリティ研究者の正当な作業を妨げる可能性があるため、身元と目的が確認された専門家に対しては制限を緩和する仕組みが必要になります。
この種の段階的アクセス制御は、AIモデルの安全な展開における新しい試みです。従来のAIモデルは一律に公開されるか、API経由で利用規約に基づいて提供されるかのいずれかでしたが、ユーザーの資格や用途に応じてアクセスレベルを変えるという方式は、セキュリティツールの配布管理に近いアプローチです。プログラムの具体的な申請条件や審査プロセスは未発表ですが、セキュリティ業界の認定資格や組織の所属確認などが基準に含まれる可能性が考えられます。CISSP、OSCP、GPEN等の業界標準資格を持つ研究者や、CVEの発行実績があるセキュリティチームにとっては、早期のアクセス取得が期待できるでしょう。
米国政府との協議が示唆するAIモデルの国家安全保障上の位置づけと輸出管理の方向性
Anthropicは米国政府関係者とMythos Previewの攻撃的・防御的サイバー能力について継続的な協議を行っていることを公表しています。クリティカルインフラの防御は民主主義国家の最優先事項であり、AIモデルのサイバー能力の出現は国家安全保障上の新たな論点を生み出しています。
この協議の具体的な内容は明らかにされていないものの、いくつかの方向性が推測できるでしょう。第一に、Mythosクラスのモデルへのアクセスを同盟国の防御機関にも拡大するかどうかという検討です。第二に、同等の能力を持つモデルが敵対的な国家や非国家主体に渡ることを防ぐための輸出管理の枠組みの議論です。第三に、政府機関自身がMythosクラスのモデルを防御目的で利用する際の運用基準をどう策定するかという課題も浮上しています。AI技術が国家間の戦略的資産となりつつある中で、Mythos Previewは民間企業が開発した技術と国家安全保障政策の接点を象徴する存在となっています。
Responsible Scaling Policyに基づく公開判断プロセス
Anthropicは自社のResponsible Scaling Policy(RSP)に基づいて、モデルの能力がもたらすリスクを段階的に評価し、適切な安全対策を講じたうえでリリースする方針です。Mythos Previewの非公開判断も、RSPの枠組みに基づく評価の結果として位置づけられました。
RSPでは、モデルの能力が特定の閾値を超えた場合に追加の安全対策が求められるという段階的な基準が定められています。サイバーセキュリティ能力に関しては、脆弱性の発見率、エクスプロイトの自律構築能力、既存の防御策の回避能力といった指標が評価対象になっているとみられるでしょう。Mythosクラスの一般公開が実現するかどうかは、これらの能力に対して十分なセーフガードが開発・検証されるかにかかっているといえるでしょう。Anthropicの公表文書では「最終的にはMythosクラスのモデルを安全に大規模展開することが目標」と明記されており、完全な封印ではなく条件付きの段階的開放を目指していることがわかります。
セキュリティ担当者がMythos Preview活用へ今すぐ準備すべきこと
現時点ではClaude Mythos Previewへのアクセスは限定的ですが、Project Glasswingの成果は90日以内に公開される予定であり、AI支援型のセキュリティ対策は今後急速に広がることが見込まれます。ここでは、セキュリティ担当者やオープンソース開発者が今のうちに準備しておくべき具体的なアクションを整理していきましょう。
40組織以上が追加アクセスを得た申請経路とOSSプログラムの条件
Project Glasswingの12社のローンチパートナー以外にも、クリティカルなソフトウェアを開発・保守する40以上の組織がMythos Previewへのアクセスを得ています。Anthropicはこれらの追加組織の選定基準として、世界のインフラにとって重要なソフトウェアの開発・保守に携わっていることを挙げました。
オープンソースプロジェクトのメンテナーに対しては、Claude for Open Sourceプログラムを通じたアクセス申請の経路も整備されました。申請はAnthropicのウェブサイト上の専用フォームから行う形式です。選定にあたっては、プロジェクトの利用規模や依存関係の広さ、セキュリティ上の重要度などが考慮されると推測されます。自分のプロジェクトがクリティカルインフラに該当すると判断できる場合は、早期に申請を行うことで優先的なアクセスが得られる可能性があります。申請の際には、プロジェクトのダウンロード数や依存パッケージ数、重要インフラでの利用実績などを具体的に示すことが、選定の判断材料として有効に働くと考えられるでしょう。
脆弱性スキャン・ペネトレーションテスト・バイナリ解析など想定ユースケースの整理
Anthropicが想定するMythos Previewの利用領域は、ローカル脆弱性検出、バイナリのブラックボックステスト、エンドポイントのセキュリティ強化、システムへのペネトレーションテストなど多岐にわたります。これらはすべて防御目的の利用であり、自社システムおよびオープンソースシステムのスキャンとセキュア化が主な対象です。
自組織での活用を検討する場合は、まず現在のセキュリティテストの工程を棚卸しし、AIモデルによる自動化・高度化が効果的な領域を特定することが第一歩となります。たとえば、既存のファジングツールでは検出困難なロジック脆弱性の探索、レガシーコードベースの網羅的なセキュリティレビュー、複数の脆弱性を組み合わせた攻撃シナリオの検証などが有力な候補です。Mythosクラスのモデルがアクセス可能になった際に即座に活用できるよう、検証対象のコードベースとテスト環境の整備を先行して進めておくことが推奨されます。
暗号ハッシュ公開から修正パッチ適用までの脆弱性対応フローで担当者が取るべき手順
Anthropicは、修正が完了していない脆弱性について、詳細情報の暗号ハッシュを先行公開し、パッチ適用後に具体的な内容を開示するという方式を取っています。この方式は脆弱性の存在を記録しつつ攻撃者に具体的な悪用情報を与えないという目的で設計されたものですが、セキュリティ担当者にとっては新しい対応フローへの適応が必要になるでしょう。
- AnthropicのフロンティアレッドチームブログおよびProject Glasswingの公開レポートを定期的に確認する
- 暗号ハッシュが公開された脆弱性について、自社が使用しているソフトウェアとの関連性をソフトウェア構成分析(SCA)ツールで確認する
- 関連するソフトウェアのメンテナーからのセキュリティアドバイザリを監視し、パッチが公開され次第速やかに適用する
- パッチ適用が困難な場合は、ネットワークレベルでの緩和策やアクセス制御の強化など代替的な防御措置を講じる
- 脆弱性の詳細が開示された後、自社環境で同種の問題が他にないかを追加検証する
この一連の流れを組織のインシデント対応プロセスに組み込んでおくことで、大量の脆弱性情報が一斉に公開された場合にも混乱なく対応できる体制を築けます。
AI支援型攻撃の高速化に備えてセキュリティスタックを刷新する際の優先チェック項目
Mythos Previewの存在は、防御側だけでなく攻撃側のAI活用も加速することを示唆しています。Palo Alto NetworksのKlarich氏が警告するように、今後はより多く、より速く、より高度な攻撃が発生する見通しです。防御側はこれに備えてセキュリティスタック全体の刷新を検討しなければなりません。
- パッチ適用の自動化レベルの引き上げ──脆弱性の発見から悪用までの時間が短縮されるため、手動でのパッチ適用では間に合わない可能性が高まっている
- EDR・XDRの検出ルールの更新頻度の見直し──AI生成のエクスプロイトは従来のシグネチャベースの検出を回避する可能性がある
- ゼロトラストアーキテクチャの導入もしくは強化──権限昇格チェーンへの耐性を高めるために、最小権限原則の徹底が重要度を増す
- ソフトウェア構成分析(SCA)とSBOM(ソフトウェア部品表)の整備──依存ライブラリに含まれる脆弱性の迅速な特定に不可欠
- インシデント対応チームのAIリテラシー向上──AI支援型攻撃の特徴を理解し、対応手順に反映する訓練の実施
これらの項目は、Mythos Previewへのアクセス有無にかかわらず、AI時代のセキュリティ対策として優先的に取り組むべき内容です。攻撃側がAIを活用し始める前に防御側が体制を整えることが、Project Glasswingが目指す「防御側の持続的な優位」を実現するための前提条件となります。
Glasswing成果レポートを自社防御方針へ反映させる実務的な活用法
90日以内に公開予定のProject Glasswingレポートは、AI支援型の脆弱性発見がどの程度の成果を上げたかを示す初めての大規模な実証データとなります。このレポートを自社のセキュリティ方針に反映させるためには、事前に準備しておくべき枠組みが存在するでしょう。
まず、レポートで報告される脆弱性のカテゴリと深刻度の分布を自社の環境にマッピングする準備です。自社が使用しているOSやミドルウェア、ブラウザのバージョンを正確に把握し、レポートの内容を即座に自社環境に照合できる状態にしておくことが重要です。次に、レポートに含まれるベストプラクティスの推奨事項を自社のセキュリティポリシーに反映させるための社内レビュープロセスを事前に設計しておくことが望ましいでしょう。さらに、AI支援型セキュリティツールの導入判断に必要な評価基準──精度、コスト、既存ワークフローとの統合性──を整理しておくことで、レポート公開後に迅速な意思決定が可能になります。Project Glasswingの成果を受動的に受け取るだけでなく、能動的に自社の防御力強化に活かす姿勢が求められています。