Claude Fable 5、米輸出規制解除で全世界提供再開:ジェイルブレイクと安全性強化の背景

-

この記事のポイント

  • AnthropicのAIモデル「Claude Fable 5」が米国政府の輸出規制解除を受け、全世界で利用を再開した。
  • 規制は「ジェイルブレイク」の発見が引き金となり、安全性への懸念から一時的に課されたもの。
  • Anthropicは新たな安全対策を導入し、AIモデルの安全性評価基準の策定にも協力している。

Anthropicが開発した先進的なAIモデル「Claude Fable 5」が、米国政府による輸出規制の解除を受けて、全世界での提供を再開しました。この規制は、同モデルで発見された安全対策を回避する「ジェイルブレイク」が原因で一時的に導入されたものですが、Anthropicが新たな安全フィルターを実装したことで、約2週間半ぶりに制限が撤廃されたと米メディアが報じています。

輸出規制の背景と解除の経緯

米国商務省は、2026年6月12日にAnthropicのAIモデル「Fable 5」と、より厳格な管理下の「Mythos 5」に対し、輸出規制を課しました。この措置は、Amazonの研究者がFable 5に安全対策を迂回させる「ジェイルブレイク」を発見したことが直接の引き金となりました。Anthropicの報告によると、このジェイルブレイクによって、モデルが一部のソフトウェアの脆弱性を指摘したり、その悪用方法を示すコードを生成したりする事態が発生しました。

規制が発効すると、Anthropicは米国籍以外の全ユーザーに対し、国内外を問わず両モデルの提供を停止せざるを得なくなりました。これは、リアルタイムで全ユーザーの国籍を確認する信頼できる手段がなかったため、やむを得ず全世界でのサービスを停止した形です。

しかし、Anthropicが新たな安全対策を講じたことを受け、米国商務省は2026年6月30日に輸出規制を解除。これにより、Fable 5は2026年7月1日からClaude.ai、Claude Platform、Claude Code、Claude Coworkといったプラットフォームを通じて、再び全世界のユーザーに提供されることになりました。一方、Mythos 5については、重要インフラを防御する約100の米国企業および連邦機関に限定して、6月26日からアクセスが再開されています。Anthropicは、今後も政府と協力し、より広範なアクセス拡大を目指すとしています。

Anthropicの対応と安全性強化

今回の規制解除に際し、Anthropicはモデルの安全性強化に注力しました。具体的には、報告されたジェイルブレイクの手法を検知し、99%以上の確率で阻止する新しい安全フィルター(分類器)を開発・導入しています。このフィルターによってブロックされたリクエストは、より安全性が低いとされる同社のモデル「Opus 4.8」に処理が引き継がれ、ユーザーにはその旨が通知される仕組みです。

米国商務長官ハワード・ラトニック氏の書簡によると、Anthropicは規制解除の条件として、自社でのセキュリティ問題の継続的な探索、将来のモデルローンチにおける政府との連携、そして悪用が確認された場合の報告に同意しました。一連の交渉は、CEOのダリオ・アモデイ氏ではなく、共同創設者のトム・ブラウン氏が主導したと報じられています。

業界の反応と競争への影響

輸出規制が導入された当初は、元AI責任者であるデビッド・サックス氏がAnthropicに対し「安全性よりも消費者モデルの提供継続を優先した」と批判するなど、安全性への懸念から一部で強い批判の声が上がりました。一方で、シドニー大学のAIガバナンス研究者フランチェスコ・バイロ氏は、規制解除が政府の過剰な対応を認めたものだと指摘しています。

この規制の一時停止は、AI業界の競争環境にも大きな影響を与える可能性が指摘されました。一部の業界幹部からは、米国製AIモデルの機能制限が、安価で高性能な中国製オープンソースモデルの台頭を許し、米国企業の競争力を阻害するとの懸念が示されました。同様の懸念から、OpenAIも「GPT-5.6」を政府承認グループに限定してプレビュー公開しており、フロンティアAIモデルの安全性と利用のバランスが、業界全体の課題となっていることが浮き彫りになりました。

https://x.com/DavidSacks/status/2065853007619588171

ジェイルブレイクの危険度評価と今後の取り組み

Anthropicは、今回の経験を踏まえ、業界全体でジェイルブレイクの危険度を客観的に評価する共通の枠組みを提案しています。Amazon、Microsoft、Googleなどのパートナー企業と協力し、以下の4つの基準でジェイルブレイクを評価する方針です。

  • 能力向上: ジェイルブレイクによってユーザーが既存ツールでは得られない、どれほどの能力を獲得できるか。
  • 広範さ: 同じ手法でどれだけ多くの異なる攻撃が可能になるか。
  • 武器化の容易さ: 実際の攻撃に転用するために必要なスキルや労力。
  • 発見の容易さ: その手法がいかに簡単に見つけ出され、模倣されるか。

同社は、電力網や銀行への攻撃を可能にするような最悪のジェイルブレイクに対しては、危険度が確認され次第、直ちに修正を展開する体制を構築し、24時間体制でジェイルブレイク報告を監視する専門チームを立ち上げると表明しています。また、研究者からの新たなFable 5のジェイルブレイク報告を受け付けるHackerOneプログラムを開設し、将来のフロンティアモデルについては、リリース前に米国政府に先行テストアクセスを提供する合意も交わしています。

【管理人の視点】日本のユーザー目線

今回のClaude Fable 5の機能制限と解除は、フロンティアAIモデルの安全性と利用のバランスという、AI業界全体が直面する課題を浮き彫りにしています。日本国内のユーザーにとっても、海外のAIモデルの利用が予期せぬ形で制限される可能性を示唆しており、特にビジネスでAIを活用している企業にとっては、サプライチェーンリスクとして考慮すべき重要な事例と言えるでしょう。Anthropicが提案するジェイルブレイクの危険度評価フレームワークは、AIの安全性を客観的に評価する共通言語となり得るため、国際的なAIガバナンスの議論においても注目されます。今後、日本政府や国内企業が同様のAIモデルを開発・利用する際にも、この事例から得られる教訓は大きいでしょう。特に、AIの悪用リスクを低減しつつ、イノベーションを阻害しないための国際的な協力体制の構築が求められます。

まとめ

AnthropicのClaude Fable 5が輸出規制から解放されたことは、AI技術の進歩と安全性確保の間の複雑な関係を示す象徴的な出来事です。ジェイルブレイクへの対応を通じて、Anthropicはより堅牢な安全対策を講じ、業界全体でAIの危険度を評価する共通基準の確立にも貢献しようとしています。この一連の動きは、AIモデルが社会に与える影響の大きさを再認識させるとともに、政府、企業、研究者が協力してAIの安全な発展を追求する重要性を強調しています。

情報元:thehackernews.com

合わせて読みたい  Amazon支援のX-energyがIPO申請!小型モジュール炉でAI時代の電力需要を担うか

著者

カテゴリー

Related Stories