米国政府は国家安全保障上の権限を根拠に、AnthropicのAIモデル「Fable 5」および「Mythos 5」へのアクセスをすべての外国籍ユーザーに対して停止するよう輸出規制指令を発令した。この措置はAnthropicの外国籍従業員も対象となる広範なものであり、同社は指令への準拠を確保するため、これらモデルへの全顧客アクセスを緊急停止せざるを得なかったという。なお、Anthropicが提供する他のモデルへのアクセスには影響がないとされている。
Anthropicが指令を受け取ったのは現地時間6月12日17時21分(ET)とのことで、政府の書簡には国家安全保障上の具体的な懸念事項は明記されていなかった。同社の理解によれば、政府はFable 5の安全対策を迂回する、いわゆる「ジェイルブレイク」手法の存在を把握したと判断したとみられる。Anthropicが当該手法のデモを確認したところ、発見されたのは既知かつ軽微な脆弱性の一部であり、他の公開モデルでも同様の情報を引き出せるものであったという。
Anthropicはこれまで、Fable 5のリリース前にアメリカ・イギリス両政府機関や複数の民間サードパーティ組織、社内チームと連携し、合計で数千時間にわたるレッドチーム試験を実施したと説明している。これらの試験では、モデルの安全対策が既存のいかなるモデルよりも実質的に優れていることが示されたとしている。一方で同社は、いかなるモデルプロバイダーにとっても完全なジェイルブレイク耐性は現時点では不可能であるという見解を、モデルリリース時から明示していたとされている。
同社はFable 5において「多層防御(defense in depth)」戦略を採用し、ジェイルブレイクを局所的なものに限定するか、もしくは実現コストを極めて高くすることを目指したという。また、攻撃の迅速な検知と無効化を目的として、顧客データの30日間保持ポリシーを導入している。このポリシーは顧客との関係においてコストを伴うものであることをAnthropicも認めているが、ジェイルブレイクの調査・対処に不可欠な措置であるとしている。今回の政府指令に対し、Anthropicは自社の安全対策の姿勢を支持する立場を維持するとしており、今後の対応が注目される。
出典:https://www.anthropic.com/news/fable-mythos-access
管理人コメント
AIが「ジェイルブレイク」されたとして政府が全アクセス停止……まるでラスボス戦前にサーバーがメンテナンスに入った感じだ。安全対策には数千時間かけたのに、指令は「今日の17時21分」という突然さよ。AIの脆弱性対策、まさに終わりなきパッチ当て作業である。
読み込み中...






