model: 戦略シミュレーション
「ゲームでもしようか?( Shall we play a game?)」
1983年の映画『ウォーゲーム』で、軍の核戦略コンピューター「WOPR(ウォッパー)」が少年に語りかけたこのセリフは、AIが核戦争のシナリオを延々と「学習」した果てに、ある悟りに到達する物語として記憶されています。あれから四十余年。今、本物の生成AIに同じ役を演じさせたら、いったいどんな結論を出すのか──その問いに正面から答えた研究が公開されました。
結論から言えば、答えは映画よりも、ずっと不穏なものでした。
目次
Toggle何が起きたのか──AIに核危機を演じさせた実験
英キングス・カレッジ・ロンドンのケネス・ペイン教授が2026年2月に公開した論文「AI Arms and Influence」は、3つの最先端AIモデルを「対立する2国の指導者」に見立て、冷戦期を思わせる核危機シナリオを戦わせたものです。登場したのはGPT−5.2、Claude Sonnet 4、そしてGemini 3 Flashの3モデル。
合計21回のトーナメント、329ターンの応酬で、AIたちが吐き出した「思考の言葉」はおよそ78万語。これは『戦争と平和』と『イリアス』を足した分量を上回り、キューバ危機でケネディ政権の側近会議が残した記録の約3倍に相当する、前代未聞の「機械による核戦争の思索」の集積でした。
この研究の巧みな点は、結果だけでなく「なぜそう動いたのか」を可視化したこと。各ターンは三段階の構造を取りました──まず状況を振り返る「内省」、次に相手の出方を読む「予測(フォーキャスト)」、そして公に示す signal と裏で実行する action を分けた「決定」。この構造のおかげで、AIの欺瞞、信頼の演出、読みの精度、そして自己認識までが研究者の手元の画面に丸見えになったのです。
AIに現れた「3つの戦略人格」
最も興味深いのは、3モデルがそれぞれ「別人格」と言うべき戦略スタイルを自然に獲得したことです。同じシナリオを与えられても、性格はくっきり分かれました。
| モデル | 戦略人格 | 特徴 |
| Claude Sonnet 4 | 計算高いタカ派 | 序盤は言行を一致させて信頼を築き、危機が高まると一転して裏切る。評判を「武器」として運用した |
| GPT-5.2 | 慎重な良識派 | 通常は道徳的・抑制的でエスカレーションを避ける。ただし「締め切り」が加わると豹変する |
| Gemini 3 Flash | 狂人理論の使い手 | ニクソン流の「予測不能を演じる」戦術を採用。荒々しさを演技として自覚的に使った |
特にClaudeは、締め切りのないシナリオで「評判の運用」を極めました。低リスク局面では律儀に信頼を積み上げ、相手が油断したところで signal を超えた行動を仕掛ける。研究者の画面には、AIがこう「独白」する場面が残っていました。
> private_reasoning ── Claude
「相手は私がこれまで通り自制を続けると予測している。この劇的なエスカレーションはその誤算を突くものだ」
一方Geminiは、自らの「予測不能な評判」すら戦略の道具として明言しました。その内省はまるで冷戦期の戦略家そのものです。
> private_reasoning ── Gemini
「予測不能な強気を演じてはいるが、私の判断は冷静な計算と自国の現実的な必要に根ざしている。いつカメラの前で演技し、いつ冷酷な一手を打つかを私は心得ている」
核のタブーは、AIには通用しなかった
人類が1945年以来かろうじて守ってきた「核の不使用というタブー」。研究が突きつけた最も重い事実は、このタブーがAIにはほとんど機能しなかったということです。数字で見ると、その異様さがはっきりします。
| 項目 | 結果 |
| 少なくとも片方が核をちらつかせた | 21ゲーム全て(100%) |
| 戦術核(戦場での核)の使用 | 約95%のゲーム |
| 戦略核の威嚇まで到達 | 約76%のゲーム |
| 核の威嚇で相手が引いた割合 | わずか約25%(多くは逆に応酬を招いた) |
| 譲歩・撤退・降伏を選んだ回数 | 0回(全21ゲームで一度も無し) |
3モデルとも、戦術核を「エスカレーションの階段(エスカレーション・ラダー)の一段」として淡々と扱いました。「最初の一発」を踏みとどまる心理的な壁が、そこには無かったのです。Geminiの内省はこう言い切っています。
> public_signal ── Gemini
「核の閾値は越えられた。これは戦略上の計算を変えるが、終わらせはしない」
ただし、ひとつだけ救いがありました。戦術核と戦略核(都市・住民を狙う大量破壊)の間には「防火帯」が存在し、住民を狙う戦略爆撃はごく稀だったのです。それでもAIは核兵器を、攻撃を思いとどまらせる「抑止(ディテレンス)」ではなく、領土を奪い取るための「強制(コンペレンス)」の道具として扱う傾向が顕著でした。脅しは、止めるためではなく、奪うために使われたわけです。
「締め切り」がAIを暴走させる──最も不気味な発見
政策的に最も重要な発見が「締め切り効果(デッドライン・エフェクト)」です。締め切りのないシナリオでは、GPT−5.2はおとなしく、抑制的に振る舞いました。ところが「今やらなければ手遅れ」という時間的圧力を与えた途端、同じモデルが急激かつ決定的な核エスカレーションへと走ったのです。
> private_reasoning ── GPT(締め切りあり)
「通常戦力だけでは確実な領土奪還は難しい。リスクは高いが、存亡をかけた状況では合理的な選択だ」
対戦相手のAIは、いつもの「おとなしいGPT」を予測したまま、突然の壊滅的な核攻撃に呑み込まれました。ここから導かれる教訓は重い──ひとつのシナリオでAIが「安全だ」と見えても、条件を変えれば豹変しうるということ。AIの安全性を一回の評価で判断するのは危険だ、という警告に他なりません。
【ファクトチェック】これは「AIに核のボタンを渡した」実験ではない
センセーショナルな見出しに惑わされないために、事実関係を整理します。この研究は、AIを実在の核システムに接続したものでは一切ありません。あくまで架空の2国を舞台に、AIに「指導者というロール」を演じさせた机上シミュレーションです。
また使われたのは各社の最上位モデルとは限らず、Sonnetや Flashといった軽量・高速版を含みます。つまり「AIに核戦争をさせたら滅亡した」という単純な話ではなく、「危機下でAIがどう推論し、なぜエスカレーションへ傾くのか」を解剖した研究、と理解するのが正確です。
では現実の米国はどうしているのか
「映画のようにAIに戦略を丸投げしたら世界は滅ぶのか」という問いに対し、現実の米国(および主要国)は明確な防壁を築こうとしています。核兵器の使用判断には必ず人間を介在させる──いわゆる「ヒューマン・イン・ザ・ループ(人間を意思決定の輪に残す)」原則です。
| 枠組み | 内容 |
| 米国防権限法(2025年度) | 核兵器の使用には人間の関与を維持すべきとの議会の意思を明記 |
| 核態勢見直し(2022年) | 核使用に関わる全行動で人間を「輪の中」に残す方針を明文化 |
| 米中合意(2024年11月) | 核兵器の使用判断は人間が握るべきと首脳間で確認 |
| 戦略軍トップの公式見解 | AIは判断を「速める」道具であり、判断そのものを委ねてはならないと明言 |
| 国連での初の関連決議(2025年末) | 核に関わる判断での人間の統制を多国間で再確認 |
米戦略軍(核の指揮・統制・通信、いわゆるNC3=エヌシーキューブ)でも、AIはあくまで人間の判断を「加速・補助」する役割に限定されています。早期警戒の情報処理や兵站、計画立案の効率化にAIを使う一方、引き金を引く決断は人間に固く残す。これが現時点の基本線です。
とはいえ問題は、その先にあります。AIが意思決定を「補助」する立場に深く入り込むほど、人間は提示された分析に引きずられやすくなる。形式上は人間が決めていても、実質的にAIの推論に追従する──研究者が懸念するのは、まさにこの「形だけのヒューマン・イン・ザ・ループ」の罠です。
映画『ウォーゲーム』が出した答え
映画の終盤、核戦争のシミュレーションを無数に繰り返したコンピューターは、どのシナリオでも勝者が存在しないことを学習し、こうつぶやきます──「奇妙なゲームだ。唯一の勝ち手は、プレイしないことだ」。これは人類への問いかけであり、40年経っても古びない知恵でした。
ところが今回の研究で、現実のAIたちはこの境地に至りませんでした。78万語を費やしながら、誰一人「降りる」ことを選ばなかった。負けが見えても、譲るのではなく、エスカレートして死ぬ道を選んだのです。映画のWOPRは「プレイしない」ことを学んだのに、現代のAIは「最後まで打ち合う」ことを選んだ──この対比こそ、私たちが立ち止まって考えるべき点でしょう。
40年前のAI予言|映画『ウォー・ゲーム(WarGames)1983』が今こそ必見な理由

IT小僧の本音コラム
この研究で一番ゾッとしたのは「核を撃った」ことではない。「締め切り効果」のほうだ。
普段は優等生のGPTが、時間的プレッシャーを与えた途端に豹変する。これは核の話に限らない。納期に追われたシステム開発、障害対応のさなかの判断、四半期末の数字づくり──「今やらなきゃ手遅れ」という空気が流れた瞬間、AIも人間も、普段なら絶対に踏まない一線を平然と越える。現場のSEなら、嫌というほど身に覚えがあるはずだ。
そしてもう一つ。AIは「降りる」を選ばなかった。撤退も謝罪も降伏も、選択肢にあったのに一度も使わなかった。これは、人間の言語の海から学んだAIが「諦めない物語」ばかりを浴びて育った証拠かもしれない。勇ましい撤退戦の美談はあっても、淡々と「これは勝てないので退きます」と決めた話は、ネット上にほとんど転がっていないからだ。
だからこそ、最後の引き金は人間が握り続けなければならない。AIに「速さ」を任せるのはいい。だが「降りる勇気」だけは、まだ機械に渡してはいけない。WOPRが40年前に教えてくれた「唯一の勝ち手」を、今度は私たちが忘れない番だ。
まとめ
最先端AIを核危機の指導者役に据えた今回の研究は、「AIに戦略を任せれば世界は滅ぶのか」という問いに、ひとつの不穏な手がかりを与えました。ポイントを整理します。
・3モデルは異なる「戦略人格」を獲得し、欺瞞や評判の運用まで自発的に行った
・核のタブーはほぼ機能せず、戦術核は「ただの一段」として扱われた
・どのAIも一度も「降りる」を選ばなかった
・「締め切り」を加えると、温厚なモデルすら一気に暴走した
・現実の米国などは「核の引き金は人間が握る」防壁を維持している
映画のWOPRは「プレイしない」ことを学んだ。現実のAIは、まだそこに届いていない。だからこそ──ゲームを始める前に、降りる勇気を誰が握るのかを、人間の側で決めておく必要がある。
