戦略ゲーム（StarCraft II）で人はAIに勝てなくなった。　99.8％の勝率を超える「AlphaStar」登場

オセロ、チェス、碁、将棋を人間を凌駕してきたAIが、ついに　戦略ゲームで人間を超えてしまいました。

人工知能（AI）の能力が人間を上回る領域が、より高度かつ複雑な方向へ拡大を続けている。2019年10月末には英ディープマインド（DeepMind）のAIが米ブリザードエンターテインメント（Blizzard Entertainment）のオンライン戦略ゲーム「StarCraft II」の対戦で大きな成果を上げたことが、欧米で話題となった。
WIRED

今回のIT小僧の時事放談は、
戦略ゲーム（StarCraft II）で人はAIに勝てなくなった。　99.8％の勝率を超える「AlphaStar」登場
と題して、AIが、戦略ゲームプレーヤーの99.8％に勝つことが証明されたことについて考えてみよう。

最後まで読んでいただけたら幸いです。

ウォー・ゲーム

1983年に公開された　ウォー・ゲーム（原題: WarGames)　ご存知ですか？

米国の戦略システムを人工知能に変えてしまったことによる核戦争の恐怖を描いたサスペンス映画です。

世界滅亡カウントダウンまであと数秒でAI（ジョシア）が下した決断とは・・・
人の良心で核ボタンを押せない兵士に変わり　AIを導入というところから物語が始まります。

まだパソコンがマイコン（登場するのは、IMSAI 8080）と呼ばれている時代のお話です。

そして、ゲームの世界とは言え、人間の知性をAIが超える時代がやってきたのです。

[amazonjs asin="B079VRXDXW" locale="JP" title="ウォー・ゲーム AmazonDVDコレクション Blu-ray"]

AlphaStar

AlphaStarは、米グーグル（Google）の系列企業である　英ディープマインド社（DeepMind）が開発しました。

ディープマインド社は、これまでAIの世界の最先端を走ってきました。

2013年「スペースインベーダー」や「ポン（テニスゲーム）」をAiがプレイ
2016年 AI「AlphaGo」で囲碁の世界トッププロに勝利
2019年10月末英誌「Nature」に以下の論文を発表した。

深層強化学習を使って開発したAIの「AlphaStar」がStarCraft IIのオンライン対戦で「上位0.2％入り（グランドマスターレベル）」を達成、人間のプレーヤーの99.8％に勝利することになった。

StarCraft IIというのは、米ブリザードエンターテインメント（Blizzard Entertainment）のオンライン戦略ゲームで日本語版が販売されていませんが、世界的には非常に人気の高いオンライン戦略ゲームで「多くのプロゲーマーが存在」しています。
そのプロゲーマーたちも凌ぐ強さということで　米CNNや英BBCなど一般メディアも取り上げることになっているようです。

ゲームをするAIの中で、囲碁、将棋のとは違い、リアルタイムに情報収集、戦略を判断して指示を出して相手を攻撃するというところが、これまでのようなAIによるゲームと大きく違っています。

StarCraft II

StarCraft IIはSFを題材にした戦略ゲームです。

プレーヤーは数百のユニット（駒）にリアルタイムに指示を送ることで敵を攻撃するというものですが、囲碁や将棋のような　ゲームエリアを全部見渡せるわけではなく、ゲームの世界のごく一部だけしか見ることができません。

つまり、限られた情報から、相手を推測し、次に指令を発せなければならない。
また、攻撃だけではなく、資源の調達、建物や武器などを製造するということも重要なゲームの要素となっている。

プロのゲーマーたちは、これらを1分間に数百以上の指示を出して約１時間戦っている。

これらの指令に対する　選択肢は「10の26乗」と言われています。

この10の26乗の選択肢から1つを選び　1分間で数百回以上、つまり1時間で1万8000回以上も繰り返すという作業となります。

このゲームでAlphaStarは、人間を超える能力を取得したわけです。

深層強化学習

AI「AlphaStar」は、

コンピューターが試行錯誤を通じてタスクを実行する最適なやり方を学習していく強化学習
ニューラルネットワークを多段に組み合わせるディープラーニング（深層学習）を組み合わせた機械学習

という２つを組み合わせた「深層強化学習」という手法で開発されている。

AI同士を対戦させることで学習させるという手法です。

今回は、「人間のプレーヤーによる対戦データを使った教師」を真似るエージェントとよばれるモデルを作成して
そのエージェント同士を対戦させて、勝利を学ばせていた。

ただしこの場合、過去に学習したスキルを忘れてしまう「破滅的忘却」というものが発生してしまいます。
「破滅的忘却」は、つねに最善を尽くそうとするAIにとって避けられないとされていますが、「ある戦略に特化したエージェントを多数作り」それらを対戦させるという手法で「破滅的忘却」というものを克服したと述べている。

これ以上は、専門家ではない自分では理解できないところもあったのですが、
「弱点を突く　特化型エージェント」「守り重視特化型エージェント」「バランス重視　特化型エージェント」
などを組み合わせて強力なゲームプレーヤーに成長したらしい。

これ以上は、専門家の人ヘルプ！！！です。

応用

たかがゲームですが、
「複雑な制約条件で　多くの選択肢を予測実行し長期戦略に勝利するAI」
が実現したということで他分野でも応用がはじまっているようです。

2018年12月　「タンパク質の立体構造を遺伝子配列から予測」する「AlphaFold」が発表されています。
「複雑な制約条件」と「選択肢を予測実行」という知能は、医薬品開発、気象予測をはじめ　多くの分野に活用されるでしょう。

自動運転もこの学習方法は役に立ちそうな気もします。

米国 vs 中国

米国防省では、AIを戦略に組み込もうとしています。
Googleは、米国の要請を戦略に限って断りましたが、Microsoftは、参加するようです。

AIの研究は、中国、米国で激しく争っています。

中国は、政治、社会システムで米国とは違い、個人情報取り放題の状況でAIに必要なデータ収集は事欠きません。

一方、数年前に起こった、米大統領戦に絡むFacebookとケンブリッジ・アナリティカ（英語: Cambridge Analytica Ltd : CA ）の事件により　欧州のGDPRなども成立、個人情報の取扱に制限が厳しくなったいる。

これは，どう考えても　中国が有利である。
AIだけでなく、来年から日本では本格稼働するという5Gに関しても「圧倒的に中国が先に行っている」ことは事実

そして進化したAIが積極的に戦略に組み込まれたらどうなってしまうのか？

核に対して　規制が厳しい今の世界では、ウォー・ゲームのようなことは、起こらないとは思いたいけど、
未来は、不安定になるかも知れません。

対人間だったら

ウォー・ゲームは、ソ連の核ミサイルが飛んでくるというシュミレーションが現実と誤認してAIが暴走をするのですが、これが、AIが自我を持ち、対人間に向かったら・・・

ターミネーターの世界になります。

あれは、SFでつくりものですが、ネットという巨大な脳細胞が目覚めたとき　どうなるのか？

スティーブン・ホーキング博士やイーロン・マスクは、AIに対して警鐘を鳴らしています。

「AIは自らの意志を持つようになり、人間と対立するだろう。AIの到来は、人類史上、最善の出来事になるか、または最悪の出来事になるだろう。」
スティーブン・ホーキング博士

そして

「AIが絶対に逃れることのできない不死身の独裁者を作り上げるために使われる可能性がある」
イーロン・マスク

イーロン・マスクの発言は、ショー的要素もあるかも知れませんが　スティーブン・ホーキング博士の言葉は意味深です。

AIは、的か味方か？　予測不可能なのです。

まとめ

AIの進化って　実は、よくわからないんです。

「人間を超えた」というわりに「まだまだだ」ということも聞こえてきます。

人間の知性を超える　シンギュラリティ（技術的特異点）が、2045年とか言う学者さんもいます。

半世紀以上生きてきたIT小僧は、黒電話の時代からスマートフォンの時代を見てきました。
たった、40年　そうたった40年で驚異的な技術革新を目撃し体験してきたのです。

AIは、
「今は、まだ道具でしかありませんが」

いつ
「自我を持ち、自発的に行動するかも知れません」

そのとき人間は、AIに勝てない現実をみることになるでしょう。

鉄腕アトムのような知性と理性あるロボットなら歓迎なのですが・・・

戦略ゲーム（StarCraft II）で人はAIに勝てなくなった。 99.8％の勝率を超える「AlphaStar」登場