AIコーディングが予算を食い尽くす——MicrosoftとUberが直面したコスト爆発の正体

「ＡＩにコードを書かせれば、エンジニアの生産性は爆発的に上がる」
この合言葉に、いま冷や水が浴びせられている。あのMicrosoftが、社内で配っていたClaude Code（クロードコード）のライセンス（利用権）の大半を打ち切り、自社のGitHub Copilot CLIへ寄せると報じられた。理由は性能ではない。コストだ。同じ悩みは配車大手のUber（ウーバー）でも噴き出している。今回は、ＡＩコーディングのコストがなぜ膨らむのか、その構造を現場目線で解剖する。

結論を先に言う。悪いのはツールではない。「従量課金 × 自律エージェント × 人間の欲」という構造が、コストを必然的に膨らませている。

何が起きたのか — ２社のリアル

Microsoftは半年ほど前、数千人規模の開発者・企画担当・デザイナーにClaude Codeを開放した。ところが社内で爆発的に使われた結果、トークン（ＡＩが文章を処理する最小単位）課金がふくらみ、ある社内部門での利用を６月末で止めて、自社のGitHub Copilot CLI（コマンドラインで動くＡＩ補助ツール）へ寄せる判断を下したと報じられている。

対象とされたのは、ウィンドウズや業務向けアプリ群を担当する部門だ。興味深いのは、多くの開発者がClaude Codeのほうを好んでいたとされる点である。つまり「弱いから捨てた」のではなく「強くて使われすぎたから止めた」という、なんとも皮肉な構図になっている。なお、MicrosoftとAnthropicの提携自体は継続し、ＣｌａｕｄｅのモデルはＣｏｐｉｌｏｔ経由で引き続き使える見込みだ。

そしてUberはさらに踏み込んでいる。２０２５年１２月に約５０００人のエンジニアへClaude Codeを展開したところ、２０２６年分として確保していたＡＩ予算を、わずか４か月で使い切ってしまった。同社のＣＴＯ（最高技術責任者）は「必要だと思っていた予算が、もう吹き飛んだ」と公言している。慌てた経営陣は、１人あたり月１５００ドル（約２４万円）という上限を設けた。

項目	Microsoft	Uber
対象規模	数千人の開発者ほか	約５０００人のエンジニア
導入の時期	半年ほど前	２０２５年１２月
きっかけ	社内利用が急拡大しコスト増	年間予算を４か月で枯渇
とった対応	自社ツールへ一本化	１人月１５００ドルの上限設定
本音の理由	コスト削減・自社で握る	投資対効果が見えにくい

なぜコストが膨らむのか — ４つの構造的な理由

理由１：エージェントは「１依頼＝数十回の呼び出し」

従来のコード補完は「打てば候補が出る」程度だった。だがエージェント（自律的に作業を進めるＡＩ）型は違う。「このバグを直して」と一言頼むと、裏ではコードを読む、考える、直す、テストする、失敗を読み直す……と何十回もＡＩを呼ぶ。利用者の操作は１回でも、課金は数十回分。ここを直感で見誤ると、月末の請求書で腰を抜かすことになる。

理由２：コンテキスト（文脈）の再送で雪だるま式に増える

ＡＩは会話の履歴を毎回まるごと入力として送り直して動く。会話を継ぎ足すほど、１ターンあたりの入力トークンが線形に増えていく。プロンプトキャッシュ（入力の再利用で節約するしくみ）である程度は抑えられるが、長い文脈を抱えたままダラダラ続ける使い方は、構造的に高くつく。後半になるほど１手が高くなる、という体感はこれが原因だ。

理由３：並列実行は生産性と引き換えにコストを掛け算する

補助のＡＩを生やす、複数の作業を同時に走らせる——体感の生産性は跳ね上がる。だが課金は「１タスクの消費 × 並列数」で効いてくる、まさに諸刃の剣だ。手元で４つ走らせれば、単純計算でメーターも４倍の速さで回る。

理由４：トークンマクシング（消費の自己目的化）

これが一番タチが悪い。社内で「ＡＩ利用量ランキング」を作り、月間の最低利用量を課す。すると、誰も読まないドキュメントの自動生成や、無駄に長い文脈の量産がはじまる。本来の目的は生産性向上のはずが、いつの間にか「トークンを消費すること」そのものが目標にすり替わる。測定できる数字を最大化しようとして、肝心の目的を見失う典型例だ。

膨張の要因	効きかた	現場での体感
多段の呼び出し	１依頼が数十回ぶんに	１回頼んだだけなのに
文脈の再送	会話が伸びるほど増える	後半ほど１手が高い
並列の実行	タスク数で掛け算	速いがメーターが回る
消費の自己目的化	指標のために浪費する	使うこと自体が目的に

ＩＴ小僧の本音コラム

今回の騒動、Claude Codeが悪いわけではない。むしろ「良すぎた」。エンジニアが手放せなくなるほど効いたから、青天井で使われ、予算が溶けた。問題の本質は「コスト」ではなく「投資対効果（ＲＯＩ）が測れないこと」にある。あるＣＯＯ（最高執行責任者）ですら、ＡＩの利用量と実際の事業成果を結びつけられないと白状している。月に数千ドル使う人間が、その十倍の価値を生んでいるか——いまだ誰も証明できていない。

長年この業界を見てきて思うのは、我々はツールを「固定費」として予算を組む癖が抜けない、ということだ。サーバーもライセンスも、買えば終わり、あとは使い放題。だが従量課金のＡＩは違う。優秀な人材と同じで、成果を出すほど現場は「もっと使いたい」と欲しがる。コストは成果に比例して伸びていく。これはもう経費というより、限りなく人件費に近い「変動費」だ。

固定費の感覚で従量課金のメーターを回せば、どこかで必ず破綻する。Microsoftの「自社ツールへ集約」も、Uberの「上限１５００ドル」も、結局は同じ問いへの異なる答えだ——青天井のメーターの手綱を、どう握るか。

現場のＳＥ・社内ＳＥはどう備えるか

では、これから本格導入する我々はどうするか。私の提案はシンプルだ。

① 予算は「変動費」として設計する。１人あたりの月額上限を決め、ダッシュボードでリアルタイムに見える化する。Uberが慌てて入れたのは、まさにこれだ。

② 評価軸を「使った量」から「出した成果」へ移す。トークン消費量を評価指標にした瞬間、消費の自己目的化がはじまる。指標が目標になると、その指標は壊れる。

③ 惰性で長い会話を続けない。タスクが終わったら文脈を切る。地味だが、これだけで入力トークンの肥大化は確実に抑えられる。

④ タスクごとに道具を仕分ける。どこに高機能エージェントを使い、どこは安いモデルや人間で十分かを切り分ける。全部に最高級を当てるのは、タクシーで隣のコンビニに行くようなものだ。

まとめ

ＡＩコーディングのコスト爆発は、ツールの欠陥ではなく「従量課金 × 自律エージェント × 人間の欲」という構造から生まれる必然だ。MicrosoftとUberは、その必然に最初にぶつかった先頭集団にすぎない。次にぶつかるのは、これから本格導入する我々かもしれない。

メーターの回る道具を手にした以上、問われるのは「使うか否か」ではない。「どう手綱を握るか」だ。道具を恐れて使わないのは時代遅れだが、無策で青天井に使うのは、ただの浪費である。落としどころは、いつだってその間にある。

ファクトチェック注記

［検証済み］ Microsoftの社内ＡＩコーディングツール縮小報道、Uberの年間予算が４か月で枯渇した件とＣＴＯ発言、１人あたり月５００〜２０００ドルのコスト水準、月１５００ドルの上限設定。いずれも複数の報道で確認。

［関係者・報道ベース］社内で開発者がClaude Codeを好んでいたとの評価は、報道記者の観察であり厳密な調査結果ではない。生産性向上率などの数値は各社・各ベンダー発表にもとづく。

参考：Forbes JAPAN、Fortune、Windows Central ほか各種報道（２０２６年）。