※本ページはプロモーションが含まれています

IT小僧の時事放談 今日のAI話

AIコーディングが予算を食い尽くす——MicrosoftとUberが直面したコスト爆発の正体

「AIにコードを書かせれば、エンジニアの生産性は爆発的に上がる」
この合言葉に、いま冷や水が浴びせられている。あのMicrosoftが、社内で配っていたClaude Code(クロードコード)のライセンス(利用権)の大半を打ち切り、自社のGitHub Copilot CLIへ寄せると報じられた。理由は性能ではない。コストだ。同じ悩みは配車大手のUber(ウーバー)でも噴き出している。今回は、AIコーディングのコストがなぜ膨らむのか、その構造を現場目線で解剖する。

結論を先に言う。悪いのはツールではない。「従量課金 × 自律エージェント × 人間の欲」という構造が、コストを必然的に膨らませている。

何が起きたのか — 2社のリアル

Microsoftは半年ほど前、数千人規模の開発者・企画担当・デザイナーにClaude Codeを開放した。ところが社内で爆発的に使われた結果、トークン(AIが文章を処理する最小単位)課金がふくらみ、ある社内部門での利用を6月末で止めて、自社のGitHub Copilot CLI(コマンドラインで動くAI補助ツール)へ寄せる判断を下したと報じられている。

対象とされたのは、ウィンドウズや業務向けアプリ群を担当する部門だ。興味深いのは、多くの開発者がClaude Codeのほうを好んでいたとされる点である。つまり「弱いから捨てた」のではなく「強くて使われすぎたから止めた」という、なんとも皮肉な構図になっている。なお、MicrosoftとAnthropicの提携自体は継続し、ClaudeのモデルはCopilot経由で引き続き使える見込みだ。

そしてUberはさらに踏み込んでいる。2025年12月に約5000人のエンジニアへClaude Codeを展開したところ、2026年分として確保していたAI予算を、わずか4か月で使い切ってしまった。同社のCTO(最高技術責任者)は「必要だと思っていた予算が、もう吹き飛んだ」と公言している。慌てた経営陣は、1人あたり月1500ドル(約24万円)という上限を設けた。

項目 Microsoft Uber
対象規模 数千人の開発者ほか 約5000人のエンジニア
導入の時期 半年ほど前 2025年12月
きっかけ 社内利用が急拡大しコスト増 年間予算を4か月で枯渇
とった対応 自社ツールへ一本化 1人月1500ドルの上限設定
本音の理由 コスト削減・自社で握る 投資対効果が見えにくい

なぜコストが膨らむのか — 4つの構造的な理由

理由1:エージェントは「1依頼 = 数十回の呼び出し」

従来のコード補完は「打てば候補が出る」程度だった。だがエージェント(自律的に作業を進めるAI)型は違う。「このバグを直して」と一言頼むと、裏ではコードを読む、考える、直す、テストする、失敗を読み直す……と何十回もAIを呼ぶ。利用者の操作は1回でも、課金は数十回分。ここを直感で見誤ると、月末の請求書で腰を抜かすことになる。

理由2:コンテキスト(文脈)の再送で雪だるま式に増える

AIは会話の履歴を毎回まるごと入力として送り直して動く。会話を継ぎ足すほど、1ターンあたりの入力トークンが線形に増えていく。プロンプトキャッシュ(入力の再利用で節約するしくみ)である程度は抑えられるが、長い文脈を抱えたままダラダラ続ける使い方は、構造的に高くつく。後半になるほど1手が高くなる、という体感はこれが原因だ。

理由3:並列実行は生産性と引き換えにコストを掛け算する

補助のAIを生やす、複数の作業を同時に走らせる——体感の生産性は跳ね上がる。だが課金は「1タスクの消費 × 並列数」で効いてくる、まさに諸刃の剣だ。手元で4つ走らせれば、単純計算でメーターも4倍の速さで回る。

理由4:トークンマクシング(消費の自己目的化)

これが一番タチが悪い。社内で「AI利用量ランキング」を作り、月間の最低利用量を課す。すると、誰も読まないドキュメントの自動生成や、無駄に長い文脈の量産がはじまる。本来の目的は生産性向上のはずが、いつの間にか「トークンを消費すること」そのものが目標にすり替わる。測定できる数字を最大化しようとして、肝心の目的を見失う典型例だ。

膨張の要因 効きかた 現場での体感
多段の呼び出し 1依頼が数十回ぶんに 1回頼んだだけなのに
文脈の再送 会話が伸びるほど増える 後半ほど1手が高い
並列の実行 タスク数で掛け算 速いがメーターが回る
消費の自己目的化 指標のために浪費する 使うこと自体が目的に

IT小僧の本音コラム

今回の騒動、Claude Codeが悪いわけではない。むしろ「良すぎた」。エンジニアが手放せなくなるほど効いたから、青天井で使われ、予算が溶けた。問題の本質は「コスト」ではなく「投資対効果(ROI)が測れないこと」にある。あるCOO(最高執行責任者)ですら、AIの利用量と実際の事業成果を結びつけられないと白状している。月に数千ドル使う人間が、その十倍の価値を生んでいるか——いまだ誰も証明できていない。

長年この業界を見てきて思うのは、我々はツールを「固定費」として予算を組む癖が抜けない、ということだ。サーバーもライセンスも、買えば終わり、あとは使い放題。だが従量課金のAIは違う。優秀な人材と同じで、成果を出すほど現場は「もっと使いたい」と欲しがる。コストは成果に比例して伸びていく。これはもう経費というより、限りなく人件費に近い「変動費」だ。

固定費の感覚で従量課金のメーターを回せば、どこかで必ず破綻する。Microsoftの「自社ツールへ集約」も、Uberの「上限1500ドル」も、結局は同じ問いへの異なる答えだ——青天井のメーターの手綱を、どう握るか。

現場のSE・社内SEはどう備えるか

では、これから本格導入する我々はどうするか。私の提案はシンプルだ。

① 予算は「変動費」として設計する。 1人あたりの月額上限を決め、ダッシュボードでリアルタイムに見える化する。Uberが慌てて入れたのは、まさにこれだ。

② 評価軸を「使った量」から「出した成果」へ移す。 トークン消費量を評価指標にした瞬間、消費の自己目的化がはじまる。指標が目標になると、その指標は壊れる。

③ 惰性で長い会話を続けない。 タスクが終わったら文脈を切る。地味だが、これだけで入力トークンの肥大化は確実に抑えられる。

④ タスクごとに道具を仕分ける。 どこに高機能エージェントを使い、どこは安いモデルや人間で十分かを切り分ける。全部に最高級を当てるのは、タクシーで隣のコンビニに行くようなものだ。

まとめ

AIコーディングのコスト爆発は、ツールの欠陥ではなく「従量課金 × 自律エージェント × 人間の欲」という構造から生まれる必然だ。MicrosoftとUberは、その必然に最初にぶつかった先頭集団にすぎない。次にぶつかるのは、これから本格導入する我々かもしれない。

メーターの回る道具を手にした以上、問われるのは「使うか否か」ではない。「どう手綱を握るか」だ。道具を恐れて使わないのは時代遅れだが、無策で青天井に使うのは、ただの浪費である。落としどころは、いつだってその間にある。

ファクトチェック注記

[検証済み] Microsoftの社内AIコーディングツール縮小報道、Uberの年間予算が4か月で枯渇した件とCTO発言、1人あたり月500〜2000ドルのコスト水準、月1500ドルの上限設定。いずれも複数の報道で確認。

[関係者・報道ベース] 社内で開発者がClaude Codeを好んでいたとの評価は、報道記者の観察であり厳密な調査結果ではない。生産性向上率などの数値は各社・各ベンダー発表にもとづく。

参考:Forbes JAPAN、Fortune、Windows Central ほか各種報道(2026年)。

-IT小僧の時事放談, 今日のAI話
-, , , ,

Copyright© IT小僧の時事放談 , 2026 All Rights Reserved Powered by AFFINGER5.