「AIにコードを書かせれば、エンジニアの生産性は爆発的に上がる」
この合言葉に、いま冷や水が浴びせられている。あのMicrosoftが、社内で配っていたClaude Code(クロードコード)のライセンス(利用権)の大半を打ち切り、自社のGitHub Copilot CLIへ寄せると報じられた。理由は性能ではない。コストだ。同じ悩みは配車大手のUber(ウーバー)でも噴き出している。今回は、AIコーディングのコストがなぜ膨らむのか、その構造を現場目線で解剖する。
結論を先に言う。悪いのはツールではない。「従量課金 × 自律エージェント × 人間の欲」という構造が、コストを必然的に膨らませている。
何が起きたのか — 2社のリアル
Microsoftは半年ほど前、数千人規模の開発者・企画担当・デザイナーにClaude Codeを開放した。ところが社内で爆発的に使われた結果、トークン(AIが文章を処理する最小単位)課金がふくらみ、ある社内部門での利用を6月末で止めて、自社のGitHub Copilot CLI(コマンドラインで動くAI補助ツール)へ寄せる判断を下したと報じられている。
対象とされたのは、ウィンドウズや業務向けアプリ群を担当する部門だ。興味深いのは、多くの開発者がClaude Codeのほうを好んでいたとされる点である。つまり「弱いから捨てた」のではなく「強くて使われすぎたから止めた」という、なんとも皮肉な構図になっている。なお、MicrosoftとAnthropicの提携自体は継続し、ClaudeのモデルはCopilot経由で引き続き使える見込みだ。
そしてUberはさらに踏み込んでいる。2025年12月に約5000人のエンジニアへClaude Codeを展開したところ、2026年分として確保していたAI予算を、わずか4か月で使い切ってしまった。同社のCTO(最高技術責任者)は「必要だと思っていた予算が、もう吹き飛んだ」と公言している。慌てた経営陣は、1人あたり月1500ドル(約24万円)という上限を設けた。
| 項目 | Microsoft | Uber |
| 対象規模 | 数千人の開発者ほか | 約5000人のエンジニア |
| 導入の時期 | 半年ほど前 | 2025年12月 |
| きっかけ | 社内利用が急拡大しコスト増 | 年間予算を4か月で枯渇 |
| とった対応 | 自社ツールへ一本化 | 1人月1500ドルの上限設定 |
| 本音の理由 | コスト削減・自社で握る | 投資対効果が見えにくい |
なぜコストが膨らむのか — 4つの構造的な理由
理由1:エージェントは「1依頼 = 数十回の呼び出し」
従来のコード補完は「打てば候補が出る」程度だった。だがエージェント(自律的に作業を進めるAI)型は違う。「このバグを直して」と一言頼むと、裏ではコードを読む、考える、直す、テストする、失敗を読み直す……と何十回もAIを呼ぶ。利用者の操作は1回でも、課金は数十回分。ここを直感で見誤ると、月末の請求書で腰を抜かすことになる。
理由2:コンテキスト(文脈)の再送で雪だるま式に増える
AIは会話の履歴を毎回まるごと入力として送り直して動く。会話を継ぎ足すほど、1ターンあたりの入力トークンが線形に増えていく。プロンプトキャッシュ(入力の再利用で節約するしくみ)である程度は抑えられるが、長い文脈を抱えたままダラダラ続ける使い方は、構造的に高くつく。後半になるほど1手が高くなる、という体感はこれが原因だ。
理由3:並列実行は生産性と引き換えにコストを掛け算する
補助のAIを生やす、複数の作業を同時に走らせる——体感の生産性は跳ね上がる。だが課金は「1タスクの消費 × 並列数」で効いてくる、まさに諸刃の剣だ。手元で4つ走らせれば、単純計算でメーターも4倍の速さで回る。
理由4:トークンマクシング(消費の自己目的化)
これが一番タチが悪い。社内で「AI利用量ランキング」を作り、月間の最低利用量を課す。すると、誰も読まないドキュメントの自動生成や、無駄に長い文脈の量産がはじまる。本来の目的は生産性向上のはずが、いつの間にか「トークンを消費すること」そのものが目標にすり替わる。測定できる数字を最大化しようとして、肝心の目的を見失う典型例だ。
| 膨張の要因 | 効きかた | 現場での体感 |
| 多段の呼び出し | 1依頼が数十回ぶんに | 1回頼んだだけなのに |
| 文脈の再送 | 会話が伸びるほど増える | 後半ほど1手が高い |
| 並列の実行 | タスク数で掛け算 | 速いがメーターが回る |
| 消費の自己目的化 | 指標のために浪費する | 使うこと自体が目的に |
IT小僧の本音コラム
今回の騒動、Claude Codeが悪いわけではない。むしろ「良すぎた」。エンジニアが手放せなくなるほど効いたから、青天井で使われ、予算が溶けた。問題の本質は「コスト」ではなく「投資対効果(ROI)が測れないこと」にある。あるCOO(最高執行責任者)ですら、AIの利用量と実際の事業成果を結びつけられないと白状している。月に数千ドル使う人間が、その十倍の価値を生んでいるか——いまだ誰も証明できていない。
長年この業界を見てきて思うのは、我々はツールを「固定費」として予算を組む癖が抜けない、ということだ。サーバーもライセンスも、買えば終わり、あとは使い放題。だが従量課金のAIは違う。優秀な人材と同じで、成果を出すほど現場は「もっと使いたい」と欲しがる。コストは成果に比例して伸びていく。これはもう経費というより、限りなく人件費に近い「変動費」だ。
固定費の感覚で従量課金のメーターを回せば、どこかで必ず破綻する。Microsoftの「自社ツールへ集約」も、Uberの「上限1500ドル」も、結局は同じ問いへの異なる答えだ——青天井のメーターの手綱を、どう握るか。
現場のSE・社内SEはどう備えるか
では、これから本格導入する我々はどうするか。私の提案はシンプルだ。
① 予算は「変動費」として設計する。 1人あたりの月額上限を決め、ダッシュボードでリアルタイムに見える化する。Uberが慌てて入れたのは、まさにこれだ。
② 評価軸を「使った量」から「出した成果」へ移す。 トークン消費量を評価指標にした瞬間、消費の自己目的化がはじまる。指標が目標になると、その指標は壊れる。
③ 惰性で長い会話を続けない。 タスクが終わったら文脈を切る。地味だが、これだけで入力トークンの肥大化は確実に抑えられる。
④ タスクごとに道具を仕分ける。 どこに高機能エージェントを使い、どこは安いモデルや人間で十分かを切り分ける。全部に最高級を当てるのは、タクシーで隣のコンビニに行くようなものだ。
まとめ
AIコーディングのコスト爆発は、ツールの欠陥ではなく「従量課金 × 自律エージェント × 人間の欲」という構造から生まれる必然だ。MicrosoftとUberは、その必然に最初にぶつかった先頭集団にすぎない。次にぶつかるのは、これから本格導入する我々かもしれない。
メーターの回る道具を手にした以上、問われるのは「使うか否か」ではない。「どう手綱を握るか」だ。道具を恐れて使わないのは時代遅れだが、無策で青天井に使うのは、ただの浪費である。落としどころは、いつだってその間にある。
ファクトチェック注記
[検証済み] Microsoftの社内AIコーディングツール縮小報道、Uberの年間予算が4か月で枯渇した件とCTO発言、1人あたり月500〜2000ドルのコスト水準、月1500ドルの上限設定。いずれも複数の報道で確認。
[関係者・報道ベース] 社内で開発者がClaude Codeを好んでいたとの評価は、報道記者の観察であり厳密な調査結果ではない。生産性向上率などの数値は各社・各ベンダー発表にもとづく。
参考:Forbes JAPAN、Fortune、Windows Central ほか各種報道(2026年)。
