面白いゲームをしましょう。あなたは CTO で、AI の請求書が届いたところです
Uber は 2026 年通年の AI コーディング予算を 4 月で燃やし尽くしました。CTO は振り出しに戻りました — ツールが悪かったからではなく、トークン支出の 1 ドルすら、実際に出荷された変更と結びつけることができなかったからです。エージェントは問題ありません。問題は可視性のレイヤーです。本稿では、それがどんな姿をしていて、エージェントの各セッションがスクロールバックの壁ではなく構造化された記録になると何が変わるのかを示します。
面白いゲームをしましょう。あなたは CTO です。エンジニアたちに 明細書のないクレジットカードを渡しました。そして今、カード会社が 話を聞きたがっています。Uber の CTO は先月、その「話」に 数字を付けました。通年分の AI コーディング予算が 4 月で消えた、と。 興味深かったのは請求額の大きさではありません。続く 2 つ目の 文でした —「自分が必要だと思っていた予算がすでに吹き飛んだので、 振り出しに戻った」。これを礼儀正しい経営者語から翻訳すると、 こうなります。請求書は払った、何にいくらかかったかも正確に 分かる、ただしそれが何を買ったのかは説明できない、そして この状態をやめたい、と。
ご存じのとおり、現代におけるソフトウェアの買い方とは、エンジニアに トークン単位で課金される何かを渡し、賢く使ってくれと頼んで、 あとは待つことです。The Information は先月、Uber の CTO、 Praveen Neppalli Naga がまさにその「待つ」をやって、 2026 年通年の AI コーディング予算が 4 月の時点ですでに使い切られていた ことを発見したと報じました。スケジュールとしては、なかなか 野心的です。社内の Claude Code の利用量は四半期で約 2 倍になり、 3 月には Uber のエンジニアの 84% がエージェント型コーディングの ユーザーに分類されました。よかったですね。 エンジニア 1 人あたりの支出 は月およそ $500 から $2,000 まで幅があり、CTO 自身は 2 時間の個人デモで $1,200 を溶かしています — これはミッドタウンの法律事務所のジュニアアソシエイトの 時間請求レート相当で、彼らなら最低限タイムシートくらいは出します。 Uber の 2025 年の R&D 全体は $3.4 billion だったので、余力がなかったわけではありません。モデルが 彼らの持っている以上の余力を探しに行き、それを見つけて、 請求してきた、ということです。
セキュリティと隔離の会社がこの局面で書きそうな投稿は 「サンドボックスを使え」というものです。これはその投稿では ありません。 それはすでに書きました。 もちろん書きました。本稿は同じ問題のもう半分、すなわち、 請求書が届き、それを読むことはできるが、誰もが本当に聞きたい ただ一つの質問に答えられない、その部分の話です。質問とは こうです。よし、で、何の代金なのか。
請求書には問題ない。問題は請求書のほうにある。
シート単位の課金はとても考えやすかった。シートの時代が終わった 今こそ、その時代を称えるべきです。GitHub Copilot のシートを 1 つ $19 で 200 席買えば、月 $3,800 の明細が出てきて、誰かが 「で、それで何が手に入ったの」と聞けば、業界全体の形をした 肩すくめで「タブ補完、たぶん」と返し、皆ミーティングに戻って いきました。肩すくめのいいところはスケールすることです。 $3,800 の肩すくめなら問題ない。$1.8 million の肩すくめは、 受託者責任を持つ建物の一画から注目を集めはじめます。
トークン課金のエージェント型ツールはまた別の形をしていて、 これは顔で受け止めて考える必要があります。同じチームで同じ種類の 機能に取り組んでいる 2 人のエンジニアの支出が、40 倍違うことが あります。40 倍です。一人は新しいセッションを開き、一つ頼んで、 一つもらって、セッションを閉じる — $50、終わり、家に帰って パスタを作る。もう一人は、並列のエージェント群にリファクタリングを 6 時間ぶん回させ、ビルドが壊れたらリトライ、別のモデルが最初の リトライは間違っていたと判断したのでまたリトライ、ここまで来ると 意地で 3 回目のリトライ。両方とも出荷しました。一方は $50 の モデル時間で出荷し、もう一方は $2,000 で出荷しました。 請求書には、どちらがどちらか書いてありません。IDE にも 書いてありません。経理には集計の数字が 1 つだけ届き、 エンジニアリングには Slack に「Claude was amazing today」 というスレが立つだけで、失礼ながら、そのどちらも測定では ありません。
これを難しくしているのは値段ではありません。支出のどれもが、 四半期後に監査できるものに紐付いていない、ということです。 PR がマージされる。PR には diff がある。diff にはコミットがある。 コミットには著者がいる。著者は人間です。その人間はどこかの時点で エージェントを使った — たぶん。どのエージェント? どのセッション? どのプロンプト? どれくらいの時間? 何をするのに? 痕跡はどこかで 途切れます、だいたいターミナルのスクロールバックのあたりで。 それはもう閉じられています。誰もスクロールバックなんて見ません。 金融の世界ではこれに名前があって「シュリンケージ(目減り)」と 呼びます。ソフトウェアではまだ、わざわざ名前を付けていません。
ともあれ、この問題の形はエージェント型コーディングよりずっと 古く、業界に長くいて疲れている人なら一瞬で気づくはずです。 クラウド支出も同じ弧を描きました。「AWS の請求書が巨額で、 理由が誰にも分からない」という時代が 5 年続き、そのあと FinOps ツールの世代が登場して、ドルをチームやサービスや 個別のリクエストに紐づけはじめ、今では AWS の請求書は 依然として巨額ですが、その理由はみんな分かっています。 控えめに聞こえますが、これがゲームの全てです。解決策は AWS を使わなくすることではありませんでした。支出を 読み取り可能にすることでした。
エージェント型コーディングは現在、FinOps 以前のクラウドの 状態にあります。支出は本物で、ツールは優れていて、生産性は 本当にあります — そこは誰も否定していません。欠けているのは 「このエンジニアが、このリポジトリで、このセッションで」と 「これらのトークン、これらのコマンド、これらのファイル、 この PR」のあいだの結合組織です。その一文が成立するまで、 請求書に並ぶドルはすべて信仰で払われていることになり、 CFO との会話はあの種類の会話になります。
「可視性」とは、でかい数字の出るダッシュボードの先にある何か、でなければならない。
みんな「オブザーバビリティ」と言ってみんな頷きますが、そこで 同じことを意味している人はほぼいません。コーディングエージェントの ベンダーは喜んでダッシュボードを見せてくれます。ダッシュボードには トークンメーターがあります。採用率があります。右上がりの スライド映えするチャートがあります。これは 2026 年における あらゆるソフトウェアのチャート形状です。これは答えではありません。 「あなたの開発者は今週 23 億トークンの入力を消費しました」は 答えではなく、請求書をフォントサイズを大きくして言い直したものです。
予算を守る、あるいは増やすために CTO が実際に必要なものは、 4 つのパートに分かれます。
スライドで見せられる採用状況
今週、実際にコーディングエージェントを使ったエンジニアは何人か。 どれだけの時間使ったか。どのプロジェクトの、どのリポジトリで。 シートライセンスの発行数でも、API キーの保有者数でも、 「プログラムに登録された人」でもありません — 人間が 開始したセッション、組織が名前を付けられる対象に対するもの、です。
エージェントが触れたすべてのファイル
セッションごと、リポジトリごと、エンジニアごとに — AI エージェントが作成・変更・削除したファイルの正確な集合を、 diff 付きで、セッションを起動したエンジニアと使用したモデルに 紐づけて。仕事の単位は「ファイルの変更」であって「トークン」では ありません。トークンはベンダーがあなたに請求するための単位です。 ファイルはあなたが出荷しなければならないものです。
すべてのコマンド、すべての参照元
エージェントがセッション内で実行したすべてのシェルコマンド、 読んだすべてのファイル、呼び出したすべてのツール、叩いた すべての API。ライブで取得し、中央に保持し、チーム・リポジトリ・ モデル単位でクエリ可能。「昨日エージェントが何をインストールしたか」 は、懐中電灯とジュニア SRE を持って遺跡発掘するのではなく、 クエリになります。
完全な対話、アーカイブ済み
プロンプト、モデルの応答、ツール呼び出し — トランスクリプト全部。 安定した場所に。セキュリティがレビュー可能、エンジニアリング リーダーがサンプリング可能、メールやチャットで既に使っているのと 同じ保持アーカイブにエクスポート可能。セッションは今や記録であり、 誰かがかつてタイプしたものの記憶ではありません。
このリストにないものに注目してください。トークン数はリストに ありません。それは請求書に書いてあります。リストの目的は、 請求書をそれが買ったものの隣に置くことです。そうすれば経理は 割り算ができ、エンジニアリングは雰囲気で議論するのをやめられ、 全員が会議の時間を本来の質問に使えるようになります。
Bromure はこの配管をどうやっているか。
Bromure のエージェント型コーディング機能は、 正直に言うと、もともとこの会話のセキュリティ側の半分のために 作られたものでした。各コーディングエージェントは、あなたの Mac の上で使い捨ての Linux VM の中で動きます。VM はあなたがマウントした プロジェクトフォルダにしかアクセスできません。SSH 鍵もなく、AWS の認証情報もなく、GitHub トークンもディスク上にありません。 ホスト側のクレデンシャルブローカーが、ワイヤ上で、かつ ホワイトリストに登録されたエンドポイントに対してのみ、 スタブトークンを本物に差し替えます。これは すでに語った話 で、汚染された npm パッケージが秘密情報を持ち逃げしようとして 壁にぶつかる、というやつです。
オブザーバビリティの話は、同じ配管を別の目的で使ったものです。 ハイパーバイザーがエージェントとそれが触れるすべての間に座って います。エージェントはファイルを開かない、VM が開く。エージェントは シェルコマンドを実行しない、VM が実行する。エージェントは API コールをしない、ホスト上のプロキシがする。これらの操作の一つ ひとつは — セキュリティ側の仕事がそれを要求するので、当然 — タイムスタンプ、セッション ID、エンジニアのアイデンティティ、 ペイロードを伴う、名前のあるイベントです。Bromure はすでにこれを ローカルに記録しています。Session Tracer と呼ばれていて、 今日 Agentic Coding に同梱されています。
CTO (それから CFO、CISO、そして自分が何を調達したのかを知りたい 購買担当者) のためにループを閉じるピースが、クラウド側です。 開発者の Mac 上の Bromure クライアントが組織にエンロールされると、 これらのローカルトレースはローカルのデバッグ補助であることを やめ、あなたの Bromure エンタープライズサーバーにストリームされる 構造化された記録になります。エンジニア単位、セッション単位、 プロジェクト単位、モデル単位。フィルタ可能、エクスポート可能、 保持可能。エージェント型コーディングのページ の製品コピーではこれを「AI 利用モニタリング」と呼んでいて、 現状は coming soon と書かれていますが、誤解のないように 言うと、本稿はその一因でもあります。
イベントが信頼できる理由は、エージェントの内部にあるサイドカーでも ありませんし、モデル API のラッパーでもありません。どちらも、 エージェントが望めば原理的には回避できます。イベントが信頼できる のは、エージェントがその上で動いている VM のハイパーバイザーが、 誰に頼まれているかどうかに関係なく、すべてのコマンドと すべてのファイルを知らざるを得ないからです。オブザーバビリティは ある意味で無料です。あなたはもう代金を払っています。請求書には 「隔離」と書いてありました。あなたが受け取ったものは、ログ でもあるのです。だからエンジニアが Claude Code を使おうが、 CLI モードの Cursor を使おうが、Codex でも Aider でも、 私たちが聞いたこともない社内エージェントを使おうが、同じ記録が 得られます。なぜなら、記録の単位は「VM がしたこと」であって 「ベンダーが今四半期に公開しようと判断したもの」ではないからです。
では、四半期後の会話はどんな姿になるか。
Uber の数字は考えるのに役立つ題材です、というのも、そこに 失敗は何もないからです。84% の採用率。コードは出荷された。 CTO 自ら袖をまくって実物を使った — ちなみに、デモ 1 回 $1,200 だったとしても、より多くの CTO がそうすべきです。壊れたのは 四半期後の会話です。「倍張りすべきか? 引くべきか? シートを 階層化すべきか? ある種類の仕事については安いモデルに寄せるべきか?」 こうした判断は、集計のトークン請求書からは下せません。 エンジニア別・セッション別・リポジトリ別のテーブルからなら、 すべて完璧に下せます。意思決定が難しくなったのではありません。 テーブルが取り除かれたのです。
明細項目を守ろうとしている人々から聞こえてくる質問のうち、 答え得るものを、だいたい聞かれる順番で並べると以下のようになります。
- どのエンジニアが不釣り合いに大きな価値を出していて、彼らは 何を違うことをしているのか? 支出対変更ファイル数の比が 分布の好ましい側に位置するエンジニアを見てください。彼らの セッショントレースをいくつか読みましょう。彼らがうまく やっていることの一部はスタイル、一部はテクニック、一部は 単にどのモデルに手を伸ばすかです。どれも記録なしには 見えません。(「Alice はなぜそんなに安く大量のコードを 出荷できるのか」は、有益な社内ランチ&ラーンを生む類の 質問ですが、Alice のセッションがどこかで閉じられた ターミナルになっていない場合に限ります。)
- 支出は 1 チーム、1 リポジトリ、1 種類の仕事に集中して いないか? AI 請求の 60% が単一のレガシーサービスから 来ていて、エージェントが flaky なテストにずっと振り回されて いるなら、それは知見です。AI についての知見ではありませんが。
- どのプロジェクトがどのモデルで生産的か? 「Claude は Cursor より優れている」はツイートです。「先月、フロントエンドの リポジトリでは Claude が Cursor の 3 倍の変更ファイル数を 1 ドルあたりで出荷した、Go サービスでは逆だった」は 購買の会話です。
- エージェントは何を、どこにインストールしたのか? これは
セキュリティチームの質問で、同じテーブルに対する同じクエリ
です。エージェントが実行したすべての
npm install、すべてのpip install、すべてのapt-getを、セッション別、 リポジトリ別、パッケージ名でフィルタ可能に。汚染された パッケージがレジストリに現れた日 — まあ、暦のほとんどの 週を漠然と指せばいいわけですが — 「私たちのエージェントは これに触れたか」という質問は、防火訓練ではなくWHERE句に なります。
注意すべき点。これらの質問はどれも、モデルベンダーの ダッシュボードの中からも答えられないし、原理的に答えられない、 ということです。ベンダーが見るのはトークンです。ベンダーは ときどき、リクエストの間だけプロンプトと補完を見ます。ベンダーは あなたのリポジトリも、あなたのファイル変更も、あなたのシェル コマンドも、組織内のどのエンジニアがどれを打ち込んだのかも、 見ません。見られません。ベンダーはワイヤの間違った側にいます。 可視性のレイヤーはあなたの側 — 開発者のマシン、VM、あなたの エンタープライズサーバーの中 — に住む必要があります。仕事が 実際に起きているのはそこだからです。トークンメーターは 現場からの絵葉書です。
免責事項、もちろん。
少しだけ正直なものを書きます。この種の投稿の最悪の版は、 歴史の終わりみたいな財務報告を約束しておいてダッシュボードを 出荷するやつだからです。
Bromure の記録は、エージェントが何をしたかを教えます。 エージェントがしたことが良かったかどうかは教えません。40 ファイル書いて PR を出したセッションは、40 個の悪いファイルを 出荷したかもしれません。記録はそれらを見つけやすくし、 話しやすくし、戻しやすくします。それ自体がレビューするわけでは ありません。diff レビューは依然としてあなたの責任で、 ループ内の人間の責任で、午後 5 時のとても疲れたシニアエンジニアの 責任です。
Bromure の記録は、エージェントが VM の中ですることをカバーします。 エージェントを開く前にエンジニアが頭の中ですることはカバーしません。 実際のセッションが始まる前にエンジニアが IDE の中で Claude と 5 分間する会話は、このテープには載っていません。これは実際の ギャップです。私たちはこれを埋めるふりをしません。もっと 変な製品にしないと埋められないからです。
Bromure の記録はあなたの側のワイヤにあります。それが本旨ですが、 同時にそれは、保持ポリシー、アクセス制御、データ取扱い契約が あなたの側に住まなければならないということでもあります。 プロンプトにはコードが含まれます。コードには、開発者が貼り付ける べきでなかったのに絶対に貼り付けたシークレットが含まれます。 記録は仕事と同じくらいセンシティブで、そのように扱うべきです。 ストレージはあなたのもの、責任もあなたのもの。(「金融の世界では これに名前があって『シュリンケージ』と呼びます」 — ただし 今やそのシュリンケージは SQL テーブルで、監査できます。)
最後に、これはもっと大きな物語の一部です。もう一つの部分は すでに扱いました — VM とクレデンシャルブローカーの中で コーディングエージェントを走らせることが、次の汚染された npm パッケージにあなたの SSH キーを持ち逃げさせない方法だ、という 話です。セキュリティの物語とオブザーバビリティの物語は同じ 配管です。経費精算を出す日が違うだけです。
請求書は払いましょう。ただし、何を買ったか分かったうえで。
Uber のあのセリフ — 自分が必要だと思っていた予算が すでに吹き飛んだので、振り出しに戻った — は、今年たくさんの CTO のセリフになります。ずっとそうなる運命でした。モデルが 午後 2 時にどれだけ野心的な気分かによってのみ食欲が制約される ツールに対するトークン課金は、計装せずに導入したあらゆる会社で あの一文を生み出します。問題はエージェントではありません。 問題は配管です。
Bromure Agentic Coding は、しぶしぶ ながらも、配管が仕事をしているときの姿そのものです。各エージェントは 自分の VM の中で動き、各セッションは構造化された記録になり、 各記録は経理チームと CISO の両方がクエリできる場所にストリーム され、すでに気に入っているエージェントたちは何も変わりません。 あなたは引き続き請求書を払うでしょう。ただ、ようやく、それが 何を買ったかを知ったうえで払うでしょう — 最後に確認した限り、 それはクレジットカード会社がその顧客に求める最低限のことです。
自分が必要だと思っていた予算がすでに吹き飛んだので、振り出しに戻った