Metaは、社内でのAI支出が予想以上に多いことに気付いた後、集中型AIモニタリングおよび支出管理システムの開発を進めています。この決定は、企業がAIからのリターンがコストに見合うかどうかを検討していることを示しています。
同社は約6,000人の従業員にメモを配布し、AI支出上限、予算、トークン制限に関する計画を詳細に示しました。AIゲートウェイの下では、チームはAI使用状況の概要にアクセスでき、支出の異常な急増があると自動的に通知が送られます。構造化されたトークン管理は2027年までに完全に実装される見込みです。
メモでは、Metaが社内でのAI導入が急速に拡大しており、2026年には従業員のAI利用に数百億ドル規模の支出が見込まれると指摘されました。
トークンマックスの余波 MetaがAIの利用促進から利用管理へと焦点をシフトしたことは、米国企業に共通するテーマを示しています。同社はかつて、従業員にAI利用を促すために内部リーダーボード(AnthropicのAIシステムにちなんで「Claudeonomics」と名付けられた)を設置していましたが、Metaは現在このリーダーボードを運用していません。
この広範な傾向には「トークンマックス(tokenmaxxing)」という名前が付いており、内部採用指標を膨らませるためや単に消費するために、可能な限り多くのAIトークンを使用する行為を指します。同様の状況は、Amazonでも従業員がトークン使用を追跡するリーダーボードを設置した後に発生しましたが、同社は5月下旬に無駄な支出を促進しているとの懸念からそれを撤廃したと、Business Insiderが報じています。
Uberの経験は、コストがいかに急速に螺旋状に増大するかを示しています。同社は2026年のAIコーディング予算全額を4月までに使い切り、年初からわずか4か月で予算を消化しました。UberのCOOであるAndrew MacdonaldはRapid Responseに対し、トークン支出と測定可能な成果を結びつけるのに苦労していると語りました。「そのリンクはまだありませんよね?」とMacdonaldは述べました。「ある統計と『さて、実際に25%多くの有用な消費者向け機能を生み出した』という点を結びつけるのは非常に難しいのです。」
業界が未解決のコスト問題 予算上の圧力はシリコンバレーをはるかに超えています。KPMGの調査によると、Wall Street Journalが最初に報じたところ、企業のわずか26%がAIコストを包括的に把握しており、50%が部分的に可視化している、22%は可視化がなく、請求書を受け取って初めて支出を認識しています。KPMGのグローバルAIリーダーであるSteve Chaseは、クライアントが年間トークンまたはクラウドコンピューティング予算を数か月で使い果たすケースを支援していると述べています。
Microsoftは最近、Claude Codeのほぼすべての直接ライセンスを撤回し、エンジニアを自社のGitHub Copilot CLIへと誘導したとFortuneが報じました。これは、Anthropicのツールを従業員に提供してからわずか6か月後のことで、利用が予想以上に急速に拡大したことが背景にあります。
経済的観点から見ると、労働コスト削減によるAIの早期収益化に対する当初の期待は過度に楽観的だったことが示唆されます。NVIDIAの応用ディープラーニング部門副社長Bryan CatanzaroはAxiosに対し、同部門の計算コストはすでに人件費を上回っていると明らかにしました。Goldman Sachsは、エージェント型AIが2030年までにトークン消費を24倍に増加させ、月間消費量が120クアドリリオン(10^15)トークンに達すると予測しています。
さらに、Gartnerはトークンコストの低下がエンタープライズAIアプリケーションのコスト削減につながるとは限らないと予測しています。エージェント型AIアルゴリズムはタスクあたりはるかに多くのトークンを使用し、プロバイダーは自社側の総節約分を維持する可能性が高いからです。「最高製品責任者は、コモディティトークンのデフレとフロンティア推論の民主化を混同すべきではありません」とGartnerの
