なぜ企業のGenAI投資の95%がROIゼロなのですか？

MIT NANDAは、外部ベンダーと組んだ案件は67%が成功する一方で内製は33%しか成功しないと報告しています。失敗の真因は、(1)PoC止まりで本番運用に渡せない、(2)データガバナンスと業務プロセス再設計が伴わない、(3)経営層と現場が同じKPIで合意できていない、の3点に集中しています。GenAIモデルを買えば成果が出る、という前提が崩れている時代です。

AI高業績企業6%の共通点は何ですか？

McKinsey 2026・Stanford HAI 2026・BCG 2026の3社が指す共通点は、(1)EBITの5%超をAIに帰属できる業務再設計、(2)リスキリングを含む人材変革をAI導入と一体で進める体制、(3)CIO/CDO主導ではなくCEO主導のガバナンス、の3点です。「導入」より「人と組織」が差別化要因になっています。

WARPはこの『GenAI Divide』にどう対応していますか？

WARPは内製で詰む前に伴走する『パートナーシップ型AI導入』を主軸にしています。仕様駆動開発（SDD）でAI実装を再現可能にし、社内ナレッジは国内サーバーのZEROCKに置きながら、業務プロセスとリスキリングを同時に設計します。3か月で立て直すフレームを実装パートナーとして提供しています。

GenAI Divide：95%が失敗する真因——MIT NANDA・McKinsey・Stanford HAIが揃って示す現実

株式会社TIMEWELLの濱本隆太です。最近、お客様との会話で必ず話題に上がる数字があります。「95%」と「6%」です。前者はMITが報告した企業GenAI投資の失敗率、後者はMcKinseyが定義する『AI高業績企業』の割合。3つの主要レポートが奇妙なほど揃ったタイミングでこの数字を出してきたことで、私たちの界隈では「GenAI Divide」という言葉が日常語になりつつあります。

直訳すれば「生成AIによる分断」。導入できた企業とできない企業、内製で詰む企業と外部パートナーと組んで抜け出す企業、そのあいだに開いた裂け目のことを指します。MIT NANDA、McKinsey、Stanford HAIの3者がここまで似た結論にたどり着いたのは初めてに近く、もはや「うちは様子見でいい」というスタンスが許される段階ではなくなりました。私自身、WARPでお客様のAI導入に伴走するなかで、この裂け目に飲み込まれていく企業と、すり抜けて成果を出していく企業の両方を間近で見てきました。今日はその違いを、3つのレポートの一次情報をたどりながら正直に書いてみます。

3つのレポートが揃って指す「GenAI Divide」とは

まずMIT NANDAの「The GenAI Divide: State of AI in Business 2025」から見ていきます [1]。この報告書のいちばん有名な数字が、企業による生成AI投資300〜400億ドルのうち、95%がビジネスリターンを生み出していないというものです。150人の経営層インタビュー、350人の従業員調査、300件の公開AI導入案件の分析という、定量・定性を組み合わせた調査設計で、調査範囲としてはかなり大きい部類に入ります。

ここで誤解されがちなのですが、「95%が失敗」というのは「AIが動かなかった」という話ではありません。技術的にはモデルもツールも動いている。にもかかわらず、損益計算書に変化が現れない。MITの研究チームはこの状態を「学習のギャップ」と呼んでいます。多くの生成AIシステムはフィードバックを蓄積せず、業務文脈に適応せず、時間とともに改善されないまま放置されている。だから一見動いていても、企業の力にはならない。これがMITの中心的な主張です。

Stanford HAIの「2026 AI Index Report」は、別の角度から同じ風景を映し出します [2]。生成AIは3年で世界人口の53%に到達し、PCやインターネットの普及速度を上回りました。組織レベルの採用率は88%、いずれかの業務機能に生成AIを使う組織は70%に達しています。普及のスピード自体は文句のつけようがありません。ところがエージェント型AIの本番運用は、ほとんどの業務機能でまだ一桁パーセント。広く使われているけれど、深くは使えていない。これがStanfordの観察です。

McKinseyの「The State of AI: How organizations are rewiring to capture value」は、ここに収益視点を重ねます [3]。AIから5%以上のEBIT寄与を実感している企業はわずか6%。残り39%は何らかの寄与は感じているものの大半は5%未満で、半数以上はそもそもEBITに影響が出ていません。「導入率は上がっているのに、儲けにつながっている企業はほとんどいない」という構造が、世界共通の現実になっているわけです。

3つのレポートを並べたとき、データの取り方も視点も違うのに、結論はほぼ重なります。導入のハードルは下がった。だが、そこから先で大きな差が開いている。私たちが今直面しているのは、技術導入の問題ではなく「導入後に成果を出せる組織になれるか」の問題です。GenAI Divideという言葉が日本でもじわじわ広がってきたのは、感覚として腑に落ちるからだと思います。

95%が失敗する4つの真因——MITの調査と現場の肌感覚

ではなぜ、これほど多くの企業がROIゼロから抜け出せないのか。MITの報告書が挙げる構造的な原因は4つに整理できます [1]。私が現場で見てきた失敗パターンとも非常によく重なるので、ひとつずつ実例を交えて整理させてください。

ひとつ目は「内製の限界」です。MITによると、外部の特化型ベンダーと組んだAI導入の成功率は67%、内製は33%。倍の開きがあります。日本でも、たとえばrenue社の2026年版レポートが、内製のPoCに過剰投資した結果、本番運用に渡せず疲弊する「PoC疲労」の構造を整理しています [4]。私が伴走したケースでも、社内のエース級エンジニアを3〜4人投入して内製したものの、評価基準が曖昧で本番にリリースできず、半年でプロジェクトが空中分解してしまった事例がありました。AIモデルを動かすことと、業務に組み込んで運用し続けることのあいだには、想像以上に深い谷があります。

ふたつ目は「シャドーAI」の蔓延です。MITの調査では、企業がライセンス契約しているAIツールを使っている従業員は40%にとどまる一方で、ChatGPTなど個人で使えるAIを日常業務に使っている従業員は90%にのぼると報告されています [1]。意思決定者の頭の中ではPoCが進んでいるあいだに、現場はとっくに無断で生成AIを使い、機密情報を投げ込みすらしている。経営層が見ているプロジェクト管理表と、現場の実態とのあいだに大きなずれが生まれている企業は本当に多いと感じます。

3つ目は「投資配分のズレ」です。MITによると、企業がAI予算を割いている領域の半分以上は営業・マーケティングなど「外向きの華やかな機能」。ところが実際にROIが出やすいのはバックオフィスの自動化、つまり契約レビューや調達、リスク管理といった地味な領域です [1]。これはNTTデータが製造業のPoC構造を分析した記事でも同じ指摘がされており、「精度の問題ではなく構造的ミスマッチ」だと整理しています [5]。「人にウケる場所」ではなく「コストの集中する場所」にAIを当てるという、ごく当たり前の経営判断ができている企業は、想像より少ないというのが私の実感です。

4つ目は「脆いワークフロー」と「組織側の受け皿不足」です。AI単体ではどれほど高精度でも、業務プロセスや権限設計、データガバナンスが整っていなければ、すぐに壊れます。私が見てきた失敗事例の多くは、ここで止まっていました。技術部門が頑張ってモデルを作る、しかし業務部門が承認フローを変えてくれず、結局AIが下書きを作って人が全部書き直す、という二重作業に陥ってしまう。経済産業省がAI事業者ガイドライン1.2版で、AIエージェントの自律実行に対する人間の判断介在（Human-in-the-Loop）を明示したのも、まさにこうした統制不能のリスクを念頭に置いてのことだと読めます [6]。

この4つの真因を眺めていて気づくのは、どれもAIモデルの性能とは無関係だということです。賢いAIを買ってきても、組織の構えが整っていなければ、せっかくの能力を引き出せない。MITの結論を一言で言うなら、「ボトルネックはモデルではなく学習プロセスと組織」になります。

勝つ6%の企業が揃ってやっていること

逆側から見てみます。McKinsey、Stanford HAI、BCGが共通して指している「勝つ側」の特徴は、奇妙なくらい一致しています。表面的なツール選定や予算規模ではなく、もっと地味で、もっと組織的な要素が決め手になっている、というのが共通の結論です。

ひとつ目は、ワークフロー再設計を本気でやっていること。McKinseyが25個の組織変数を比較して、EBIT寄与にもっとも効くと結論づけたのが「ワークフローの抜本的な再設計」でした [3]。ところが実際にそれをやっている企業は、生成AIを使っている組織のうち21%にとどまります。多くの企業が、既存業務のうえに生成AIをポンと乗せて満足しています。それでは効果は線形にしか伸びません。一方で、勝っている6%は、業務手順そのものを生成AI前提に組み直しているという指摘です。

ふたつ目は、CEOがガバナンスを握っていること。McKinseyは、CEOがAIガバナンスを直接監督している組織で、生成AIによるEBIT寄与がもっとも大きいと報告しています [3]。とくに売上5億ドル以上の大企業でその傾向が顕著です。ところが実態として、CEOがAIガバナンスを所管している企業は28%にすぎません。BCGの「AI Radar 2026」も同じ方向の結論で、Trailblazer（先進企業）CEOの62%が、今後4年で組織構造そのものを大きく変えると見込んでいると報告しています [7]。AI導入が「CIO案件」「CDO案件」のままでは、業務横断の再設計まで踏み込めない。これは日本企業にとっても重い指摘です。

3つ目は、リスキリングと役割再定義を同時にやっていること。BCGの調査によれば、Trailblazer企業はAI予算の約60%をリスキリングと再雇用に投じています。Pragmatist企業は27%、Follower企業は24%にとどまるので、3〜4倍の差があります [7]。そして実際に、Trailblazer企業では従業員の70%がAI向けにリスキル済みなのに対し、Pragmatistは41%、Followerは35%。BCGが別レポートで指摘しているように、今後2〜3年で米国の50〜55%の仕事がAIで再構成されることになるなら、これは単なるトレーニング予算ではなく経営判断そのものになります [8]。

4つ目は、外部パートナーをうまく使っていること。MITの「外部67%対内製33%」は、決して「丸投げが偉い」という話ではありません。実際に成功している企業の多くは、内製チームと外部パートナーを組み合わせ、ナレッジ移転までを設計に組み込んでいます。Anthropicが2026年5月にBlackstone、Hellman & Friedman、Goldman Sachsらとエンタープライズ向けのAIサービス会社を立ち上げたニュースは象徴的でした [9]。CFOのKrishna Rao氏が「企業からのClaude需要が、単一の提供モデルでは間に合わなくなっている」とコメントしているように、フロンティアモデルの開発元自身が「実装を現場に届ける専門組織」を別立てしないと供給が追いつかなくなっているのです。

この4点、すべて「人と組織と運用」の話です。モデル選定の話ではない。GenAI Divideの本質が、ここに凝縮されています。

「内製で詰む前にWARP」——3か月で立て直すフレーム

ここからは少しTIMEWELL寄りの話になります。私たちはWARPというAIコンサルティングサービスを通じて、ここまで述べた4つの失敗パターンに具体的に対処するフレームをお客様と回しています。詳しくはWARPコンサルティングのページをご覧いただきたいのですが、本質だけ取り出すなら「3か月で立て直す」という時間軸が前提です。1年かけて理想形を描くのではなく、まず3か月で現実的な再起動を行う、という設計です。

最初の月は徹底的に棚卸しに使います。社内のシャドーAI利用、PoCの残骸、業務プロセス、データの所在、人材スキル、KPI。MITが「学習のギャップ」と呼んだ部分を、現状の業務文脈で可視化していきます。ここで多くのお客様が「自社のAI状況をここまで言語化したのは初めてだ」と仰います。逆に言えば、3年ほどそれをせずにAI導入を進めてしまっている企業が多数派、ということでもあります。

2か月目は「どこにAIを当てるか」の選択と集中です。MITの指摘どおり、営業・マーケに過剰投資されていることがほとんどなので、まずバックオフィスや専門業務のうち「コストが集中していて、判断ルールが言語化しやすい領域」を特定します。私たちが伴走するケースでは、契約レビュー、輸出管理、ナレッジ検索、社内問い合わせ対応、月次決算オペレーションといった領域が頻繁に候補に上がります。同時に、業務プロセスとデータガバナンスを再設計し、AIに「動ける足場」を用意します。経産省のAI事業者ガイドライン1.2版が要求するHuman-in-the-Loopの設計も、この段階で組み込みます [6]。

3か月目は実装と教育の並走です。AIの実装は、TIMEWELLが開発している社内ナレッジ基盤のZEROCKを中心に、GraphRAGや業務特化エージェントを組み合わせて行います。データを国内サーバーに置きつつ、業務ロジックを構造化された知識として蓄積する。これと並行して、現場担当者向けのリスキリング研修を回します。BCGがAI予算の60%をリスキリングに使えと言うのは、これを後回しにすると結局AIを使いこなせず投資が空転するからです [7]。

「内製で詰む前にWARP」と社内でよく言うのですが、これは単なるキャッチコピーではなく、MITの「内製33%対外部67%」というデータをそのまま現場運用に落とし込んだ言葉です。完全な丸投げでも完全な内製でもなく、外部の伴走を一定期間挟んで、ナレッジ移転までを設計に入れる。3か月後にお客様が自走できる状態をゴールに置くからこそ、私たちは「コンサル＋実装＋研修」を一体で提供しています。気になる方は、/contact?product=warp からお気軽にご相談ください。

パートナーシップ型導入の具体像——WARPが見ているもうひとつのDivide

最後に、WARPの現場視点でもうひとつ伝えておきたいことがあります。GenAI Divideは「外向きの分断」だけではなく、「企業内部の分断」も生んでいるという話です。

私が伴走したある中堅企業では、経営層が「うちはAIに乗り遅れていない」と認識していました。実際に複数の生成AIツールを契約し、PoCも走っていました。ところが現場ヒアリングを進めると、営業はChatGPTを個人課金で使い、開発部門はGitHub Copilotを使い、管理部門は何も使えずに孤立し、ガバナンス担当はガイドラインを作っているけれど誰も読んでいない、という状態でした。MITが「シャドーAI」と呼ぶ現象が、ひとつの会社のなかで、しかも部門ごとに別の形で進行していたわけです。

このとき大事なのは、ガバナンスで縛ることではありません。むしろ縛ろうとすると、ますます現場が地下に潜る。WARPでは、シャドーAIを敵視するのではなく「現場が見つけたヒント」として吸い上げ、業務適用の候補として整理することから始めます。経済産業省のガイドラインも、過度な禁止より「リスクを管理しながら使うこと」を推奨する方向に進んでいます [6]。日経クロステックが報じた1.2版の改訂趣旨も、AIの自律的な意思決定に人間の判断を介在させる仕組みづくりが主眼でした [10]。「禁止」ではなく「設計」によってリスクを抑える、という発想に切り替えないと、現場のスピードは確保できません。

もうひとつ、私が個人的に強く感じているのは、日本企業の場合「リスキリング」と「業務再設計」を切り離してしまいがちなことです。研修は人事、業務再設計は事業部、AI導入は情シス、というふうに役割が縦割りされ、結果としてどこにもオーナーがいない。BCGが指摘するように、AI Trailblazer企業ではこの3つが同じテーブルに乗っています。CEOがガバナンスの最終責任者になることで、ようやくCFO・CTO・CHROが横並びの議論をできるようになる、というのがMcKinseyの指摘そのままです [3]。WARPはこの「同じテーブル」を3か月のあいだ、外部の立場で確保する役割を担っています。

正直に書きます。私たちもすべての企業のすべての悩みを解けるわけではありません。社内に強い覚悟と推進役がいる企業は、ZEROCKやBASEのようなプロダクトを単独で導入して、自走で成果を出していかれる方も多いです。逆に、社内に推進役がいない、PoC疲労で組織が疲れている、経営層と現場の温度差が大きい、こういう局面でこそWARPの伴走が効きます。「うちはどちらだろう」と迷う段階で、まず30分のオンライン相談に来ていただきたいと思います。MITとMcKinseyの数字を、自社の現実と突き合わせる時間として使っていただければ、それだけでも価値があるはずです。

内製で詰む前にWARP——次の一歩

GenAI Divideは、もう「来る・来ない」を議論する段階ではありません。すでに開いている裂け目を、自社がどちら側でまたぐのか、という選択の問題です。MIT NANDAの95%、McKinseyの6%、Stanford HAIの53%、BCGの70%——これらの数字はすべて、同じ現実の別の側面を映しています。AIを導入したかどうかではなく、AIで会社の損益と組織を変えられたかどうかが、これからの企業価値を決めます。

WARPは、その意思決定と実装に伴走するためにあります。AIモデルを売る会社でも、ツールを売る会社でもなく、お客様の業務と組織にAIを「噛ませる」ところまで責任を持つチームです。詳しいサービス内容はWARPコンサルティングページに、お問い合わせは/contact?product=warpからお願いします。最初の30分の相談は無料です。MITとMcKinseyの数字を、自社の現実に翻訳する第一歩として、お気軽にお声がけください。

参考文献

[1] MIT NANDA, "The GenAI Divide: State of AI in Business 2025"
https://mlq.ai/media/quarterly_decks/v0.1_State_of_AI_in_Business_2025_Report.pdf

[2] Stanford HAI, "The 2026 AI Index Report"
https://hai.stanford.edu/ai-index/2026-ai-index-report （PDF版: https://hai.stanford.edu/assets/files/ai_index_report_2026.pdf ）

[3] McKinsey & Company, "The state of AI: How organizations are rewiring to capture value"
https://www.mckinsey.com/capabilities/quantumblack/our-insights/the-state-of-ai

[4] 株式会社renue「生成AI PoC失敗パターン12選＋本番移行7原則2026」
https://renue.co.jp/posts/generative-ai-poc-failure-patterns-production-transition-2026

[5] NTTデータ DATA INSIGHT「なぜ、製造業のAIはPoCで止まるのか——『精度の問題』ではない『構造的ミスマッチ』の正体」
https://www.nttdata.com/jp/ja/trends/data-insight/2026/0501/

[6] 経済産業省・総務省「AI事業者ガイドライン（第1.2版）」（令和8年3月31日）
https://www.meti.go.jp/shingikai/mono_info_service/ai_shakai_jisso/20260331_report.html

[7] BCG, "AI Transformation Is a Workforce Transformation" (2026)
https://www.bcg.com/publications/2026/ai-transformation-is-a-workforce-transformation

[8] BCG, "AI Will Reshape More Jobs Than It Replaces" (2026)
https://www.bcg.com/publications/2026/ai-will-reshape-more-jobs-than-it-replaces

[9] Anthropic, "Enterprise AI Services Company"（2026年5月）
https://www.anthropic.com/news/enterprise-ai-services-company

[10] 日経クロステック「AIの自律実行に『人間の判断介在を』、国がAI事業者ガイドライン改定へ」
https://xtech.nikkei.com/atcl/nxt/column/18/00001/11580/

[11] Fortune, "MIT report: 95% of generative AI pilots at companies are failing"
https://fortune.com/2025/08/18/mit-report-95-percent-generative-ai-pilots-at-companies-failing-cfo/

GenAI Divide：95%が失敗する真因——MIT NANDA・McKinsey・Stanford HAIが揃って示す現実

3つのレポートが揃って指す「GenAI Divide」とは

95%が失敗する4つの真因——MITの調査と現場の肌感覚

勝つ6%の企業が揃ってやっていること

「内製で詰む前にWARP」——3か月で立て直すフレーム

パートナーシップ型導入の具体像——WARPが見ているもうひとつのDivide

内製で詰む前にWARP——次の一歩

参考文献

AI導入について相談しませんか？

メルマガ登録

あなたのAIリテラシー、診断してみませんか？

関連する基礎知識

課題解決ソリューション

WARPについてもっと詳しく

関連記事

AIで成果を出す企業はわずか6%——McKinsey「State of AI 2026」が示す勝者の条件5つ

AI導入の40%が失敗する理由【2026年最新版】Stanford HAI 88%・Gartner 40%キャンセルが示す3つの罠と回避策

【2026年5月最新】AI事業者ガイドライン第1.2版を完全解説：AIエージェント規制とHuman-in-the-Loop義務、企業実務への影響

メルマガ登録