AIコンサルのコラム一覧に戻る
AIコンサル

Nvidia GTC 2025徹底解説:AI推論時代へのシフトと次世代GPU「Vera Rubin」の衝撃

2026-01-21濱本

毎年恒例、テクノロジー業界の注目を集めるNvidiaのGPU Technology Conference(GTC)が今年も開催され、AIの未来を形作る最新技術とロードマップが発表されました。Brainstormのエピソード82でFrank Downing氏が語ったように、今回のGTC 2025は、特にAIの「推論(Inference)」に焦点を当てた点で、過去のカンファレンスとは一線を画すものとなりました。これまでAIモデルの「トレーニング(Training)」性能向上を前面に押し出してきたNvidiaが、なぜ今、推論へと戦略の舵を切ったのでしょうか?  本記事では、GTC 2025で発表されたNvidiaのハードウェアとソフトウェアの進化、特に次世代GPUアーキテクチャ「Blackwell」とその先の「Vera Rubin」がもたらす驚異的な性能向上、そして激化するカスタムシリコンとの競争、さらには人型ロボットや自動運転といった物理AIへの展開まで、Frank Downing氏の解説を基に、その核心とビジネスへの影響を深く掘り下げていきます。AIチップの覇者であるNvidiaが描く未

Nvidia GTC 2025徹底解説:AI推論時代へのシフトと次世代GPU「Vera Rubin」の衝撃
シェア

株式会社TIMEWELLの濱本です。

毎年恒例、テクノロジー業界の注目を集めるNvidiaのGPU Technology Conference(GTC)が今年も開催され、AIの未来を形作る最新技術とロードマップが発表されました。Brainstormのエピソード82でFrank Downing氏が語ったように、今回のGTC 2025は、特にAIの「推論(Inference)」に焦点を当てた点で、過去のカンファレンスとは一線を画すものとなりました。これまでAIモデルの「トレーニング(Training)」性能向上を前面に押し出してきたNvidiaが、なぜ今、推論へと戦略の舵を切ったのでしょうか? 

本記事では、GTC 2025で発表されたNvidiaのハードウェアとソフトウェアの進化、特に次世代GPUアーキテクチャ「Blackwell」とその先の「Vera Rubin」がもたらす驚異的な性能向上、そして激化するカスタムシリコンとの競争、さらには人型ロボットや自動運転といった物理AIへの展開まで、Frank Downing氏の解説を基に、その核心とビジネスへの影響を深く掘り下げていきます。AIチップの覇者であるNvidiaが描く未来とは何か? そして、それが私たちの社会にどのような変革をもたらすのか?詳細に解き明かしていきましょう。

推論への戦略的転換:GTC 2025が示したNvidiaの新時代とハードウェアの進化 競争環境の激化:カスタムシリコンの台頭とNvidiaの対抗策 物理世界へのAI展開:人型ロボットと自動運転の最前線 まとめ 推論への戦略的転換:GTC 2025が示したNvidiaの新時代とハードウェアの進化

Nvidiaが年に二度開催する主要カンファレンスの一つ、春のGTCは、これまで主にデータセンター向け製品、特に最新のGPUハードウェアとそのロードマップを発表する場として知られてきました。近年のAIブームの影響もあり、その内容はAIに特化したものへと進化してきましたが、GTC 2025はこれまでとは異なる明確な変化を見せました。Frank Downing氏が指摘するように、今回のGTCの最大のポイントは、AIモデルの「トレーニング」から「推論」へと、その重点が劇的にシフトしたことです。

これまでNvidiaは、Hopperアーキテクチャが前世代のAmpereと比較してAIトレーニング性能を4倍向上させたように、大規模モデルのトレーニング効率をいかに高めるかを強調してきました。しかし、GTC2025ではトレーニングに関する言及は最小限に留まり、発表の大部分が「推論」に割かれました。

なぜこれほどまでに「推論」が重視されるようになったのでしょうか? その背景には、AIモデルを実際に数十億人のユーザーに提供する段階において、推論の効率が大きな課題となっている現状があります。特に、大規模言語モデル(LLM)などの推論モデルは、従来のモデルよりも圧倒的に多くのトークン(計算単位)を生成するため、これをリアルタイムかつ低コストで処理する能力が求められています。Nvidiaは、この課題に対し、ソフトウェア面での効率化と、ハードウェア面での進化の両輪で応えようとしています。

ハードウェアの進化に関しては、Nvidiaが2027年までの長期ロードマップを発表しました。現在市場投入が進められている「Blackwell」アーキテクチャの次世代として、「Vera Rubin」というコードネームが発表され、その進化の方向性が示されました。

従来のように単体のGPUチップの性能向上を追求するのではなく、Nvidiaはデータセンター全体の計算密度と効率を最大化する方向へシフトしています。つまり、個々のチップの性能だけでなく、データセンター内の「ラック」単位でいかに高密度な計算を可能にするかが、今後の焦点となるのです。

この高密度化により、性能は飛躍的に向上します。具体的な数値として、2027年に登場予定の「Vera Rubin Ultra」は、現在の「Blackwell」と比較して、理論上の最大計算性能(FLOPS)が14倍にも達すると発表されました。これは、AIの処理能力が大幅に向上し、同時にコスト削減も実現する可能性を示しています。

ここで、AIにおける「トレーニング」と「推論」の違いを改めて整理しておくことが重要です。Frank Downing氏の説明によれば、トレーニングはAIモデルを「構築する」プロセスであり、推論は構築されたAIモデルを「実行する」プロセスです。効率的なトレーニングには、できるだけ多くのGPUを同期させ、大規模な計算を並列処理する「スケールアウト」が重要でした。数年前は256個のGPUを接続するだけでも画期的でしたが、現在ではXAIのColossusクラスターのように10万個ものGPUを連携させるレベルにまで技術が進んでいます。これにより、AIモデルのトレーニング時間は大幅に短縮されました。

一方、推論では、「スケールアウト」も重要ですが、それ以上に「スケールアップ」、つまり個々のチップやラックの能力を高めることが鍵となります。推論では、限られたハードウェアリソースで多数のユーザーリクエストにリアルタイムで応える必要があるため、メモリ容量の増加が特に重要視されます。

過去2~3年、このメモリ容量という点では、競合であるAMDがNvidiaのH100やH200(Hopper世代)を上回る製品を提供してきました。理論的には、メモリ容量が大きい方が推論性能で有利になります。しかし、実際にはNvidiaのチップが優位性を保ってきました。これは、Nvidiaが長年にわたって築き上げてきたCUDAなどのソフトウェアエコシステム(ソフトウェアスタック)が圧倒的に成熟しており、ハードウェアのスペック差を補って余りある最適化を可能にしてきたためです。

しかし、今年後半から来年にかけて出荷されるBlackwell世代、特にその上位版であるBlackwell Ultra以降では、Nvidiaはチップあたりのメモリ容量でAMDに追いつくレベルになります。これにより、推論性能におけるNvidiaの優位性はさらに盤石なものとなると考えられます。この推論への注力とハードウェアの進化は、NvidiaがAIコンピューティングのリーダーシップを維持し、拡大していくための明確な戦略と言えるでしょう。

競争環境の激化:カスタムシリコンの台頭とNvidiaの対抗策

NvidiaがAIコンピューティング市場で圧倒的な地位を築く一方で、その独占的な立場を崩そうとする動きも活発化しています。特に注目されるのが、特定の用途に特化したカスタムシリコンの開発です。これには、GoogleのTPUやAmazonのInferentia/Trainiumのようなハイパースケーラー企業が独自に開発するものと、CerebrasやGrok(「Q」で始まる方)のようなスタートアップが含まれます。Frank Downing氏が指摘するように、これらの企業の多くは、Nvidiaの汎用的なGPUに対して、特に「推論」処理において性能の優位性を確立しようとしています。

Cerebrasはその巨大なウェハスケールチップを活用し、Grokは独自の超高速アーキテクチャを駆使することで、推論タスクにおけるレイテンシ(遅延)やスループット(処理能力)の向上をアピールしています。これらのアプローチは、特定のワークロードにおいてはNvidiaを上回る可能性を秘めており、長期的な視点で見れば有力な対抗馬となり得ると考えられています。しかし、Nvidiaの進化のスピードは驚異的であり、そのペースに追随することは極めて困難です。

今回のGTCで、Nvidiaがプレゼンテーションの冒頭から1時間半以上もの時間を割いて推論に焦点を当てたことは、まさにこれらのカスタムシリコンを開発するスタートアップに対する明確な牽制であり、対抗策であると言えるでしょう。Nvidiaは、自社のGPUが汎用性を保ちながら、推論性能においてもリーダーシップを維持できることを強くアピールしたのです。

ここで興味深いのは、Frank Downing氏とSam氏の間で交わされた「Grok」に関する会話です。Elon Musk氏が率いるxAIのLLM「Grok」(「K」で始まる方)がより多くのユーザーにスケールするためには、皮肉にも推論に特化した高性能チップであるGrok(「Q」で始まる方)が必要になるかもしれない、という指摘がありました。これは、AIエコシステムにおけるハードウェアとソフトウェアの密接な関係性を示唆しています。

今回のGTCでの発表内容について、市場に大きな驚きがあったかと言われると、必ずしもそうではなかったかもしれません。Nvidiaが順調にロードマップ通りに技術革新を進め、期待通りの性能向上を実現していることは、ある意味で「予定調和」とも言えます。しかし、この「期待通り」の進捗こそが、AI技術全体の発展、特にコスト削減という大きな課題を解決するために不可欠なのです。AIチップの性能はムーアの法則を遥かに超えるペースで向上していますが、このトレンドを維持するためには、Nvidia自身、あるいは新たなイノベーターによる継続的な技術革新が欠かせません。Nvidiaが今回、実行上の大きな失敗や停滞を見せることなく、最前線で技術を進化させ続けている事実は、AIの未来に向けた基盤が着実に強化されていることを示しています。

この競争環境とNvidiaの戦略を理解する上で、もう一つ重要なのが、GTCのステージ上でJensen Huang CEOが言及したWaymo(Google傘下の自動運転企業)の事例です。Waymoは、データセンターでのモデルトレーニングと、車両に搭載される推論エンジンの両方でNvidiaのチップを使用していると明言されました。これは以前から噂されていましたが、公式に確認されたことの意義は大きいでしょう。なぜなら、Googleは自社で高性能なカスタムシリコンであるTPU(Tensor Processing Unit)を開発・運用している数少ない企業の一つだからです。そのGoogleが、自動運転という極めて高い性能と信頼性が求められる分野で、依然としてNvidiaのGPUを選択しているという事実は、Nvidiaの製品が持つ優位性を強く示しています。

Frank Downing氏の分析によれば、NvidiaのGPUは、CPUのような完全な汎用性はないものの、Grok(Q)のような極端に特化したチップほど用途が限定されていません。AIや並列処理に最適化されつつも、幅広いワークロードに対応できる柔軟性を持ち合わせています。この「柔軟性と高性能の絶妙なバランス(Goldilocks zone)」こそが、Nvidiaの強みであり、Googleのような企業がTPUを持ちながらもNvidiaの製品を採用する理由でもあります。

特定のタスクに特化しすぎると応用範囲が狭まり、汎用すぎると性能が出ない。Nvidiaはこのトレードオフの中で、最適なポジションを確立してきたと言えるでしょう。この戦略が、少なくとも現在までは非常に有効であることが、Waymoの事例によって改めて証明された形です。今後、カスタムシリコンの進化や新たなアーキテクチャの登場によってこの状況が変化する可能性はありますが、現時点でのNvidiaの競争優位性は依然として揺るぎないと言えます。

物理世界へのAI展開:人型ロボットと自動運転の最前線

GTC 2025で発表されたNvidiaの戦略は、単なるデータセンター内の計算技術にとどまらず、実世界で動作するAI、すなわち「物理AI(Physical AI)」へとその領域を拡大していることを明確に示しました。特に、近年大きな注目を集めている人型ロボットと、長年の課題である自動運転技術です。

自動運転に関しては、Nvidiaとゼネラルモーターズ(GM)との新たな提携が発表されました。これは、GM傘下の自動運転企業Cruiseが直面した課題を克服し、同社の自動運転技術の進展を加速させる試みの一環です。Nvidiaの高性能な車載コンピューティングプラットフォームは、複雑なセンサー情報をリアルタイムで処理し、安全な運転判断を下すために不可欠な技術です。また、前述の通り、自動運転技術のリーダー企業であるWaymoがNvidiaのチップをデータセンターと車両の両方で使用していることも強調され、この分野におけるNvidiaの重要性が改めて示されました。

しかし、今回のGTCで自動運転以上に関心を集めたのは、人型ロボットへの取り組みでした。Nvidiaは、人型ロボットの開発と普及を加速させるため、新たなオープンソースモデルとデータセットの提供を発表しました。特に注目されるのが「Project GR00T」です。これは、人型ロボット向けの基盤モデルであり、これに関連する新しいコンピューター「Jetson Thor」も公開されました。さらに、ロボットアーム操作や自律移動ロボット向けのライブラリである「Isaac Manipulator」や「Isaac Perceptor」も強化されました。さらに、現実世界とシミュレーション(合成データ)の両方を含む、ロボットの物理的な動きに関する15種類のタブ形式データセットがリリースされました。これは、人型ロボット開発の初期段階におけるトレーニングデータ不足という課題を解決し、開発のハードルを下げることを目的としています。

Nvidiaがオープンソース化したモデル「GR00T N1」について、Frank Downing氏は興味深い指摘をしています。それは、数ヶ月前にFigure AIが発表したシステム「Helix」と非常に似た、2つのモデルと2つのチップで構成されるシステムに見えるという点です。Figure AIのHelixは、一つのモデル/チップが周囲の状況を理解し、もう一つがそれに基づいてロボットの実際の動作を制御するという連携システムです。例えば、「フランク、眼鏡を取って渡して」という指示を理解し、「フランク」が誰で「眼鏡」がどれかを認識し、それを掴んで渡すという一連の動作を、状況理解と動作制御の連携によって実現します。Nvidiaがこのようなアーキテクチャをオープンソース化することで、Figure AIのような先行企業だけでなく、より多くの企業や研究者が高性能な人型ロボット開発に取り組めるようになる可能性があります。

最近公開された動画では、Boston Dynamicsのロボットが強化学習を用いて歩行能力を獲得する様子が示されており、これは汎用性向上に向けた重要な一歩です。さらに、ある動画では、人型ロボットが人間には物理的に不可能な体のひねり方をして作業を行う様子が確認されました。これは、ロボットが単に人間を模倣するだけでなく、その機械的な特性を活かして人間以上の能力を発揮する可能性を示唆しており、非常に興味深い点です。現在、人型ロボット開発においてまだ不透明な部分が多いですが、Nvidiaがプラットフォーム提供者としてこの分野のエコシステム構築を目指していることは明らかです。

物理AIの議論は、中国の動向とも密接に関係しています。中国はAI分野全般で急速な進歩を遂げており、人型ロボット開発においても多くの企業が取り組んでいます。また、中国企業によるAIモデルのオープンソース化も進んでいます。Frank Downing氏は、このオープンソース化の動きがNvidiaのチップ需要を減らすのではなく、むしろ増やす可能性があると指摘します。DeepSeek、Tencent、Baiduといった中国の大手テック企業は、それぞれ独自のChatGPTクローンを開発し、国内で需要が拡大していますが、共通して計算リソース(コンピュート)の確保に苦慮しています。オープンソースモデルの登場は、中国国内でのAI開発とサービス展開をさらに加速させ、結果的により多くの高性能チップが必要とされる状況を生み出すと考えられます。

最後に、半導体業界特有の「サイクル」の問題にも触れておく必要があります。現在、AIブームによってNvidia製GPUへの需要は爆発的に高まっていますが、この状況が永遠に続くわけではありません。長期的には、企業がAIインフラへの投資を過剰に行い、一時的に需要が供給を上回る「買いすぎ(over buy)」の局面が訪れる可能性は否定できません。例えば最近報じられているMicrosoftのNvidia製チップ購入量減少の動きは、その兆候の一つと見ることもできます。これは、Microsoftの最大のAI顧客であるOpenAIが、Microsoft Azure以外の計算リソース調達にも動き出したことと直接関連している可能性があります。つまり、個々のプレイヤーの戦略変更が、業界全体の需要動向に影響を与えるのです。Nvidiaは、推論へのシフト、物理AIへの展開といった多角的な戦略によって、この避けられないサイクル変動への耐性を高めようとしているのかもしれません。

まとめ

Nvidia GTC 2025は、AIコンピューティングの最前線が新たな段階に入ったことを示す重要なイベントとなりました。Frank Downing氏の解説を通して明らかになったのは、NvidiaがAIモデルの「トレーニング」効率向上という従来の焦点に加え、「推論」の効率化とスケーラビリティを最重要課題として捉え、ハードウェアとソフトウェアの両面から強力なソリューションを提供しようとしている点です。次世代アーキテクチャ「Blackwell」や、その先に控える「Vera Rubin」がもたらす計算密度と性能の飛躍的な向上は、大規模言語モデルや生成AIのさらなる普及を後押しする基盤となるでしょう。

一方で、CerebrasやGrokのようなカスタムシリコンスタートアップの台頭は、AI市場の競争激化を示唆しています。しかし、Waymoの事例が示すように、NvidiaのGPUが持つ汎用性と高性能のバランスは依然として強力な競争優位性であり、GTCにおける「推論」への注力は、この優位性を維持・強化するための明確な意思表示と言えます。

さらに、人型ロボットや自動運転といった、「物理AI」への取り組み強化は、NvidiaがAIの応用範囲をデジタル空間から現実世界へと大きく広げようとしていることを示しています。オープンソースモデルやデータセットの提供により、Nvidiaはこの分野のエコシステム構築を加速させ、新たな技術革新を促進する可能性があります。

中国のAI動向や半導体特有の景気変動(サイクル)の問題など、考慮すべき外部要因も存在しますが、GTC 2025で示されたNvidiaのビジョンと技術ロードマップは、同社が今後もAI革命の中心的な役割を担い続けるであろうことを強く印象づけました。AI技術の進化は止まることなく、私たちのビジネスや生活にさらなる変革をもたらすでしょう。Nvidiaの動向は、その未来を占う上で、引き続き最も注目すべき指標の一つであり続けます。

参考:https://www.youtube.com/watch?v=uYyoEB6Xu58

いま話題の他の記事はこちらから↓

Google AI Studioの新機能で画像生成の可能性が大きく広がる!自然な動画も作れる革命的な機能とは

中国発の世界最高峰AIエージェント「Manus」が登場!ChatGPTを超える驚異の性能とは?

ChatGPTが新機能“ネイティブ画像生成機能”を発表!

プログラミング知識ゼロでアプリ開発が可能に? 話題のAIツール「Rork」を実際に使ってみた!

この記事が参考になったらシェア

シェア

AIコンサルについてもっと詳しく

AIコンサルの機能や導入事例について、詳しくご紹介しています。