世界最大規模のテックイベント「CES2026」最新レポート! フィジカルAIの時代(後編)

CESのロゴのイメージ

Report |2026年1月8日

第3章
World Foundation Model(WFM)を実践する2大企業
——NVIDIAとTeslaは、なぜ同じ地平に立っているのか

WFMは「概念」ではなく「選別装置」になった

WFMという言葉は、一見すると抽象的で、学術的な概念に見えるかもしれない。しかし、現実はすでに違う。WFMという概念を“前提として持っている企業”と“まだ個別最適で考えている企業”の間には、もはや埋めがたい断絶が生まれている。その分岐点の向こう側に立っている企業が、現時点で二社しか存在しない。NVIDIAとTeslaだ。両社は、業態も歴史も異なる。しかし、世界の見方は驚くほど一致している。

共通点:ロボットも車も「同じ問題」を解いている

NVIDIAとTeslaを理解するための第一歩は、両社が次の前提を共有していると認識することだ。ロボット・自動運転・工場は、別の技術問題ではない。すべては「物理世界をどう理解し、その中でどう行動するか」という同一問題の別表現である。この前提に立つと、従来の産業分類は意味を失う。自動運転AI、ロボットAI、工場AIという分け方は、WFM以前の思考様式にすぎない。

NVIDIA:WFMを「明示的に構築する企業」
世界を“先に”作るという発想

NVIDIAの戦略の核心は、「まず世界を作る」という点にある。現実世界を直接相手にするのではなく、物理法則を持った仮想世界、時間変化を伴う3D空間、人・機械・物体が相互作用する環境をデジタルツインとして先に構築し、その中でAIを鍛える。これは、WFMを“仮想世界で育てる”アプローチと表現できる。

NVIDIAにとってのWFMとは何か

NVIDIAにとってWFMは、ロボット用でも車両用でも工場用でもない。「世界理解そのものを担う中枢」である。だからこそ、ロボット向け(Isaac:ロボットが世界を理解して動くための基盤)、自動運転向け(Drive:車両が周囲を理解して判断するための基盤)、工場・倉庫向け(Omniverse / Factory:工場や倉庫の状態を理解して最適化するための基盤)といった製品群が、一つの思想の下で整然と並ぶ。NVIDIAは、WFMを“共通OS”として提供し、実行体は顧客に委ねる。

NVIDIA型の強みと制約

強み

  • あらゆる産業を横断できる
  • 特定用途に依存しない
  • エコシステムが拡張するほど価値が増す

制約

  • 現実世界の“生の失敗”を直接持たない
  • 実行体の最終責任は顧客側に残る

つまりNVIDIAは、WFMを“地形”として提供する企業であり、自らはその上を走らない。

Tesla:WFMを「暗黙的に実装する企業」
世界を“後から”言語化しないという選択

Teslaは、WFMという言葉をほとんど使わない。しかし、それは理解していないからではない。あえて言語化していないのである。Teslaの戦略は、極めて一貫している。実世界で走らせる。実世界のデータを集める。実世界で失敗し、修正する。世界理解は、現実の中で鍛えるものという思想だ。

TeslaにとってのWFMとは何か

TeslaにとってWFMは、論文の概念でも製品カテゴリでもない。自動運転を成立させるために必然的に生まれた“内部構造”である。だからTeslaは、車両という身体で鍛えた世界理解をそのままヒューマノイド(Optimus/オプティマス:Teslaが自動運転で培った世界理解を人型の身体で実行することを目的としたロボット)へ接続するという選択を、一切の迷いなく行える。

Tesla型の強みと制約

強み

  • 実世界データの圧倒的量
  • 世界で最も厳しい社会条件(公道)で鍛えられる
  • WFMと実行体を完全に一体最適化できる

制約

  • 巨大な資本と時間が必要
  • 失敗の社会的コストが極めて高い
  • 他社が模倣できない前提条件に依存

つまりTeslaは、WFMを“自社専用の中枢”として垂直統合する企業である。

同じWFM、真逆の実装戦略

ここで改めて、NVIDIAとTeslaという二社を構造的に対比してみよう。
一見すると、両社はまったく異なる道を歩んでいるように見える。だが、視点を「World Foundation Model(WFM)」という中枢に据え直すと、実は同じ地平に立ちながら、真逆の実装戦略を選択していることがはっきりと浮かび上がる。
まず、WFMの扱いである。
NVIDIAはWFMを明示的に掲げ、それを「誰もが接続可能な共通基盤」として設計している。Omniverse、Isaac、Cosmosに代表されるように、物理世界を理解・予測するためのモデル群を、開発者や企業が横断的に利用できる形で提供する発想だ。
一方のTeslaは、WFMという言葉を用いない。だが実態としては、車両・工場・ロボットを貫く世界理解モデルを完全に内製し、暗黙知として抱え込む戦略を取っている。名前を与えないことで、他社と共有する前提そのものを排除していると言ってよい。
次に、学習の場が決定的に異なる。
NVIDIAのWFMは、まず仮想世界で鍛えられる。高忠実度シミュレーション空間で何百万回もの試行錯誤を行い、失敗コストをゼロに近づけながら汎化能力を高めていく。
対照的にTeslaは、徹底して実世界で学習する。走行中の車両、稼働する工場、現実の失敗と例外処理そのものが教師データとなる。仮想で完結させず、現実で起きた事象を次の改善に直結させる設計思想だ。
実行体の所在も正反対である。
NVIDIAのWFMは、自らが行動する主体ではない。実行体はあくまで顧客側――自動車メーカー、ロボットメーカー、工場運営者である。NVIDIAは「世界を理解する頭脳」を提供し、その頭脳をどう使うかは利用者に委ねる。
一方、Teslaでは実行体が完全に自社に内包されている。WFMを使うのも、行動するのも、結果責任を負うのもTesla自身だ。モデルと実行体が分離されていない。
この違いは、戦略全体の方向性に直結する。
NVIDIAは横断プラットフォーム戦略を取る。業界・用途・実行体を越えてWFMを配布し、エコシステム全体を束ねるハブになることを目指す。
Teslaは垂直統合戦略である。モデル、データ、実行体、改善ループを一気通貫で自社に閉じ、最適化速度そのものを競争力に変える。
結果として、拡張性の性格も大きく異なる。
NVIDIAのWFMはエコシステム型だ。多様なプレイヤーが参加することで用途が拡張され、結果として標準に近づいていく。
TeslaのWFMは自社最適型である。他社への展開は前提とせず、自社の世界理解を極限まで洗練させることで優位性を維持する。

重要なのは「違い」ではなく「共通点」である
だが、ここで最も重要なのは、どちらが正しいかという議論ではない。
本質は、NVIDIAとTeslaのいずれもが「WFMという同じ地平」に立っているという点にある。
両社とも、

  • ロボット
  • 自動運転
  • 工場・倉庫

といった異なる実行体を、個別最適ではなく「世界理解の中枢」から統合しようとしている。
つまり彼らはすでに、
「どの製品が強いか」
「どの業界で勝つか」
という議論を超え、
『誰が世界を理解するOSを握るのか』という競争に突入している。
この事実を見抜けているかどうか――
それ自体が、フィジカルAI時代における最大の分岐点なのである。

なぜこの2社が重要なのか

多くの企業が、この地平に立てない理由は明確だ。組織が縦割りで、世界理解を共有できない。製品単位で思考し、世界単位で考えられない。成功と失敗のフィードバックループを持たない。WFMを前提にすると、組織・投資・戦略の全てを再設計する必要がある。それに耐えられる企業は、まだ極めて少ない。

この比較が示す決定的な示唆

この章の最も重要な結論は、ここにある。フィジカルAIの競争は、技術の競争ではなく、“世界の捉え方”の競争である。NVIDIAとTeslaは、世界をどう理解するか、その理解をどう育てるか、どの実行体に接続するかという問いに、すでに一段先の答えを出している。

第4章
日本企業はどうするべきか
——World Foundation Model(WFM)時代、日本にしか担えない役割がある

「日本は遅れている」という問い自体が、もはや的外れである

フィジカルAI、WFMをめぐる議論において、日本について語られるとき、ほぼ反射的にこう言われる。日本はAIで出遅れた、米中に勝てない、基盤モデルを作れない。しかし、ここまで本稿で整理してきた構造に立てば、この問いそのものが前提を誤っていることが分かる。なぜなら、WFM時代の競争は、「誰が最も大きなモデルを作るか」ではなく、「世界理解AIを、どこで・どう成立させ続けられるか」という競争だからである。この競争のルールにおいて、日本は決して“周回遅れ”ではない。むしろ、他国にはない位置に立っている。

日本が正面から挑むべきでない領域は明確である

まず、日本がやるべきでないことをはっきりさせよう。

① WFMの「巨大事前学習」を正面から狙う
これは、超大規模GPU投資、世界規模のデータ収集、長期赤字を許容する資本構造を前提とする。これは、NVIDIA型、Tesla型の主戦場であり、日本企業が同じ土俵で競うべき場所ではない。

② Tesla型の完全垂直統合を模倣する
Teslaは、自動車という大規模実行体、公道という世界最大級の実環境、ソフトとハードを一体で最適化できる組織という、極めて特殊な条件を持つ。Teslaは“戦略のヒント”にはなるが、“模倣対象”ではない。

日本が担うべき役割は「WFMを成立させる側」である

では、日本はどこを担うべきなのか。結論は明確だ。日本は、WFMを“作る国”ではなく、“成立させ、育て、止めずに回す国”になるべきである。この役割は、WFM × 成立基盤4階層の構造において、きわめて明確に位置づけられる。

日本が世界的に優位を持つ3つの成立基盤

① L2:身体・感覚の成立基盤
——WFMを現実に降ろす「器」を握る
WFMがどれほど高度でも、それを実行する身体が未成熟であれば、現実世界では使われない。ここで日本は、圧倒的な強みを持つ。例えば、精密アクチュエータ、力制御・トルク制御、高信頼センサー、安全設計・冗長設計、長期運用・保全の知などだ。

日本は、WFMが“壊れず・怖くならず・使われ続ける”ための身体条件を設計できる数少ない国である。ロボメーカーの価値は、「ロボットを作ること」ではない。WFMが安心して降りてこられる身体を提供することにある。

② L3:学習加速の成立基盤
——工場を「世界理解AIの訓練場」に変える
日本最大の戦略資産は、疑いなく工場である。工場は、現実の物理世界、制御された環境、正解が定義された作業、日々の改善と例外処理、人間の介入という高品質教師をすべて併せ持つ。工場とは、WFMにとって世界最高水準の“現実トレーニング環境”である。日本が工場を、ロボット導入の場ではなく、WFMを育てる学習基盤として再定義できるかどうか。ここが、日本の将来を決める。

③ L4:社会・需要の成立基盤
——「止められるAI」を設計できる国
フィジカルAIは、必ず失敗する。重要なのは、失敗しないことではない。なぜ失敗したのか説明できるか。その場で止められるか。再発を防げるか。この問いに答えられないAIは、一度の事故で社会から排除される。日本は、安全文化・品質文化・現場と社会の合意形成・責任分界の設計において、他国にない蓄積を持つ。日本は、フィジカルAIを“暴走させない設計”ができる国である。

日本企業三者の役割分担は、すでに見えている

WFM時代における日本の強みは、単独企業ではなく、役割分担構造にある。

製造業(ユーザー)

  • 工場という訓練場の提供
  • 作業・品質・例外・人介入のデータ化
  • 工程知を世界理解AIの学習資源に変換

→ WFMの学習を加速させる主体

ロボメーカー

  • WFMに適合する身体の設計
  • 力制御・安全制御・耐久性
  • 複数実行体の共存前提設計

→ WFMの実行体を担う主体

SI・IT企業(例:富士通)

  • 複数WFM/RFMの統合
  • 空間・群制御・運用OS
  • 学習ループと社会実装の管理
  • 停止・監査・責任設計

→ WFMエコシステムを“現実で回す中枢”

工場起点は「暫定策」ではなく「最適解」である

誤解してはならない。工場から始める戦略は、リスク回避でも消極策でもない。工場は、フィジカルAIにとって最も高度で、最も誠実な出発点である。制御可能な現実で鍛え、十分に成熟してから社会へ出す。これは、技術的にも社会的にも最も合理的な進化の順序だ。

日本が世界に提供できる価値の正体

日本が世界に提供できる価値は、「AI」そのものではない。世界理解AIを、現実世界で“成立させ続ける方法”である。壊れない、怖くならない、改善し続ける、社会に受け入れられる。この知は、NVIDIAにもTeslaにも代替できない。

結語 ——日本は、WFM時代の「成立国」になれる

WFM時代において、世界は二種類の国に分かれる。「WFMを作る国」と「WFMを成立させる国」だ。日本は、後者になれる。そしてその役割は、決して二番手ではない。世界を理解するAIが、現実の中で生き延び、成長し続けられるかどうか。その成否を握るのが、日本である。

第5章
富士通のCES2026出展は、フィジカルAI/WFM構造の中でどこに位置づけられるのか
——「WFMを作る企業」ではなく、「WFMを成立させる企業」への明確な一歩

結論から言おう。富士通は、WFM時代において、日本企業として「正しい場所」に立っている。まず結論をはっきりさせておく。富士通は、WFMを自社で巨大に構築する企業ではない。しかし、WFM時代において“最も価値の高い役割”を担える場所に立っている。その役割とは何か。WFMを、現実の物理世界・社会の中で“成立させ、回し続ける中枢”を担うことである。CES2026で富士通が示したのは、この立ち位置に対する極めて一貫した意思表示だった。

富士通ブースのイメージ

CES2026で富士通が示したものの本質
——主役は「ロボット」ではなく「空間」だった

CES2026の富士通ブースで最も印象的だったのは、特定のロボットやハードウェアの性能を誇示していなかった点だ。代わりに前面に出ていたのは、人・ロボット・物体が混在する空間、未整備環境における複数ロボットの協調、衝突・滞留・デッドロックを起こさずに動き続ける秩序だ。すなわち、「空間そのものを知的に扱う能力」である。ここで富士通が提示したのは、単体ロボットの賢さではなく、“複数の実行体が同時に存在する現実空間をいかに破綻させずに運用できるか”という、フィジカルAIの中でも最も難度の高い問題設定だった。

空間World Modelという立ち位置の意味

富士通が展示の中核に据えた空間World Model(Spatial World Model)は、3Dマップの高度化、群制御アルゴリズム、マルチロボット制御といった個別技術の集合ではない。人・ロボット・設備が共存する空間全体を、一つの“予測可能な世界”として扱うための中間知能である。これは、WFMそのものではない。しかし同時に、WFMが現実世界に降りてきたとき、必ず必要になる“現実側の中枢”でもある。

成立基盤4階層で見たときの富士通の位置

ここで、富士通のCES2026出展を成立基盤4階層にマッピングし直そう。

L1:知能・計算の成立基盤
——「WFMの応用中枢」を担う企業

富士通は、NVIDIAのようにWFMそのものを構築・配布する企業ではない。また、TeslaのようにWFMを自社実行体に垂直統合する企業でもない。富士通が狙っているのは、複数のWFM/RFM(Robot Foundation Model、ロボット基盤モデル)を前提に、それらを現場で“機能させるための統合知能”というポジションである。空間World Modelは、WFMを現実空間で使うための“翻訳層・調停層”として設計されている。

L2:身体・感覚の成立基盤
——身体を持たないからこそ成立する強み

富士通自身は、ヒューマノイドや産業ロボットを製造していない。しかしCES2026では、人型・動物型・作業用・清掃用といった異なる身体を同一空間で共存させていた。これは偶然ではない。富士通は、特定の身体に最適化するのではなく、“身体が違っても成立する空間秩序”を設計している。この立ち位置は、ロボメーカーとは競合せず、むしろ すべてのロボメーカーにとって必要不可欠な上位レイヤーになる。

L3:学習加速の成立基盤
——「ロボットが学ぶ」のではなく「空間が賢くなる」

富士通のアプローチで最も重要なのは、学習の単位をロボットではなく「空間」に置いている点だ。ロボットの失敗、人の動線の変化、滞留・衝突の発生、役割分担の切り替えのすべてが、空間World Modelにフィードバックされる。学習の主体が、ロボットから“空間”へ拡張されている。これは、WFM的発想と完全に整合する。

L4:社会・需要の成立基盤
——最も難しい現実を正面から扱っている

展示環境が、完全に整備された工場ではなく、人が混在する未整備空間であった点は、極めて重要な意味を持つ。なぜなら、フィジカルAIが最終的に失敗するのは、技術ではなく社会条件だからである。富士通は、予測不能な人の動き、社会的安全性、実運用における責任を、最初から設計対象に含めている。これはL4(社会成立基盤)を“後付け”にしていない、という強いメッセージだ。

2025年のNVIDIAとの提携が意味するもの

2025年に発表された富士通とNVIDIAの提携は、単なる技術提携ではない。構造的に見れば、この提携は極めて合理的だ。NVIDIAは、WFMを“仮想世界・基盤モデル”として提供する。富士通は、WFMを“現実空間・社会運用”に接続する。WFMエコシステムにおける明確な役割分担が成立している。これは、日本企業がWFM時代に“どこを取りに行くべきか”の模範例でもある。

CES2026で披露されたのは「一端」にすぎない理由

ここで重要なのは、CES2026で富士通が示した内容が、「一端」にすぎないという点だ。空間World Modelという中枢は、運用と学習を通じて進化し続ける性質を持つ。つまり、一度の展示で“完成形”を見せるものではない。現実空間で回し続けることで価値が出る。そのため、CESで示されたのは構造の入口に過ぎない。同社では、フィジカルAIについて様々な取り組みをしていることを強調している。

富士通は「WFMを成立させる企業」になりつつある

ここまでを総合すると、富士通の立ち位置は明確になる。富士通は、WFMを“作る企業”ではない。しかし、WFMが現実世界で破綻せずに動き続けるための最も重要な中枢を担おうとしている。このポジションは、NVIDIAにもTeslaにも代替できない。

本章の結論
——富士通のCES2026出展が持つ戦略的意義

富士通のCES2026出展は、日本企業がWFM時代においてどこに立ち、何を担うべきかを示した極めて明確な戦略的メッセージである。それは、派手なモデル競争ではなく、ロボット単体の性能競争でもなく、現実世界を成立させ続ける知の設計に主戦場を置くという宣言だ。

最終章
フィジカルAI時代の勝者は誰か
——「世界を作る者」ではなく、「世界を成立させる者」へ

ここまでの議論を、もう一度「構造」で言い切る

本稿を通じて見てきたのは、ロボットやAIの個別進化ではない。フィジカルAIの時代とは、世界を理解するAI(WFM)が産業と社会の中枢に入り始めた時代である。そして、その競争の本質は、モデルの大きさ、アルゴリズムの新規性、デモの派手さではなかった。どの世界理解AIを、どこで、どう育て、どの現実に定着させ続けられるか。この一点に、すべてが収束する。

フィジカルAI時代の「勝者」の定義は変わった

従来のテクノロジー競争では、勝者はしばしば、最先端技術を最初に作った者、最大市場を押さえた者、規模で他を圧倒した者として定義されてきた。しかし、フィジカルAIの時代には、この定義は通用しない。なぜなら、現実世界は、スケールさせにくいからだ。一度の事故が、すべてを止める。一度の不信が、社会から排除する。一度の破綻が、長期運用を不可能にする。フィジカルAIの勝者とは、最も賢いAIを作った者ではなく、AIを“現実世界で成立させ続けた者”である。

NVIDIAとTeslaは「ゴール」ではなく「起点」を示した

本稿で取り上げてきた二社、NVIDIAとTeslaは、確かに突出している。しかし重要なのは、両社が「完成形」を示したわけではない、という点だ。彼らが示したのは、フィジカルAIは世界理解AIを中枢に持つ、ロボット・自動運転・工場は同一WFMの異なる実行体である、産業はプラットフォーム/エコシステム構造に再編されるという、不可逆な構造転換の方向である。NVIDIAとTeslaは、競争の“終点”ではなく、競争の“ルール変更”を提示した存在だ。

では、そのルールの中で日本はどこに立つのか

ここで、ようやく日本の話に戻ろう。日本は、世界最大級のGPU資本を持たず、またグローバルな実世界データフリートも持たない。この点だけを見れば、不利に見えるかもしれない。しかし、フィジカルAIの競争は、単線的な競争ではない。WFMを“作る国”と“成立させる国”は、必ずしも同じである必要はない。

日本は「成立国」になれる —— そして、なるべきである

本稿で繰り返し論じてきたように、日本には、他国にはない資産がある。世界最高水準の工場、精密で信頼性の高い身体(ロボット・設備)、現場に根差した改善知・運用知、失敗を許容し、修正し、定着させる社会文化。これらはすべて、WFMを現実世界で“壊さず・暴走させず・止めずに回す”ための必須条件である。日本は、WFMを育て、WFMを現実に根付かせ、WFMを社会に定着させる国になれる。これは二番手ではない。別の勝ち筋である。

富士通のCES2026出展が示した、ひとつの未来像

CES2026で富士通が示したものは、完成されたロボット製品ではなかった。しかし、それは欠点ではない。ロボット自体を自社プロダクトとして見せるよりも、“どこを担うか”を明確に示した。WFMを作るのではない。ロボットを主役にしない。現実空間を調停し、成立させる中枢を担う。この立ち位置は、日本企業がWFM時代に取り得る最も戦略的なポジションである。

フィジカルAI時代に問われる、企業と国家の成熟度

最後に、最も重要な問いを提示したい。あなたの企業は、フィジカルAIを「作る対象」として見ているのか。それとも「育て、成立させるプロセス」として見ているのか。この問いにどう答えるかで、技術戦略、投資判断、組織設計、パートナー選択のすべてが変わる。そしてこの問いは、企業だけでなく、国家にも突きつけられている。

結語 —— フィジカルAIは「成熟の競争」である

フィジカルAIの時代は、スピードの競争ではない。どれだけ速く走れるかではなく、どれだけ長く、現実世界と折り合いをつけながら走り続けられるか。この競争において、派手なデモ、一時的な話題性、過剰な期待は、むしろリスクになる。最後に勝つのは、世界を理解するAIを、世界の中で成熟させられた者である。そして、その条件を最も多く備えている国の一つが、日本である。

フィジカルAIの時代において、問われているのは「誰がAIを作るか」ではない。「誰が、AIと現実世界の関係を最後まで引き受けられるか」である。日本は、その問いに答えられる場所にいる。

筆者プロフィール