MENU

空間コンピューティングの現在と未来への期待 <前編> ~空間コンピューティングの課題と活用例

Text=富澤瑞穂(日本IBM)、岡本茂久(日本アイ・ビー・エム システムズ・エンジニアリング)

空間コンピューティングとは

「空間コンピューティング(Spatial Computing)」という言葉は、2003年にサイモン・グリーンウォルド(MITメディアラボOB)によって、「機械が実際のオブジェクトや空間への参照を保持し、操作する機械との人間の相互作用」と定義された。

当時と比較して劇的に進化したチップ性能や新しく登場した各種デバイス、それらを制御するソフトウェアなどの相乗効果によって、空間コンピューティングは現実的になりつつある。しかし2025年7月時点で、果たして広く普及していると言えるだろうか。本稿では、空間コンピューティングの現在と未来について、具体的な事例を元に考察する。

普及度合いは「黎明期」 

空間コンピューティングが定義されてから約20年後の2024年2月に、「Apple Vision Pro」が登場した。それまでもさまざまなメーカーや企業からVR/AR/MRを謳う種々のデバイス(以下、XRデバイス)が市場に投入されてきたが、空間コンピューティングという言葉の一般化が進んだのは、「Apple Vision Pro」の影響が強いと感じている。

XRデバイスは一般消費者向けだけでなく、企業向けにも少しずつ浸透しているが、2025年6月時点でスマートフォンのような普及には至っていない。

Gartner社が発表した「日本における未来志向型インフラ・テクノロジのハイプ・サイクル」では、2023年2024年ともに、空間コンピューティングの普及度合いは「黎明期」に属しているが、主流になるまでの年数は2023年の「2~5年後」から、2024年は「5~10年後」に後退した(図表1図表2。どちらも赤枠は筆者加筆)。

図表1 「日本における未来志向型インフラ・テクノロジのハイプ・サイクル」(2023年)(出典:Gartner)
図表2 「日本における未来志向型インフラのハイプ・サイクル」(2024年)(出典:Gartner)

このように後退したのはなぜか?

空間コンピューティングで重要となるUI(User Interface)の表示は、PCなどの据え置き型デバイスでも可能だが、“移動中の体験”という条件を追加した場合、主にスマートフォン/タブレット、スマートグラス、HMD(Head Mount Display)の3種のXRデバイスが必要となる。

スマートフォン/タブレットは最も普及しているが、体験時に手でかざす必要があり、得られる体験価値も3種の中では最も低い。

HMDはハンズフリーで利用でき、体験価値は最も高いが、デバイス価格やサイズ、重さ、煩わしさなどのハードウェアの課題があるため、普及度は最も低い。

スマートグラスはハンズフリーで利用できるが、普及度、体験価値ともに、上記2つのデバイスの中間で、高度な体験価値を得ることは難しい。

上記のほかにも後述するように複数の課題があり、得られる体験価値を上回っていないことが、普及が進まない原因と考えられる。

空間コンピューティングが普及するには

体験価値が課題を上回ることも必要だが、それだけでは「普及」と呼べる状態までは到達しないと筆者は考える。

端的に言うと、「ないよりはあったほうがよい」「あると便利」という状態から、「ないと困る」という状態への遷移が必要である。コミュニケーションデバイスが、固定電話→携帯電話→スマートフォンと変遷したように、所有/使用することによる「他者優位」の状態から、所有/使用しないことによる「他者劣位」の状態になることが、普及/浸透するための鍵になると考える。

空間コンピューティングの課題

HMDの課題の一部について前述したが、ここではより広範な「空間コンピューティング」普及の課題について例示する。

課題1 ハードウェアの課題

XRデバイスの中で、スマートグラスやHMDは空間コンピューティングのUIを担う強力なデバイスだが、必須条件や前提条件ではない。たとえば、PCやスマートフォン/タブレットでもVR/AR表示は可能であり、業務やシチュエーションによってはそちらのほうが向いていることもある。

一方、より高い没入感やハンズフリーが求められる場面には、スマートグラスやHMDのほうが向いている。ここでは、スマートグラスおよびHMDに関する課題について詳細に検討する。

◎高価格

・Apple Vision Pro、Microsoft HoloLens、Meta Orion(プロトタイプ)といった高機能デバイスの価格は50万円を超えるため、高価で一般消費者には手が届きにくい価格帯である
・10万円未満の低価格帯デバイスであれば、「他者優位性」の段階でも普及する可能性はあるが、10~30万円程度の中価格帯デバイスは、スマートフォンと同程度の「他者劣位」の段階に到達しないと、一般消費者は購入しないと考えられる
・軽量化やバッテリー消費を抑えるために、カメラやセンサーを別で用意することが必要なXRデバイスもあり、その場合はさらに追加コストが発生する

◎サイズ・重量

・HMDは500g程度の重さがあり、長時間装着するには重く、快適とは言えない
・サイズや見た目の違和感から、屋外や職場で日常的に使用することは難しい
・軽量化のために計算処理用デバイスやバッテリーを本体から分離する場合、ケーブルで接続する必要があるため可搬性や没入感が犠牲になることがある

◎性能の限界

・空間マッピングやオブジェクト認識の精度が完全ではなく、体験が不安定になることがある
・FoV(視野角)の狭さが、没入感やリアル感を損なうことがある
・画質(解像度、リフレッシュレート、コントラスト比、輝度、彩度など)の不足が、没入感を損ねることがある

◎安全性

・HMDの表示方法がビデオシースルー方式(「空間コンピューティングを考える ~新デバイス『Apple VisionPro』に見る次世代XRの最新形」参照)の場合、映像表示の遅延や歪みがリアル感を損なうだけでなく、不具合やバッテリーが切れた場合に視界が遮られて危険が伴う可能性がある
・過酷な環境で使用する場合、防塵/防水/耐衝撃性がないと破損・故障する可能性がある

課題2 ユーザー体験の課題

◎操作性

・スマートフォンやPCと異なり、コントローラー、ハンドジェスチャー、アイトラッキング等で操作するため、一般ユーザーには直感的な操作ではないことがある

◎健康への影響

・長時間にわたり極短距離のディスプレイを注視することによる眼精疲労や、デバイスの重量やバランス(重心位置のズレ)に伴う身体的な疲労が課題になることがある
・コンテンツの種類や体質によっては、VR/AR酔いが発生することがある(デバイスの性能が原因で生じることもある)

課題3 「キラーアプリ」「キラーコンテンツ」の不在

・企業向けには製造現場での教育や作業支援、ハンズフリー遠隔支援、遠隔医療などいくつかのユースケースで利用可能なアプリやコンテンツが登場しているが、一般消費者向けには「他者劣勢」が生じるようなアプリ(スマートフォンで言うLINEやInstagramなど)やコンテンツ(没入感が高く多くの消費者を魅了する360度映像など)が登場していない
・企業向けにも、既存のツールで事足りていて、あえて空間コンピューティングデバイスを用いる必要性が低いと考えられている

課題4 インフラ・開発の課題

◎高速/安定ネットワーク環境

・ユースケースによっては、大量の映像データやコンテンツデータをネットワーク経由で送受信する必要がある。特に屋外で利用する場合は、以下のような課題がある
  ―4Gのデータ転送速度だと不足する
  ―5Gの接続性に課題がある(移動を伴うと切断されやすい)
  ―通信料金が課題になる
  ―同時利用ユーザーが多く、ネットワーク基地局のスループットが不足する

◎初期投資が大きい

・XRデバイス以外にも、実行環境としてイベント会場や体験ブースを設ける場合、各種センサーやカメラなどの高額な専用デバイスを揃える必要がある
・開発時は3D処理など高負荷演算が可能な高性能PCや専用ソフトウェアを揃える必要があるため、参入の障壁が高い

◎開発が難しい

・3Dモデリング、リアルタイムデータ処理、ユーザーインターフェース設計、空間マッピング、ジェスチャー認識など、高度な技術と専門知識が求められる
・デバイスやプラットフォームごとに仕様が異なり、開発者にとって負担が大きい
・デバイスのメンテナンスや運用管理も複雑であり、専門人材の不足が障壁となることがある

課題5 ビジネス側の慎重姿勢

◎ROI(投資対効果)が不明瞭

・業務に取り入れる場合、空間コンピューティングを導入したことで、「何がどのように改善したのか」を定量的に評価することが困難である
・定性的には、「手戻りが減った」「欠陥が減った」「作業が簡易化した」「手間が省けた」などの効果があったとしても、数値として計測することや、空間コンピューティングそのものが貢献したのか、空間コンピューティングの導入時に実施したプロセス改善や効率化が寄与しているかを分けて評価することが難しい
・定量化できる場合も、導入後に計測することは可能だが、導入前に試算することが容易ではないため、企業が大規模な導入に踏み切れないことがある
・特殊な技術、実行環境、デバイス、開発環境、ソフトウェアなどを用いているため、想定よりも運用コストが嵩む可能性も高い

◎スタートアップも敬遠

・スケールが期待できるB2Cビジネスでも消費者市場が育っていないため、スタートアップも積極的に参入しづらい
・初期投資が大きく、結果として大きな投資になるため参入障壁が高い

課題6 プライバシーと倫理の懸念 

・空間情報や視線、表情など、個人のプライベートなデータを扱う場合、監視社会化やプライバシー侵害への懸念も考えられる
・個人情報の取り扱いと同様に、収集するデータの種類や目的、活用範囲、オプトイン/オプトアウトの仕組みや透明性と説明責任が問われる可能性もある
・仮想世界への過度な没入による現実世界とのつながりの希薄化や、現実認識の歪み、依存症のリスクなども指摘されている

2025年7月時点では上記のような課題はあるが、大手企業やベンダーだけではなく、スタートアップ企業や大学などの学術機関も研究開発や市場へのデバイス投入を継続的に実施しているため、上記の課題は今後解決していくことが予想される。

一方、課題がすべて解決することはなく、何らかの課題が解決すると別の課題が新たに発生するため、先行者利益を享受するためには、スピード感を持ってアジャイル的なアプローチでスモールスタートすることが有効だと考える。

空間コンピューティングの活用例と普及の鍵

ここでは、今後登場を期待するデバイスや技術も交えながら、代表的な空間コンピューティングの活用例と筆者が考える普及の鍵を3つ例示したいと思う。

例1 高度なエンターテイメント体験 

多くのHMDや一部のスマートグラスでは、目の前に巨大な平面スクリーンが擬似的に表示されるシアター空間を再現できる。また、“寝転がって観る”など、通常の映画館ではできない体験を実現可能なデバイスやアプリもすでに利用可能な状況である。

これらの体験は既存の視聴体験と比較して優れた点はあるが、これだけだと「他者優位」の体験にとどまるため、このユースケースのためにXRデバイスを購入するユーザーは多くない。

<普及の鍵>
360度カメラで撮影された映画やアーティストのライブ映像、地図アプリのストリートビューなどのコンテンツが提供された場合、3DoFや6DoF(注1)に対応したXRデバイスで視聴することで、その空間に没入したような体験が得られる。

注1
XRデバイスがユーザーの動きに応じて表示される映像の位置、向き、角度などを制御する指標。3DoFは頭のXYZ軸方向の回転を認識し、6DoFはそれに加えてXYZ位置の移動も認識する。

たとえば、一人称視点の360度映画の場合、好きな場所に目を向ければ観ることができるので、主人公になったような体験が可能になる。

また、アーティストのライブ会場で演者のそばに360度カメラを配置した場合、特等席で自分の“推し”を集中的に視聴することもできるし、後ろを振り返ればライブ会場で興奮しているファンたちの姿も観られるので、本当にライブ会場に足を運んだような体験が可能となる。

倍率が高くチケットが入手できなかったり、運よくチケットを入手できても遠くの席でよく見えないといった経験のあるユーザーであれば、こちらのほうが優れた体験価値を得られると感じるであろう。

また、自分が行きたいところの360度ストリートビューが公開されれば、物理的な移動を伴わず疲労なしで旅行の疑似体験や、身体的な課題を抱えているユーザーにとっては山登りや階段が多い場所の移動など、今までできなかった旅行体験も期待できる。

これらの体験は従来の平面スクリーンや平面モニターでは得られないため、一度でも体験して価値を感じたユーザーは「他者劣位」の状態に近づき、XRデバイスを購入してでもこの体験を求める可能性は高い。

ただし、いずれの場合も、前述した課題3にある「キラーコンテンツの不在」を解決することが、普及の前提となる。特に映画は、今までは描く必要がなかった死角部分も含めて作り込みや撮影が必要となり、今までよりも制作の難易度が上がるので、生成AIを活用して映像を自動生成する、空間オーディオを考慮して左右の音声バランスを自動計算して出力するなど、作成時の作業負荷を軽減する工夫も必要となる。

また、課題6に挙げた「プライバシー」の観点から、アーティストのライブ映像で会場のファンやストリートビューで歩行中の人の顔が写ってしまった場合、“マスキング(モザイク処理)”が必要となるが、手動で行うと膨大な作業時間がかかるため、自動でマスキングするようなツールの導入なども必要となる。

例2 拡張現実体験 

「雨に濡れずにXXX美術館まで行きたい(ナビ)」「相手が話していることを翻訳して文字表示してほしい(コミュニケーション)」「目の前の機械の整備方法を表示してほしい(製造現場)」「目の前の患者のバイタルデータを見たい(医療現場)」など。これらのユースケースは、既存システムやアプリでもある程度実現できているが、スマホで確認する場合は片手が塞がり、PCや専用モニターで確認する場合は移動しながらの利用になり、困難を伴う。

<普及の鍵>
スマートグラスは移動しながらハンズフリーで必要な情報をAR表示できるため、以下の課題が解決・緩和して、使用するユーザーが増加することで「他者劣位」の状態に近づくと考えられる。

まずは、課題1の「ハードウェアの課題」に記載した価格、サイズ・重量、特にプライベートな外出時に利用する場合は見た目の違和感といった課題解決が重要である。

一般的なメガネに見た目が近いデバイスやコンタクトレンズ型の軽量で安価なデバイスが登場すれば、普及する可能性は十分あると筆者は考える。計算処理はスマホなどの外部デバイスで実行し、Bluetoothで映像をXRデバイスにストリーミング送信する仕組みであれば、XRデバイス自体は軽量化や省電力化ができるため、現実性もあると考えている。

そのうえで、課題2の「ユーザー体験の課題」を考慮した簡易な操作方法(音声入力やアイトラッキングなど)を備えた、(課題3にある)「キラーアプリ」「キラーコンテンツ」の登場が、より広く普及するのに必要だと考える。

例3 距離や時間の制約を超えた体験 

たとえば、工事現場や高所送電線などの作業現場で支援が必要な場合に、現場作業者は現場の映像や音声を遠隔地のエキスパートと共有し、遠隔地のエキスパートはすぐにARを用いた映像や音声でアドバイスや作業指示を行うような体験(遠隔支援)。あるいは緊急で手術をする必要があるが、高難度手術のため患者が入院している病院に執刀できる医師がいない場合、遠隔地からエキスパートが手術するような体験(遠隔医療)など、距離や時間の制約から実現できなかったようなユースケースが考えられる。

<普及の鍵>
これらのユースケースを実現するには、高解像度/高フレームレート/低遅延で映像・音声を通信できること、低誤差で機器操作できること、送受信するデータが堅牢なセキュリティで守られていることなどが必須となり、「課題4 インフラ・開発の課題」、その中でも特に「高速/安定ネットワーク環境」の課題を解決する必要がある。また、「課題1 ハードウェアの課題」の中で、防塵/防水/耐衝撃性を持つデバイスが必要になることもある。

遠隔医療では、映像・音声の品質に加え、バイタルデータの送受信や「ハプティクスグローブ」(注2)などの触覚を再現するデバイスの採用など、遠隔地でも現地と変わらない環境を高レベルで再現することが求められる。

注2
利用者に力、振動、動きなどを与えることで皮膚感覚フィードバックを得るテクノロジーである。

さらに、通信障害などを含むシステム障害を回避可能で、低遅延、冗長化構成など信頼性を備えたシステム構成が必要となる。不測の事態に備えたシステム外のバックアップ運用(現地で応急処置できる体制など)も合わせて準備するといった考慮や対策も必要となる。

上記の課題を克服し、遠隔支援や遠隔医療の仕組みを導入した企業や医療機関は、そうでない場合と比較して明確なアドバンテージがあるため、競争優位に立てることは明白である。そうなると、「他者劣位」の状態が急速に広がっていくと予想される。

なお、遠隔医療の場合はエキスパートの移動時間が不要となることで、その時間で“より多くの患者を救える”という大きなメリットも得られるため、筆者としてはぜひとも導入が進んでほしいと切に願う。

空間コンピューティングのソリューションと事例 

本稿の最後に、筆者自身が関わった空間コンピューティング事例の中から、何点か紹介する。公開可能な一部の事例のため、PoC中のものも含まれる点を了承いただきたい。

IBM Spatial Platform 

IBM Spatial Platformは、メタバースを次世代チャネルとして活用する際に企業が求める汎用的な機能を提供している(エンタープライズに最適化したメタバース基盤である「IBM Spatial Platform」を発表)(エンタープライズに最適化したメタバース基盤を日本IBMが発表

ユーザーが必要とするさまざまなメタバース・ユースケースのうち、最も汎用的な用途に則した機能をMVP(Minimum Viable Product:最小限の実行可能な製品)として、IBM Cloudのセキュアな環境で提供する。これにより、迅速なトライアル開始が可能となる。また、要望に応じてカスタマイズが可能なので、幅広いニーズに柔軟に対応できる。

<主な構成要素>

Hall/Meeting Room
Hallでは、近くにいる複数のアバター間で自由に会話する空間を提供。クローズドな空間であるMeeting Roomでは、Room内のメンバーに限定して会話できる。それぞれPC画面の共有が可能なスクリーンも用意されている。

Seminar Room
講師アバターが聴衆アバターの前でPC画面を投影し、プレゼンテーションできる。聴衆アバターは拍手などのリアクション、音声やテキストチャットにより講師とのQ&Aが可能である。

Showspace
3D空間内の展示会場であるShowspaceでは、画像や動画、3Dオブジェクトといった展示コンテンツの配置が可能。ユーザーは自由にそれらのコンテンツを参照したり、会場に配置された説明員アバターによる説明を聞いたりできる。

Watson Assistant
AIを活用したアシスタント機能であるWatson Assistantを呼び出してチャットできる。Watson Assistantをトレーニングすることで、幅広いユースケースへの対応が可能となる。

社内イベントによる数十名規模のセミナー、ユーザーとのユースケース検討やPoCを複数回実施した中で、有益なソリューションやユースケースなどさまざまな知見を収集している。

図表3  IBM Spatial Platformの構成要素

VPSを活用した位置情報システム

Visual Positioning System(VPS)とは、カメラなどから得られる画像情報と3Dモデルを利用して位置を特定するシステムである。GPS(Global Positioning System)では位置を特定しにくい屋内環境で、有効な位置特定の手段となる。AR技術などと組み合わせることで、さまざまな空間体験を実現できる。

たとえば生成AIと組み合わせることで、スーパーで夕食のメニューを伝えると、必要な食材をリストアップし、最短経路で各食材売り場までの案内をAR表示で支援する、といったことが可能となる(図表4)。

図表4 生成AIを組み合わせたAR表示

Remote Assist 

Remote Assistは大手製薬会社の工場向けに開発したアプリ(システム)で、2022年に本番運用を開始し、2024年時点で国内3工場1000名以上の現場作業者とエキスパートが利用している。

同アプリは、課題4で指摘した高速/安定ネットワークによる遠隔支援に加え、作業確認や作業記録のユースケースにも対応している。

主機能1 遠隔支援 
現場作業者はiPhone/iPadのカメラとマイクを用いて、作業現場の映像・音声を遠隔地のエキスパートにリアルタイム送信し、エキスパートは現場の映像を見ながら音声、テキストチャット、マニュアル送信などの方法でアドバイスや作業指示ができる。

音声だけだと正確な指示が難しい場所(多数のパイプやバルブがあるような場所など)では、「アノテーション」(矢印や○といったAR図形)を映像にオーバーレイ表示させて、操作箇所を明確化して指示できるため、伝達までの時間削減や誤指示/誤操作の削減に貢献している。

図表5 作業者画面
図表6 遠隔支援者画面

主機能2 遠隔確認

Remote Assist導入前は常に確認者が作業者に帯同していたが、導入後は確認が必要な作業の時のみ確認者は遠隔地から確認できるようになり、作業現場までの移動時間、クリーンルーム入室時の着替え時間、確認までの待ち時間などを削減できるようになった。

また待ち時間中は別の業務や別の作業者の確認もできるため、効率的な人的リソース配置も可能となった。

図表7 Remote Assistの構成

主機能3 作業記録
スマートフォンのカメラで撮影した映像を作業記録(エビデンス)としてシステムに保存できる。撮影した映像は、撮影者や撮影日時が記録され、改ざん/盗聴/なりすましができないようにセキュリティ対策を実施しているので、製造記録としても利用できる。

MES(製造実行システム)等のバックエンドシステムと連携するように拡張することで、ペーパーレス化の促進や転記に伴う時間やミスを削減できる(バックエンドシステム側が連携用のインターフェースやコネクターを備えている場合)。

 

後編につづく

 

 

著者
富澤 瑞穂氏

日本アイ・ビー・エム株式会社
シニア・アドバイザリー・アーキテクト、シニア・テクニカル・スペシャリスト
TEC-J ステアリング・コミッティーのメンバー

2000年、日本IBMに入社。金融、損保、自動車、航空、旅行、メディアなど幅広い業界でプロジェクトをリード企画?本番運用までフルスコープでデリバリーを中心にアーキテクトとして活動。近年は、XRを用いて新たな価値を創造するDXプロジェクトをリード。

著者
岡本 茂久氏

日本アイ・ビー・エム システムズ・エンジニアリング株式会社
Robotics Edge Lab.
コンサルティングITスペシャリスト

1997年、日本IBMに入社。2005年から日本アイ・ビー・エム システムズ・エンジニアリングに出向。エンタープライズ・コラボレーションのミドルウェア、ECソリューション、グラフデータベース、Watson APIなどのAIソリューションを担当。現在はAR/VR・空間コンピューティングのビジネス活用の先進事例やメタバースプラットフォーム構築のリード、グラフデータベースのAI活用を中心に取り組んでいる。

*本記事は筆者個人の見解であり、IBMおよび日本アイ・ビー・エム システムズ・エンジニアリングの立場、戦略、意見を代表するものではありません。


当サイトでは、TEC-Jメンバーによる技術解説・コラムなどを掲載しています。

TEC-J技術記事https://www.imagazine.co.jp/tec-j/

[i Magazine・IS magazine]

新着