実際に対面しているかのような次世代コミュニケーション

メタバースは非現実的で、ビデオ会議は疲れるーー。没入感のある等身大のコミュニケーションとは何か?

Metaは2022年10月に、同社が展開する仮想現実空間「Horizon Worlds」のアバターに「足」を追加することを明らかにしましたが、発表するタイミングは遅すぎたのかもしれません。その後、2023年はメタバースに関するメディアの関心は薄れてきていました。ところが、今回AppleのMR(複合現実)ヘッドセット「Vision Pro」が米国で販売開始されたことにより、メタバースは再びメディアに取り上げられるようになりました。単なる非現実的なアニメーションの世界ではなくなって来たのです。同社が提供する音声ビデオ通話サービスFacetimeでは、Vision Proのユーザーが「デジタル・ペルソナ」として友人と交流し、顔と手の動きをダイナミックかつ自然に表現することが可能になりました。

さて、メタバースについての意見はさておき、MetaとAppleは人類が長い間抱えている問題のひとつ「距離の呪い」を解決しようとしています。人生で最も重要な瞬間は、人とのふれあいの中で訪れます。そしてテクノロジーの重要な役割のひとつは、物理的な距離をなくし、遠く離れた人々とより密接にコミュニケーションできるようにすることです。歴史を振り返ると、古代エジプトのパピルスも印刷機も遠く離れた人々に思考を伝える手段とされたように、すべての通信テクノロジーはこの呪いを解決するために開発されてきました。

一方、人類はまだ完全なテレポーテーション(瞬間移動)技術を発明できていないため、現状では通信テクノロジーは遠く離れた人と実際に交流しているように錯覚させることが必要です。ただ残念ながら私たちの脳は偽りを簡単に見抜きます。電話の低い音質は人々の声を遠く感じさせるものでした。一方、SF映画『2001年宇宙の旅』で描かれたように、ベーシックなビデオ通話は大きな前進でした。テレビ電話の相手の上半身と顔を、まるでテレビの向こうのニュースキャスターと話しているかのような感覚で見ながら話すことができます。

このビデオ通話が世の中に普及してからさらに10年が経ちました。今では私たちはビデオ通話も電話と同じくらい限られたものだと感じ、間接的なやりとりだと認識しています。メタバースは、人類の次のステップとしてデジタル空間の中で人々の交流を再現することを提案しています。頭に装着する特別なゴーグルを通して、実際にその場にいるように感じることができる体験です。しかし、デジタルな人格を強制的に使うことになると、「アンキャニーバレー(人間に似ているが完全には人間でないものを見た時に感じる不気味さや違和感)」を感じることがあります。

tonari:実在する人間のための空間コミュニケーション

私たちも「距離の呪い」を解決するために取り組んでいますが、より人間中心の異なる方法を採用しています。ユーザーに自分がデジタルアバターだと信じ込ませる負担はかけません。テクノロジーが邪魔にならないようにしたいという思いからです。tonariの前に座れば、まるで本当に誰かと一緒にいるかのような感覚が得られます。これは通常のビデオ通話では実現できないことで、単にビデオ通話を大画面にするよりもずっと難しいことです。単なる大画面化を超えて、多くの新しい技術的・デザイン的な課題に対処する必要があり、私たちは過去数年にわたりこれらの課題に挑戦してきました。

等身大のスクリーン

実際の会話では、相手に集中しすぎて部屋の他の部分を見逃しがちですが、常に相手をその部屋全体の中で見ています。Immerse VRはこれを正しく理解しており、現実のように感じるために小さな画面だけではなくより広くところを見ることができます。

tonariは、床から天井までの大型スクリーンです。これにより、まるで巨大な扉を通して別の部屋を覗いているかのように、会話相手だけでなく、その背後で起こっていることも見ることができます。そして実生活のように感じるためには、ビデオは1:1のスケールでなければなりません。私たちは、画面の中央にカメラを置き、物体が実際のサイズに見えるように調整しました。

また、大画面の良い点はそれがシンプルに楽しいということです。何かに深く没頭することで、集中しやすくなります。これは、大画面で映画を見たり、巨大なスピーカーで音楽を聴いたりするのが楽しいのと同じ理由かもしれません。さらに大画面があることで色々なことを同時にやろうとする誘惑がなくなり疲れにくくなります。また、tonariでスムーズな会話を続けながら、パソコンの共同作業もでき、ブラウザのタブを行き来する手間や、作業の流れを失う心配もありません。

集中を妨げず目と目が合う

実生活では、会話中に相手の目を見るのが普通ですが、カメラが画面の上部にある場合これを再現するのは困難です。tonariではカメラを画面中央に設置しました。そうすることで、画面の中心にいる人にあなたの自然な視線が伝わります。もう一つ重要な点は、通常、自分自身を見ることができないことです(鏡の前にいる場合を除く)。しかし、ビデオ通話では自分の姿を見ることが一般的であり、これは多くの人にとって気を散らす要因です。tonariの画面では、実生活のように自分自身を見ることはできません。これにより、画面の向こう側にいる相手に完全に集中することが可能になります。

高解像度、低遅延

多くの新しいデバイスは4Kカメラを搭載していると謳っていますが、実際にはその高解像度の映像をリアルタイムで送信することは難しいことが多いです。多くの場合、最高でも1080p、30fpsに留まり、720p、20fpsでの送信が一般的です。tonariのハードウェアとソフトウェアは、3K、60fpsの映像と高ビットレートの48kHzステレオオーディオを、非常に低い遅延と高い信頼性で送信することができます。これにより映像や音声が滑らかになり、実生活に近い印象を与えることが可能です。

ただ大きくて高解像度であるだけでは、自然な感覚には足りません。実際に隣にいる人と会話する時、話し声は音速で伝わり、遅延は感じません。しかし、現在の通信ツールでは別の場所からの信号がハードウェア、ソフトウェア、インターネット接続を経由し、場合によってはサーバーを通るため、デバイスに戻るまでに時間がかかります。光ファイバーインターネットケーブルでの伝送は速いですが、標準的なビデオ通話での遅延の大きな要因はハードウェアとソフトウェアにあります。

tonariはハードウェアとソフトウェアをしっかりと統合し、最初から独自のプラットフォームを構築することで、100ミリ秒以下の遅延を実現しています。これは実際の会話に近い印象を持つことが可能です。一般的なweb会議では、遅延が300~500ミリ秒になることもあります。この程度の遅延は、ジョークを交わすタイミングを不自然にし、話がかぶるというよくある問題を引き起こします。スムーズな会話には極めて低い遅延が求められます。人間は敏感で、150ミリ秒以上の遅れがあると気になりますが、tonariは東京ーサンフランシスコやニューヨークーロンドンまでの長距離でもこの閾値を下回ることができます。

つまり、通常のビデオ通話と比べて、tonariは毎秒の画像送信量が約10倍、速度も3倍になります。これは、バスから新幹線への乗り換えに匹敵するほど、性能と快適さが格段に向上することを意味しています。

テクノロジーを進化させる、距離を感じないようになるまで

これらの技術的な課題を克服することにより、tonariは隣にいる人との距離感をより縮めることができます。私たちの目標は、ユーザーがその距離感を全く感じなくなることです。ユーザーは単にtonariの前に立つだけで、普段どおりに交流したり会話を楽しんだり、立ち上がって動き回ったり、ソファに横になることもできます。さらに喜ばしいことに、これらの解決に必要な技術分野は進化しています。カメラはより鮮明になり、音声はよりクリアに聞こえ、ハードウェアはより速くなっています。私たちは、毎年、実生活のような体験に一歩ずつ近づいていると確信しています。

tonariに興味がある方は、ぜひ月間ニュースレターへご登録ください。また、ご質問やアイデア、応援のお言葉などございましたら、hey@tonari.no までご連絡ください 👋

SNSで最新情報をチェック 💙 Facebook: @heytonari Instagram: @heytonari X: @heytonari