ホーム » 製品調達 » 家電 » Meta の最先端の AI 搭載 AR グラス: 次のスマートフォンはメガネになるかも
Meta の新しい AR グラス Orion

Meta の最先端の AI 搭載 AR グラス: 次のスマートフォンはメガネになるかも

未来のメガネはどんなものになるのでしょうか。多くの人が一度は想像したことがあるのではないでしょうか。

現在のメガネとほぼ同じサイズで、ナビゲーション中にモバイル HUD に変形できます。ビデオ通話中は、相手のホログラフィック画像が空中に浮かびます。レンズには必要なものがすべて表示されます... 基本的に、ベジータやアイアンマンが着用しているメガネのようなものです。

25月XNUMX日、Metaは同社初のARスマートグラス「Orion」を発表し、この理想的な製品に一歩近づきました。ARグラスは過去数年にわたって発売されてきましたが、それらにはどれも明らかな欠点がありました。機能が限られており、基本的にはポータブルプロジェクターとして機能していたり​​、かさばって法外に高価であったりして、一般市場には不向きでした。 

Meta の新しい AR グラス Orion

以前の製品と比較して、Meta Orion の洗練されたデザインと統合された AR 機能は、AR グラスが主流になるという希望を再び呼び起こします。さらに、Meta Connect 2024 はイベントの 10 周年を記念しており、マーク・ザッカーバーグは他にもいくつかの新製品を発表しました。

  • Meta Orion スマートグラス: 業界をリードする AR 体験。
  • Meta Quest 3S ヘッドセット MR グラス: Quest 3 の「ライト バージョン」。価格は安いですが、画期的な機能はありません。
  • ヘッドセットのユーザーエクスペリエンスを向上させるために Meta AI を継続的にアップグレードします。
  • Meta Ray-Ban の新しい AI 機能: リアルタイム翻訳、パーソナライズされたスタイルの提案、さらには車の検索のサポートなど。
  • マルチモーダル機能を備えた Meta 初のオープンソース大規模言語モデル (LLM)、Llama 3.2。
Metaの製品発表イベントに出席したマーク・ザッカーバーグ

ハードウェアと組み合わせた AI は、今年の消費者向け電子機器のホットな話題です。しかし、Meta はどのようにして強力な AI モデルを新しいハードウェアに統合するのでしょうか。そして、待望の Meta Orion スマート グラスはどのようなものでしょうか。詳しく見てみましょう。

Meta Orion AR グラス: 10 年にわたるプロジェクトの見事なデビュー

ザッカーバーグ氏のビジョンでは、メガネは究極の未来的デバイスであるべきだ。これに先立ち、Meta 社は Ray-Ban Meta とのコラボレーションでスマート グラス市場に参入し、スマート アイウェアに対する消費者の関心を測る上で大きな成功を収めていた。

しかし、Ray-Ban Meta は Meta の最終目標の半分しか達成しませんでした。この製品は主にオーディオ、写真、およびいくつかの基本的な AI 機能を提供していましたが、本質的には従来のウェアラブル デバイスのままでした。

Metaの以前のスマートグラス、Ray-Ban Meta

ザッカーバーグ氏が「完璧」と評した完成版が、Meta Orion ARグラスだ。この極秘プロジェクトは10年以上開発が続けられ、数十億ドルが投資されてきた。今日、ついに世界がそれを目にすることになる。

Meta Orion メガネの第一印象は、通常のサングラスによく似た、洗練されたデザインです。これにより、市場にあるよりかさばる競合製品とは一線を画します。結局のところ、メガネは見た目も良くなければなりません。

Meta は、すべてのコンポーネントを 1 つのフレームに詰め込まないという選択をすることでこれを実現しました。代わりに、Meta Orion は、メガネ本体、ハンド トラッキング リストバンド、リモコンほどの大きさの「コンピューティング モジュール」という 3 つの独立したパーツで構成されています。これら 3 つのコンポーネントはワイヤレスで接続されています。

メタオリオンは3つの独立した部分から構成されています

このモジュール設計と軽量マグネシウム素材の使用により、Orion グラスの重量は驚くほど軽く、98 グラムです。比較すると、17 月 226 日に発売された Snap の新しい AR グラス Spectacles の重量は XNUMX グラムとかなり重いです。

さらに印象的なのは、軽量の Orion のバッテリー寿命が約 45 時間であるのに対し、よりかさばる Spectacles ではわずか XNUMX 分しか持たないことです。

Meta OrionとSnap Spectacleの比較
左: Meta Orion、右: Snap Spectacle

コアとなるAR投影機能に関して言えば、Orionはいくつかの重要な分野で「競合他社よりはるかに先を進んでいます」。従来のガラスディスプレイの代わりに、Orionはシリコンカーバイドレンズを使用しています。フレームに埋め込まれたマイクロプロジェクターが導波管に光を放射し、それがレンズに投影され、さまざまな深さとサイズのARビジュアルが作られます。ザッカーバーグ氏はこれを「パノラマビュー」と呼んでいます。

テストによると ベルジェMeta Orion の視野は驚異の 70 度に達し、AR グラスとしては業界で最も広い視野を実現しています。

公開されているデモ ビデオでは、ユーザーはメガネをかけて Meta Horizo​​n アプリの複数のウィンドウを開き、マルチタスクを実行したり、Meta AI を使用して現実世界のオブジェクトを認識してラベル付けしたりすることができます。

Meta Orion の使用中に複数の Meta Horizo​​n アプリ ウィンドウが開いていることを示す画像

ユーザーの視線がこれらのウィンドウから外れても、仮想投影はそのまま残り、ユーザーの注意が戻ったときに再び表示されます。

画像とテキストの鮮明さに関しては、写真を見たりテキストを読んだりするには十分ですが、少なくとも今のところは、このメガネを使って映画を見ることはおそらく望ましくないでしょう。

Meta のソーシャル ネットワーキングに関する専門知識は、AR グラスで新しいエキサイティングな可能性も生み出しています。友人と通話しているとき、彼らのホログラフィック投影が目の前に現れますが、現在のバージョンはまだやや粗いです。

Meta Orion で映画を見たり友達に電話したりする様子のイラスト

Meta Orion には、装着者の顔をスキャンしてモバイル ユーザーとのビデオ通話用のリアルタイム アバターを作成する内向きカメラも搭載されています。

インタラクションの面では、Meta Orion は視線追跡、手追跡、AI 音声コマンドをサポートしています。リストバンドと組み合わせると、ユーザーはより正確なハンドジェスチャーを実行できます。

リストバンドはいくつかの手のジェスチャーを認識します。親指と人差し指をつまむとコンテンツが選択され、中指と親指をつまむとアプリ ランチャーが呼び出されたり非表示になったりします。親指を握りこぶしに押し当てると、コインを投げる動作を模倣して上下にスクロールできます。全体的に、操作は自然に感じられます。

リストバンド認識によるハンドジェスチャーのデモンストレーション

また、リストバンドには触覚フィードバック機能があり、ジェスチャーが正常に認識されたことを確実に知ることができることも特筆に値します。これは、現在多くの複合現実 (MR) デバイスが直面している大きな問題に対処します。

リストバンドは、手のジェスチャーに関連する筋電図 (EMG) 信号を読み取ることで機能します。 ベルジェ それを「心を読む」ことにさえ例えました。

The Verge から提供された、Meta Orion メガネと組み合わせたリストバンドのクローズアップ画像
画像クレジット: ベルジェ

このリストバンドを使用すると、Orion インターフェースのポインターとして目を使い、ピンチして選択することができます。全体的な操作は直感的です。さらに重要なのは、公共の場でコマンドを出すためにぎこちなく手を空中に振る必要がないことです。手をポケットに入れたまま、AR グラスを自然に操作できます。

Ray-Ban のメガネですでにインパクトを与えている Meta AI は、AR との統合によってさらに一歩前進しました。これにより、現実世界とより深くやり取りできるようになりました。

ライブデモ中、 ベルジェ Orion を使用してテーブルの上の材料を素早く識別してラベルを付け、Meta AI にそれらの材料を使用してスムージーのレシピを生成するよう依頼しました。

Meta Orion が食材を識別し、レシピを生成するデモ

マーク・ザッカーバーグはMeta Orionが消費者向けに設計されていると強調したが、現在のバージョンはまだプロトタイプであり、選ばれた開発者とテスターのみが利用できる。これをテストしている人の中には、NVIDIAのCEO、ジェンスン・フアンもいる。

メタオリオンのメガネをかけているジェンセン・ホアン

Meta Quest 3S: Vision Pro のライトバージョン?

ザッカーバーグ氏はステージに上がってから3秒以内にQuest XNUMXSの価格を発表したが、これは電子製品の発表では極めて珍しいことだ。この直接的で要点を突いたアプローチは本当に素晴らしいと言わざるを得ない。

Meta Quest 3s と Quest 3 の価格

つまり、Meta Quest 3S は基本的に Quest 3 の「ライト バージョン」です。128GB の基本モデルの価格は 299.99 ドルからで、256GB バージョンの価格は 399.99 ドルです。

スペックに関しては、Quest 3S は Quest 2 と同じ Snapdragon XR2 Gen 3 プロセッサを搭載しており、ハンドトラッキングもサポートしています。

ハンドトラッキング機能のデモンストレーション

プレゼンテーションを見た後、「Quest 3S」という名前は「Quest 2 Plus」と呼ぶ方がふさわしいと感じました。報道によると、より予算に優しいオプションとして、Quest 3SはQuest 2と同じレンズを使用し、Quest 3に比べてボディが厚くなっているとのことです。

Quest 3S のハードウェア仕様は Quest 3 と一致しませんが、ソフトウェアエクスペリエンスは実質的に同じです。より高価なモデルと同様に、Quest 3S は Horizo​​nOS で動作し、幅広いエンターテイメント機能と生産性機能を提供します。

昨年 Quest 3 が発売されたとき、レビューは賛否両論でした。最も大きな批判は、ビデオ パススルー モード使用時の大幅な遅延と歪みでした。ザッカーバーグ氏は、XNUMX 年間の最適化を経て、特に VR 機能、ハンド トラッキング、ソフトウェア互換性の XNUMX つの主要領域でエクスペリエンスが大幅に改善されたと発表しました。

ユーザーは、Vision Pro と同様に、2D Web ページを没入型ワークスペースに変換し、仮想空間内の任意の場所に複数の開いたウィンドウを配置できるようになりました。

没入型作業能力のデモンストレーション

さらに、Quest 3S のシアター モードでは、XNUMX つの画面を巨大な仮想シアターに拡張して、空間全体を埋め尽くすことができます。ヘッドセットでの没入型視聴は新しい概念ではありませんが、重要な違いは、サポートされるプラットフォームとメディア ソースの数にあり、それが製品のエクスペリエンスを決定します。

Quest 3S は、Netflix、YouTube、Amazon Prime などの主要な西洋メディア プラットフォームをサポートしており、これらはすべてシアター モードで使用できます。

映画やゲームは、あらゆる VR ヘッドセットにとって欠かせないエンターテイメント機能ですが、追加機能が製品の性能を際立たせることがよくあります。イベントで発表された新機能の 3 つは、Quest XNUMXS の Hyperscale です。

携帯電話を使用して、家具を含む部屋のレイアウトをスキャンし、Quest 1S 内で部屋のほぼ 1:3 モデルを再現できます。

Quest 3S の Hyperscale を使用した部屋の再現機能

イベントで披露されたデモンストレーションでは、再現されたシーンはギザギザや歪みが最小限に抑えられ、非常に忠実に再現されていました。この技術は、自宅から出ることなく、家や美術館、ランドマークを臨場感あふれるバーチャルツアーで楽しむために使用できる可能性があります。

しかし、これを超えて、シーンの再現の実用性と、それをさまざまな地域にどのように適用できるかは、Meta と Quest が将来答えなければならない問題のままです。

「メタバース」の略称である Meta は、マーク・ザッカーバーグ氏の新技術への取り組みを強調するために Facebook からリブランドされました。Meta は、メタバースを積極的に追求した最初のテクノロジー大手の 1 つであり、途中で数多くの課題に直面したにもかかわらず、「メタバース」は Meta 製品の発売ごとに重要なトピックとなっています。

このイベントで、ザッカーバーグ氏は没入型ソーシャル機能の新たな強化点を紹介した。Questユーザーは仮想アバターを作成し、チームを組んでゲームをしたり、運動したり、仮想コンサートに一緒に参加したりできるようになった。

没入型ソーシャル設定でのアバターインタラクション

Quest 3S のリリースに合わせて、Meta は Quest 2/Pro の製造を中止し、Quest 3 の価格を 649 ドルから 499 ドルに値下げすることも発表しました。新製品は 15 月 XNUMX 日以降に出荷可能になります。 

Llama 3.2 リリース: マルチモーダル機能により AR グラスが実現

Meta Quest 3S の最小限の変更と比較すると、Meta AI の新機能はより輝いています。イベントでは、Meta の最新の大規模言語モデル (LLM) である Llama 3.2 が、その優れたマルチモーダル機能で注目を集めました。

マーク・ザッカーバーグは、Meta AIに音声機能が加わり、ユーザーはMessenger、Facebook、WhatsApp、Instagramを通じて質問したり、他の方法でチャットしたりして、音声による応答を受け取ることができるようになったと発表した。

ユーザーは音声で Meta AI と対話できるだけでなく、ジュディ・デンチ、ジョン・シナ、オークワフィナ、クリステン・ベルなど、さまざまな有名人の声から選択することもできます。

Meta AI 音声対話デモ

ザッカーバーグ氏はこの機能をステージ上で実演しました。全体的に、応答時間は速く、回答はかなり正確で、音声のイントネーションは人間の会話にさらに近いものでした。ユーザーはいつでも会話を中断して、新しいトピックや質問を挿入することもできます。

デモ中にはいくつかの不具合があったものの、ザッカーバーグ氏は、進化する技術のデモではこれは当然のことだということを率直に認め、これらの点については改善に取り組んでいると強調した。

Meta AI の AI Studio 機能を使用すると、音声によるやりとりに加えて、ユーザーは自分の好み、興味、ニーズに合わせて独自の AI キャラクターを作成できます。これらの AI キャラクターは、ミームを生成したり、旅行のアドバイスを提供したり、単にカジュアルな会話をしたりするのに役立ちます。

日常生活で使用されているMeta Ray-Banのデモ

しかし、結果から判断すると、今後登場するAI翻訳機能の方が実用的であるようだ。現在、Meta AIを搭載したすべてのデバイスは、リアルタイムの音声翻訳をサポートしている。イベント中、2人のプレゼンターがMeta Ray-Banのメガネを使用して、英語とスペイン語のリアルタイム会話を行い、デバイスのライブ翻訳能力を披露した。

Meta Ray-Ban はマイクを通じて会話をキャプチャし、装着者の母国語にすばやく翻訳します。翻訳は比較的高速ですが、長い文章の場合は短い間が空くため、会話が少しぎこちなく感じられます。場合によっては、AI が話者の会話の途中で割り込むこともあります。

もう一つの機能である動画音声の翻訳は、さらに一歩進んだものです。前述のリアルタイム翻訳と比較すると、これは「高度な翻訳機能」と呼べるでしょう。Meta AI はオンライン動画の音声を別の言語に翻訳することができ、驚くべきことに、英語を話すときに話者の本来のトーン、声の特徴、さらにはさまざまな国のアクセントさえも完璧に維持することができます。

動画翻訳のMeta AIデモ

イベントでの Meta AI の一連のアップデートには、共通の原動力があります。 3.2に電話します。

今年 3.1 月、Meta は 405 億のパラメータを誇る画期的な Llama XNUMX モデルを発表したばかりでした。これは Meta が開発した最も強力なオープンソース モデルであり、世界でも最も強力なモデルの XNUMX つでした。

驚くべきことに、わずか 3.2 か月で Llama XNUMX が登場しました。

Llama 3.2 は、Meta 初のマルチモーダル機能を備えたオープンソース AI モデルです。つまり、テキストと画像の両方を同時に処理できます。11 つのビジュアル モデル (90B および 1B パラメータ) と 3 つの軽量テキスト専用モデル (XNUMXB および XNUMXB) が用意されています。軽量モデルは、外部サーバーに依存せずにユーザー入力をローカルで処理できます。

ラマ3.2

Llama 3.2 の新機能により、大型モデルを搭載した多くのデバイスがより実用的なシナリオに拡張されました。前述の AI 翻訳機能に加え、視覚機能も搭載された Meta Ray-Ban は、ユーザーの日常のタスクやルーチンをより深くサポートできます。

たとえば、ユーザーは Meta Ray-Ban にアボカドでどんな飲み物が作れるかを尋ねることができますが、文中で「アボカド」と明示的に言う必要はなく、「これ」のような代名詞を使用するだけで十分です。メガネは物体を認識できるからです。

ショッピングモールで車をどこに停めたか忘れた経験のある人は多いでしょう。駐車スペースの番号を頻繁に忘れてしまう人のために、Meta Ray-Ban ではその情報を保存して、必要なときに簡単に取り出すことができるようになりました。

駐車場情報を記憶するMeta Ray-Banのデモ

ポスターの番号に電話をかけたり、パンフレットの QR コードをスキャンしたり、日々の服装選びを手伝ったりと、メガネに内蔵されたカメラと新しくアップグレードされた視覚 AI を組み合わせることで、Meta Ray-Ban は日常生活のあらゆる場面にシームレスに溶け込みます。

このカメラのおかげで、Be My Eyes と Meta のコラボレーションが可能になりました。Be My Eyes は、リアルタイム ビデオと AI を通じて、視覚障害者と目の見えるボランティアや企業を結びつける非営利プラットフォームです。ボランティアや組織は、ライブ ビデオ通話を通じて、ユーザーがリアルタイムで問題を解決できるよう支援できます。

こうした技術の進歩は、大多数の人々の生活を向上させるだけでなく、特定のグループ向けのサービスの大きなギャップを埋め、すべての人に利便性を提供します。ここで、テクノロジーの真の意味が明らかになり始めます。

メタイベントでBe My Eyesとの提携について語るマーク・ザッカーバーグ

次世代コンピューティングデバイスの幕開け

MetaのOrionグラスにはすでに期待が寄せられていたが、マーク・ザッカーバーグがついに本物の製品を発表したとき、長らく技術革新に欠けていた驚きの感覚がよみがえった。

この驚きは、Meta の魅力的な未来ビジョンによるだけでなく、製品の実際のパフォーマンスがそのビジョンに驚くほど近いためでもありました。 ベルジェ 試用後、鋭い評価を下しました。「オリオンは遠い幻影でもなければ、完全に完成した製品でもなく、その中間のどこかに存在します。」

これが、Meta がこれまでに試みてきた未来のコンセプトの多くと Orion を区別する点です。これは、研究室に閉じ込められたプロトタイプではありません。Meta は、この次世代デバイスに「全力」を注ぎ込み、AI と複合現実 (MR) を完璧に融合しました。

Metaの新しいARグラス、Orion

Orion は究極の AI デバイスです。ユーザーが見ているものを見て、ユーザーが聞いているものを聞き、それをユーザーの現実世界の状況と組み合わせて、より効果的な応答を提供します。

また、究極のインタラクションおよびコミュニケーション ツールでもあります。小さな画面やかさばるヘッドセットに制限されることがなくなり、Orion により仮想世界と現実世界がシームレスに融合し、いつでもどこでもインタラクションが可能になります。

コンピューティング デバイスとしてのスマートフォンのライフサイクルが終わりに近づいていることは、業界では広く認識されています。Apple、Meta、さらには OpenAI などの企業は、次に何が起こるかを模索しています。

Meta Orion はまだプロトタイプの段階ですが、この製品は今のところかなり有望に見えます。スマートフォンに次ぐ主流のスマートデバイスになるかどうかはまだわかりませんが、ザッカーバーグ氏はその可能性に自信を持っています。

メガネやホログラムは、ありふれた製品になると予想されています。現在メガネをかけている何十億人もの人々が、AI や複合現実 (MR) メガネに移行できれば、世界史上最も成功した製品の一つになる可能性があります。そして、ザッカーバーグ氏によると、さらに大きな成功を収める可能性もあるそうです。

ソースから もし 

著者 肖凡博

免責事項: 上記の情報は、によって提供されています。 翻訳元Chovm.com とは独立して運営されています。Chovm.com は、販売者および製品の品質と信頼性について一切の表明および保証を行いません。Chovm.com は、コンテンツの著作権に関する違反について一切の責任を明示的に否認します。

コメント

あなたのメールアドレスは公開されません。 必須フィールドは、マークされています *

上へスクロール