0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

AR Glasses Spatial Audio Requirements/ARグラスの空間オーディオ要件

Last updated at Posted at 2025-06-29

概要

2025年から2026年にかけて、市場には新しいARグラスが次々と投入されるでしょう。ARグラスは、「非AR」のAIビジョングラスから、極めて高度な3DベースのARグラスまで、多岐にわたります。このリストは、特定のユースケース(ロケーションベース・エンターテインメント)に必要な要件を特定するためのものです。ロケーションベース・エンターテインメントは他のエンターテインメントとは異なります。他者とのインタラクションが必要な場合もあれば、そうでない場合もあります。また、ユーザーが移動する必要がある場合もあれば、そうでない場合もあります。座席に座っている場合もあれば、ジェットコースターに乗っている場合もあれば、自由に歩き回れる場合もあります。

IoTone JapanはAR/AI/IoTに携わっており、市場の進化に関する見解を共有します。お客様とパートナーの皆様には、適切な判断が明らかになる何年も前に、十分な情報に基づいた意思決定を行えるよう支援したいと考えています。

この議論は、ARグラスに関連する空間オーディオに焦点を当てています。VRデバイスには空間オーディオ処理のための独自のソリューションが組み込まれている場合があり、現時点では快適性に関する要件を満たしていないため、VRについては特に触れていません。

本レポートではデバイス名を明記しておりません。日本に適したデバイスの詳細については、info@iotone.jp までお問い合わせください。

Copilot_20250629_201935.png

要件

  • ライブオーディオフィードと比較して低遅延オーディオ
  • 他のユーザーが聞くものと比較して低遅延オーディオ。全員が同時に同じ音を聞く必要があります。
  • ARグラスを1~3時間快適に装着可能。理想的には3時間連続使用。
  • USB電源に接続した状態で1~3時間のバッテリー駆動時間
  • スマートフォンとのワイヤレス接続も可能
  • サードパーティ製のBLEまたはステレオジャック搭載ヘッドホンに対応していること
  • 理想的には、ヘッドトラッキングと音源のシーン配置を用いたソフトウェアによる空間オーディオソリューション
  • 音量調整が可能であること。スマートフォンアプリ経由も可能だが、物理的な操作が望ましい。
  • オーディオ品質は高解像度であること。ロスレスオーディオストリーミングは必須ではありませんが、ゲーム、映画、音声ではなく、音楽演奏向けに最適化されたオーディオが望ましい。
  • 3D空間での没入型ビジュアルが必須
  • サードパーティ製オーディオシステムにノイズキャンセリング機能が内蔵されている
  • 平均的な成人の体格にフィットする
  • 視野角46度以上
  • 表示されているアプリケーションを制御し、ユーザーが利用できる一般的な汎用メニューを無効にするエンタープライズ機能
  • 6自由度ヘッドトラッキング
  • 没入型3Dオーディオ/ビジュアル体験を開発するためのソフトウェアSDKが利用可能

オプション機能

  • 日本語ローカライズ
  • AR環境でのオーディオ制作には、プロレベルのオーディオツールが利用可能であること
  • 誤って音量を上げすぎないためのオーディオ安全機能
  • 子供でも使えるサイズ
  • 1~3時間持続する電源ケーブル不要
  • アバターのリップシンク用に、ユーザーを向いたカメラとマイク
  • 120度の視野角
  • ハンドトラッキング

Overview

In 2025->2026 there will be a rush of new AR Glasses being sold in the market. The glasses will range from "no-AR" AI vision glasses to extremely sophisticated 3D based AR. This list is an attempt to identify must have requirements for a specific use case: Location Based Entertainment. Location Based Entertainment is different than other forms of entertainment. It may or may not require interaction with others. It may or may not involve the customer to move around ... they might be seated, they might be on a roller coaster, they might be free to walk around.

As IoTone Japan is involved in AR/AI/IoT we will be sharing our thoughts on how the market will evolve. We want our customers and partners to be able to make informed decisions years before the right decision is obvious.

This discussion is focused on Spatial Audio, as it pertains to AR Glasses. It doesn't discuss VR specifically because VR devices may have their own built in solutions for handling spatial audio, and are also not meeting the comfort requirements at this point in time.

We won't name devices in this report. We also haven't adopted a specific audio format or tools yet. Pro-audio experiences will require low-latency, control of the quality, stability, and a shared experience. Contact info@iotone.jp for more details on devices suitable for Japan or to discuss the market.

Requirements

  • Low latency audio vs the live audio feed
  • Low latency audio relative to what other users hear. Everyone should hear the same thing at the same time
  • 1-3 hours of comfortable wearing of the AR glasses. Ideal is 3 hours without a break.
  • 1-3 hours of battery life, tethered to usb power source
  • Tethered wireless to a phone is ok
  • 3rd party BLE or stereo jack based headphones must be supported
  • ideally spatial audio solution is in software using head tracking and scene placement of audio sources
  • Audio level control must be available. Via phone app is ok, but prefer physical controls.
  • Audio quality should high resolution. Lossless audio streaming is not required, but it is preferred the audio is optimized for musical performance as opposed to for gaming or movie or voice.
  • immersive visual in 3D space is required
  • noise cancelling built into 3rd party audio system
  • fits the average adult
  • 46 degree FOV or greater
  • enterprise feature to allow control over the displayed application and disable typical general purpose menus available to users
  • 6DOF head tracking
  • Software SDK available to develop immersive 3D audio/visual experience

Optional Features

  • Japanese Localization
  • pro level audio tools should be available for audio production to use in the AR environment
  • audio safety to avoid accidental excessive volume
  • fits a child
  • untethered power that last 1-3 hours
  • camera and mic facing the user for avatar lip sync
  • 120 degree FOV
  • Hand tracking
0
0
1

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?