Wanoグループ Advent Calendar 2022の15日目は、TuneCore Japanでサービスを展開する上で、新たな音系技術の学びにおける情報のあつめ方について、紹介してみようと思います。TuneCore Japanでは、アーティストの曲を世界185カ国以上の配信ストアで販売・配信のサービスをおこなってます。
皆さんは情報を集めるのに、どうしているでしょうか?
まずは ITU
ITU 日本語だと国際電気通信連合として知られる組織です。世界規模で電気通信を標準化することを目的として勧告を作成する国連機関です。
動画フォーマットとして一般にも浸透したH.264はITUのHシリーズの勧告で、Hシリーズは「オーディオビジュアル及びマルチメディアシステム」に関する規定を定めています。「ITU H.264」でググると、H.264 : Advanced video coding for generic audiovisual servicesが検索されます。standardとしての仕様書は、このような形で入手が可能です。会員じゃないと読めないドキュメントもあったような??
最近の音系技術の話題としては空間オーディオでしょうか? 空間オーディオはイマーシブオーディオ(immersive audio)とも言われますので、「immersive audio itu」でググるとBT.2133 : Transport of advanced immersive audio visual ... - ITUが検索されます。BTシリースですから、放送業務(テレビジョン)に関する規定です。想定したイメージのモノとは少し異なるので、再度検索します。
従来の仕組みをchannel based audioと空間オーディオのような仕組みをobject based audioと定義していますから、「object audio itu」でググるとAudio Definition Model - ITUが検索されます。PDFが直接ヒットしましたが、BSシリース、放送業務(サウンド)に関する規定ですから期待した内容がヒットしました。ちなみに番号がわかっている場合、この場合「BS.2076-1 itu」でググっても同様ドキュメント置き場に辿り着けます。Googleの検索結果は必ずしも最新ドキュメントとは限らないので、ドキュメント置き場に最新があるか確認すべきです。
1つのドキュメントに、あるテーマ全ての情報が記載されていることはありませんから、粘り強く関連ドキュメントNOを辿っていくしかないのが辛いです。
MPEGってナニ組織?
空間オーディオ資料に触れたので、360 Reality Audioの資料も気にするべきでしょうか? 360 Reality Audioそのものの資料はソニーとNDA結ばないと手に入りそうもないので、そのベース技術 「MPEG-H 3D Audio」でググってみます。MPEG-H Audio - Fraunhofer IISが検索されました。そうです、Fraunhofer IIS、フラウンホーファー研究機構がMPEG技術の総本山です。
MPEG関連はMPEG Standardsにあるのはわかっているので、ちょっと覗いてみます。見慣れないものもありますが、MPEG-H (ISO/IEC 23008)ちゃんとありました。3D Audioに移動してみるとそれっぽいものText of CD ISO/IEC 23008-3, 3D Audio, Third Editionがありました。zipを展開すれば仕様書が手に入ります。
こちらも関連資料を探っていくのはキリが無いという点では同様です。英語ネイティブじゃないとホント辛いです。ちなみにISO/IECにもドキュメント存在しますが、販売されていたりします。
辛いのでソース見たい
standard資料を探してるとリファレンスソースも見つかることがあります。MPEG-H 3D Audioのリファレンスソースは、3D Audio Reference SoftwareのCD of ISO/IEC 23008-6, 3D Audio Reference Software, Third Editionです。zipを展開すればソースが手に入ります。
こういうのはたいてい、C言語およびC++言語で書かれていますので、それなりに勉強しとくことをオススメします。お宝がある可能性もありますから??
やっぱりGitHub?
GitHubで先の「BS.2076」で検索してみます。ebu/libadm、ebu/ear-production-suiteがヒットしました。ebuは、European Broadcasting Union 欧州放送連合です。libadmは、Audio Definition Model、ADMファイルを扱うC++ライブラリで、EAR Production SuiteはDTMのVST3 pluginです。REAPERで使用することを想定しているようです。どうやらEBUは、ADMファイルの開発元のようなので探せば、EBU ADM Guidelinesがみつかります。さて空間オーディオのキモ、ADMファイルの開発元なのですからRendererもあるはずです。そう想像力を働かせましょう! ebu/libear、ebu/ebu_adm_rendererコレかな?
ライブラリは、lib + ナントカなので「libmpegh」で検索すれば、ittiam-systems/libmpegh、ittiam-systems/libmpeghe、前者がDecoder、後者がEncoderの位置づけのようです。Ittiam Systemsはインドの会社みたいです。あとは会社名で検索する感じですか。「Dolby」だと、Dolby Laboratories、Dolby.ioとDolby.io Samplesがヒットしました。
多くのエンジニアがあつまるGitHubのような場所に、リファレンスといえるソースを置いてもらえるのは有り難いですね!
情報はあるところにはアル
特定の技術を指す固有名・番号、会社、個人名を好奇心・向上心を持って追っていると自然と情報に辿り着くものです。技術情報収集から自身の知識へ消化するのはナカナカに大変な道ですが、AI技術の発展もあり翻訳精度も上がってる昨今、このような情報でも役に立てば幸いです。