1. はじめに
clubhouseは、2021年1月頃から日本国内で猛烈な勢いで広がった音声チャットアプリケーションである。1
本アプリケーションで送受信できるのは基本的に音声のみであるが、コンピュータには電話という音声回線で画像などのデジタルデータを送受信してきたという歴史がある。
そこで本論文では、clubhouseにおける画像送信の方法および送信アプリケーションの開発、実際に送受信した結果についてまとめた。
2. 音声帯域を用いたデータ送受信
1980年代初頭までのパーソナルコンピュータにおいては、データの補助記憶媒体としてカセットテープが用いられた。
また、1990年代までは電話回線を用いたネットワーク送受信が主要なデータ送受信方法の一つであった。
いずれもアナログ音声を記録または送受信する目的で設計されており、人間の発話で用いられる周波数帯の記録・送受信に最適化されている。2
clubhouseも同様にアナログ音声に特化した帯域のみの送受信がなされているとみられるため、データを送受信する際にもこれを念頭に入れる必要がある。
fig.1 カセットテープ |
3. 画像データを音データに変換する方法の選定
そこで今回、clubhouseで的確にデータを送信する方法として、コンピュータからカセットテープへの記録に用いられたカセット・インターフェイスを踏襲した。
カセット・インターフェイスは、音信号を矩形波ととらえ、矩形波の基本周波数を0、倍の周波数を1としてデータを記録する方式である。基本周波数1200[Hz]の場合はパルスから次のパルスまでの時間が1/1200秒すなわち833[μsec]であるから、この間にパルスが1つであれば0、2つであれば1として1ビットのデータを受け取る。
fig.2 データ波形 |
さらにこれらのデータを8ビット=1バイトとし、その先頭と終端にスタートビットとストップビットを入れることで1バイトのデータとする。
fig.3 データストリーム |
これらのデータにヘッダーを加えたものが1まとまりのデータとして送受信されるが、詳細については付録に載せる。
4. データ変換プログラムの作成
次に、上述のカセット・インターフェイスを再現するプログラムの開発を行った。
目標とする仕様としては
・画像およびテキストをカセットインターフェイスに準拠した音声データに変換できるもの
・ブラウザ上で使用できるもの
を目指した。結果、開発したものがこちらである。3
(2021/6/30 pythonanywhere使用期限終了予定)
fig.4 作成したアプリ |
プログラム言語としてPythonを選択し、データ生成等のホストとしてPythonanywhereを使用した。 |
5. ルーム滞在者がデータに及ぼす影響
次に、発話によるS/N比の変化がデータに及ぼす影響を測定した。
一般に、データ送信中に発話ノイズが加わることでデータが変化することが知られている。
これは乳幼児の泣き声が音響カプラに及ぼす影響に類するものである。4
■さらに内容の薄いroomで得られた画像
5
以上から、スタートアップ経営者や意識の高いユーザーの多いルームでは画像の情報量が増大するという現象が見られた。
また、それ以外のルームでは概して情報量が減少する傾向がみられた。
6. まとめおよび今後の課題
今回行った実験で、文書、画像などのデジタルデータを音声データに変換することに成功した。
また、変換した音声データをclubhouseを介して送信・復元した場合、多くの例でデータ構造に変化が見られた。
今後はさらにサンプルを増やし、roomの特徴による画像変化についてまとめていく予定である。
7. 謝辞
みなさまの貴重なお時間を割いてエイプリルフールネタにお付き合いいただき、ありがとうございました。
8.付録
1.バイナリをカセットインターフェース音声に変換するプログラム
2.バイナリをカセットインターフェース音声に変換するプログラム(ソースコード)
3.MSX カセットインターフェイス
4.昨年度の論文
9.参考文献