そもそも0.0dBを超えてはいけない理由
これはデジタル音声メディアの仕組みそのものに起因します。
デジタルの世界では、現実では滑らかな音の波が量子化されて数値化されます。
そして、この時の数値化された音の大きさの最大値が0.0dBなのです。
ちなみに最小値は-∞dBです。
この-∞dBから0.0dBまでを、16bitの音源なら2の16乗(=65536)に分割します。
24bit音源なら2の24乗に分割します。
では、ここで0.0dBを超える音声データが入力されたとすれば、それはどのように処理されるでしょうか。
結果として0.0dBを超えた分の音声データが失われることになります。
失われたデータは音源の歪みとなり、適切に処理されていない歪みはノイズになります。
なので、すっぱりと0.0dBに統一されないように、2mixの段階ではマスタリングのために多くのヘッドルーム(0.0dBから比べてどれだけ小さいか)を残します。(だいたい-6.0dB)
そして、マスタリング時は歪みが生まれないように音圧をあげます。
じゃあマスタリング時は0.0dBまでせめて音圧を上げるべきでは?
wave形式はファイルサイズが大きいので、ストリーミングサービスや動画コンテナ内の音声データとしては適していません。
そのため、mp3やm4aなどに変換されます。
この変換は非可逆圧縮であり、音声データの情報量が削減されます。
0.0dBというのピークはコンピュータ上で処理される場合の理論値です。
これを波形に直すときには、その点を通る線を使います。
そのため、サンプルとサンプルの間では、そのサンプルの音圧を超える音声波形が作られる場合があるのです。
これによって作られるピークをTruePeakと呼び、mp3への変換などではピーク値に影響します。
wav
同じ音源のmp3
どうすればいいか
まず一つ目ですが、TruePeakは高音域が影響して発生しやすいです。
適切なディザリング処理を行うことを心掛けてください。
また、TruePeakリミッターを利用することでTruePeakを制御することが出来ます。
これらの方法が使えない場合は、諦めてください。
実質、一般的な歪みによって発生したノイズに気付ける人は、よほど耳の肥えた人だけです。
それと、ただ単純にアウトシーリングを下げることも重要です。
人にもよると思いますが、私は-0.5dBに設定しています。
-0.1dBと、かなり攻めている人もいるのでどの程度に設定するかはかなり意見が分かれるところだと思います。