はじめに
かつて筆者は大量に「自炊」を行っていた。「自炊」といってもドキュメントスキャナを使って所有する雑誌や書籍をデジタルデータに変換するほうだ。その際,JPEG 画像のブロックノイズを嫌い,可逆圧縮の PNG 形式を愛用していた。
近年 Google 製の WebP フォーマットが徐々に普及している印象であり,WebP フォーマットは可逆圧縮(lossless)モードもサポートしていることから,これを評価してみたい。
WebPユーティリティのインストール
WebP のダウンロードリポジトリ よりダウンロードする。Windows 向けにはコンパイル済みのバイナリが用意されている。64bit 版のバイナリしか置いていないので,32bit 版が必要な人は自分でビルドする必要がある。なお,画像ファイルの入出力に WIC(Windows Image Component)を使用するか否かによってバイナリが分かれているが,WIC を使用するほうで良いと思う。
- libwebp-1.4.0-windows-x64.zip(WIC を使用する)
- libwebp-1.4.0-windows-x64-no-wic.zip(WIC を使用しない)
cwebp のオプションについて
WebP 形式の画像ファイルを生成するツールとしては cwebp という実装サンプルが提供されており,これがとても高機能なので大抵の人にとってはこのツールで十分だろう。このうち可逆圧縮モードに関するオプションを以下に示す。
- -lossless
- 可逆圧縮を行う際には必須である。
- -m [整数]
- 圧縮方法 method を選択する。0~6 の整数を与える。小さい値は高速,大きい値は高圧縮になる。デフォルトは 4 である。
- -q [実数]
- 圧縮品質 quality を選択する。0~100 の実数を与える。小さい値は高速,大きい値は高圧縮になる。デフォルトは 75 である。
- -z [整数]
- 可逆圧縮モードのプリセットを選択する。0~9 の整数を与える。小さい値は高速,大きい値は高圧縮になる。デフォルトは 6 である。なお,オプション -m または -q を使用するとオプション -z の指定は無効になる。詳しくは表1参照のこと。
- -mt
- 可能な限り,マルチスレッドを使用する。
- -preset [文字列]
- 圧縮パラメータのプリセットを選択する。文字列には default, photo, picture, drawing, icon, text が入る。ソースコードを読む限り,可逆圧縮モードでは無効のようだ。
- -hint [文字列]
- 入力画像のヒントを与える。文字列には photo, picture, graph のいずれかが入る。ソースコードを読む限り,最初にバッファを確保する大きさをヒントに応じて変えている程度であり,ほぼ動作に影響を及ぼさないと考えられる。
ソースコードを読む限り,オプション -z とオプション -m および -q の関係は以下のようになっている。すなわち,圧縮パラメータは事実上オプション -z だけの一つを調整すれば済むようになっている。デフォルト値を赤色で示す。
ソースコードは src\enc\config_enc.c
を参照した。
表1 可逆圧縮モードのプリセット表 | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|
-z | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
-m | 0 | 1 | 2 | 3 | 3 | 4 | 4 | 4 | 5 | 6 |
-q | 0 | 20 | 25 | 30 | 50 | 50 | 75 | 90 | 90 | 100 |
サンプル画像
ゆうきまさみ原作「新九郎、奔る!」第一話(月刊スピリッツ2018年3月号掲載分)を題材にした。カラー4頁,白黒36頁を300dpiでスキャンした。ページによって大きさは微妙に異なるが,概ね 2100×3000px のサイズになる。
試し読みだと全ページ白黒だが,雑誌掲載時,冒頭の4ページはカラーだった。
実行結果
参考のため PNG とも比較する。ZLIB の圧縮レベルは最高の level=9
,ZOPFLI のパラメータは blocksplittingmax=15
および numiterations=5
とした。一方,WebP の圧縮レベルは標準の z=6
と最高の z=9
の二種類を試行した。加えてマルチスレッドオプション -mt も比較することにした。
比較結果を以下に示す。カラーは 4 個のカラー画像の平均値,白黒は 36 個の白黒画像の平均値である。PNG,ZLIB 方式を基準 100 とした相対値で示す。
PNG | WebP | ||||||
---|---|---|---|---|---|---|---|
ZLIB | ZOPFLI | z=6 | z=6,mt | z=9 | z=9,mt | ||
カラー | 圧縮率 | 100.0 | 94.6 | 87.9 | 87.9 | 87.6 | 87.6 |
計算時間 | 100.0 | 1,421.2 | 142.0 | 141.5 | 3,363.7 | 2,308.5 | |
白黒 | 圧縮率 | 100.0 | 96.4 | 92.8 | 92.8 | 92.6 | 92.6 |
計算時間 | 100.0 | 1,156.1 | 75.6 | 75.6 | 2,039.8 | 1,558.9 |
当たり前だが,オプション -mt の有無によって圧縮率は変わらない。
一方,オプション -mt を付けると計算時間は少し短縮する。ざっくり30~40%といったところか。
測定マシンは Windows10 22H2,Core i7-13700(16コア,24スレッド)メモリ32GB である。
まとめ
google 謹製の cwebp の可逆圧縮モードを評価した。
- 可逆圧縮モードにおける圧縮オプションはいろいろ用意されてはいるが,オプション -z の一つだけで調整できる。逆に調整要素は一つしかないと考えても良い。プリセットやヒント情報は少なくとも可逆圧縮モードでは無効に等しい。
- WebP 形式およびその実装サンプルである cwebp は素晴らしい。標準の圧縮レベルでも ZLIB と同等のスピードながら,圧縮率は ZOPFLI をはるかに上回るからだ。
- 一方,圧縮レベルを最高にしても,膨大に増える計算時間に対して圧縮率の向上は非常に僅かであった。パラメータのデフォルト値の設定が絶妙とも言える。
- マルチスレッドオプション -mt を指定しても,目を見張るような高速化が行われなかったのは残念である。16コア,24スレッド使用可能なプロセッサを用いても最大 1.6 倍程度であった。ただし,これは致命的な弱点ではない。画像ファイルは多数あるので,画像ファイル毎の並列処理が可能だからだ。
おまけ
現在,ゆうきまさみ氏の「新九郎、奔る!」は連載を週刊スピリッツ誌に移している。月刊スピリッツ誌はその辺のコンビニに置いておらず県内一の大型書店に出かけて購入していたが,週刊誌に移動してくれたおかげで入手が楽になった。ただし,紙質および印字品質は月刊誌のほうが格段に良かったと思う。
なお,2023年における日本の書店数は約1万1000店舗,コンビニエンスストアは約5万7000店舗,合わせて約7万店舗なので,どこのコンビニでも数冊置いている雑誌の発行部数は少なくとも10万部以上となるはずだ。だが,昨今は週刊スピリッツですらどこのコンビニでも置いている状況ではなくなった。