Santurkar, S., Budden, D., & Shavit, N. (2018). Generative Compression. In 2018 Picture Coding Symposium, PCS 2018 - Proceedings (pp. 258–262). https://doi.org/10.1109/PCS.2018.8456298
1.どんなもの?
2.先行研究と比べてどこがすごいか?
JPEGより高い圧縮率と,解像度の高い復元が可能.
3.技術や手法のキモはどこにあるか?
図の上の部分がGAN.
ノイズからジェネレータが実際の画像のような画像生成するように学習し,ディスクリミネータは実際の画像かジェネレータの出力が判別できるように学習する.
Lossは一般的なGANのLoss
下の部分がエンコーダとデコーダ
エンコーダの学習は,出力をジェネレータに入力したときにエンコーダと同じ画像を出力できるように学習する.
Conv4はImageNetで学習したAlexNet
Lossは単純に入力画像と出力画像の差のL2ノルムと,特徴抽出したときのL2ノルム両方をへらす.
単純なMSEだと高周波成分が無視される傾向にある.
4.どうやって有用だと検証した?
CelebA, UT Zappos50K, MIT Placesで実験
5.議論はあるか?
6.次に読むべき論文はあるか?
画像の圧縮の論文
Deepじゃない
Rott Shaham, T., & Michaeli, T. (n.d.). Deformation Aware Image Compression. Retrieved from https://arxiv.org/pdf/1804.04593.pdf