はじめに
今回使用したGoogle Colabのリンクはこちら
皆さんは、キュビズム(Cubism)という芸術運動と、その運動の中で使用された絵画の表現手法を知っているでしょうか?
キュビズムとはWikipediaによると、
キュビズム(仏: Cubisme; 英: Cubism「キュビズム、キュービズム」、立体派)は、20世紀初頭にパブロ・ピカソとジョルジュ・ブラックによって創始され、多くの追随者を生んだ現代美術の大きな動向である。多様な角度から見た物の形を一つの画面に収めるなど、様々な視覚的実験を推し進めた。
とのことです。
キュビズムの絵画は幾何学的な模様を多く含む、特徴的な見た目をしています(図1)。
図1 ゲルニカ, パプロ・ピカソ
この記事ではみなさんが「明日までにキュビズムの画像を検知しなくちゃ!」という場面に遭遇したときに1、どうやって普通の絵画とキュビズムの絵画を識別するのか、また、キュビズムの絵画にはどのような特徴があるのかを考えていこうと思います。
実践
今回、下記のように普通の絵画とキュビズムの絵画を5枚ずつ解析に使用しました(図2)。解析を簡単にするために、前処理として画像のサイズを全て正方形に揃え、グレースケールに変更しました2。
![](https://qiita-user-contents.imgix.net/https%3A%2F%2Fqiita-image-store.s3.ap-northeast-1.amazonaws.com%2F0%2F2666665%2F7de0dd27-8cbc-0ad5-230b-354d3431f814.png?ixlib=rb-4.0.0&auto=format&gif-q=60&q=75&s=6e704cdf2c9eb98e0cb495a04a882abe)
図2 使用した絵画の画像データ(上段:普通の絵画、下段:キュビズムの絵画)
さて、画像の解析をしようとなったら、とりあえず画像をフーリエ変換して、空間周波数を見てみましょう。
空間周波数が何かについては、このサイトなどを参考にしてください。
図3が空間周波数成分の強度を可視化したものです。キュビズムの画像ではやや低周波数の強度が弱いように見えますが、人目ではそこまで顕著ではなさそうですかね。
図4は、各絵画の平均パワースペクトラムを可視化したものです。こちらは少し特徴的で、下段のキュビズムの絵画のほうが中心から離れた領域(高周波数領域)でも明るく、輪郭や端が多く含まれていることが推測できます。
![](https://qiita-user-contents.imgix.net/https%3A%2F%2Fqiita-image-store.s3.ap-northeast-1.amazonaws.com%2F0%2F2666665%2F7135ee3d-6e75-dfe2-0be6-8171fc9513b5.png?ixlib=rb-4.0.0&auto=format&gif-q=60&q=75&s=e123a2487c4c85e4288fb4be47a4aed1)
図3 各絵画の空間周波数成分の強度
![](https://qiita-user-contents.imgix.net/https%3A%2F%2Fqiita-image-store.s3.ap-northeast-1.amazonaws.com%2F0%2F2666665%2Fc1aca9f3-c426-1fe5-9073-b71aa3f1c800.png?ixlib=rb-4.0.0&auto=format&gif-q=60&q=75&s=a02b05cce27c64dcf579be617d99380e)
図4 各絵画の平均パワースペクトラム
全体の傾向を調べるために、空間周波数を低周波、中周波、高周波の3つの帯域にわけ、普通の絵画全体とキュビズム絵画全体での傾向を調べてみました(図5)。やはりキュビズム画像は中周波や高周波成分にも多少強度が出ています。これはピクセル間の急激な変化(輪郭や端)の多さが反映されているのかと思われます。一方、普通の絵画では低周波成分が幅広い強度で出ていますね。こちらは逆に、ピクセル間の滑らかな変化が多いことが反映されているのでしょう。
![](https://qiita-user-contents.imgix.net/https%3A%2F%2Fqiita-image-store.s3.ap-northeast-1.amazonaws.com%2F0%2F2666665%2F871d65cc-ce3a-6c01-ad4e-54543400e0b8.png?ixlib=rb-4.0.0&auto=format&gif-q=60&q=75&s=aa008f4cefef0cba66296d674b162801)
図5 普通の絵画とキュビズムの絵画での周波数帯域ごとの強度の分布
さて、人の目なんて対して信用できないものなので、機械学習の力を借りましょう(機械学習と聞くとCNNやTransformerなどの深層学習を思い浮かべる人も多いかもしれませんが、今回はデータをたくさん集めるのが面倒なので解釈性を高めるために古典的な手法を使います)。
空間周波数からkmeansクラスタリングを行い、その結果を2次元の主成分空間に射影した結果が図6です。
はい、機械学習でも全然誤分類起こしてますね。
![](https://qiita-user-contents.imgix.net/https%3A%2F%2Fqiita-image-store.s3.ap-northeast-1.amazonaws.com%2F0%2F2666665%2Ff46e20a9-ec67-0fd0-fb9d-2fc75bfc8f9f.png?ixlib=rb-4.0.0&auto=format&gif-q=60&q=75&s=1cf13310f7490420971a53a98f7782dc)
図6 空間周波数によるkmeasクラスタリング結果の主成分空間上での可視化
まとめ
キュビズム画像のほうが高空間周波数成分の強度が強い傾向があることがわかりましたが、案外きれいなクラスタリングはできませんでした。正直余裕で違いが出ると思っていましたが、意外と難しかったですね。
もしかしたら次回、
あー、深層学習でのキュビズム分類してぇーー
という続編を作るかもしれません3。ご覧いただきありがとうございました。