本記事について
本記事は経験ゼロから始めるAI開発で紹介したイラスト評価AIのスピンオフアプリである、プロのイラストを判別するAIひよこの開発経緯についてまとめた記事です。
何を作ったのか
入力されたイラストが「プロによって描かれたものかそうでないか」を機械学習を用いて判別するアプリを作りました。
手持ちのイラスト画像をドラッグ&ドロップするか、画面上のサンプルイラストを選択することで判別を試すことができます。
なぜ作ったのか
経験ゼロから始めるAI開発でも書いた通り、当社では人間とは別の視点(AI)によるイラスト画像の評価を取り入れることで、業務の効率化やトラブル防止に役立てる、といった目的で研究プロジェクトを進めています。
また、当社のメインプロダクトの一つにイラスト受託制作事業があります。本事業のプロモーション、販売拡大も当社の重要なミッションです。
本アプリは研究プロジェクトの過程で作られた「プロが描いたイラストを判別する」モデルを搭載したWebアプリを使って、新しい試みのアピールを行うと同時に、当社本業であるイラスト制作の訴求も行うことを目的に作られました。
なぜ「ひよこ」なのか
このアプリでは入力された画像について「プロの作品か否か」という、人によってはかなりセンシティブな結論を出します。
勉強中で自信無さげな“ひよっこ”イラストレーターというストーリーとデザインにすることで、コンピューターが出した無機質な結論を少しでも緩和しようと考えました。事実、使用している判別モデルはまだまだ勉強中の”ひよっこ”で、今後まだまだ再学習が必要です。
機械学習を用いたプロダクトは典型的なWebシステムとは違い、100%の精度で結論を出すことが難しく、それ故に生じる問題も少なくありませんが、上記のようにストーリー、キャラクター、デザインなどを工夫することで是正できる可能性も十分あると考えます。
企画経緯
当社本業のイラスト制作の拡販が目下の急務。既存顧客以外にもアプローチしたい
→ これまでは自社商品の「良さ」をアピールする営業活動を行ってきた
→ しかし、一方的にアピールするだけではプロが描くイラストの良さは伝わりにくい
→ なぜならほとんどの人が普段プロの描くイラストを意識することなどないから=当事者ではないから
→ 当事者としてプロのイラストを体験してもらうことはできないか
→ そういえば、先日開発したイラスト評価AIについて書いた記事や取り上げていただいた記事はいずれも大きな反響を得た
→ イラスト評価AIを使ってみたいという声も多数いただいた
→ AI・機械学習を使ってプロのイラストを体験してもらうことはできないか
→ 「プロのイラストを判別する」というWebアプリを公開してみたらどうか
開発
要件
- プロのイラストの良さを伝える
- AI・機械学習によるイラスト評価という新しい試みを伝える
- 「プロのイラストとは何か?」を体験することができる
開発環境
Webアプリフレームワークに「Django 2.0.1」、機械学習ライブラリは「Keras 2.1.4」を使用しました。
WebサーバーはAWS EC2を使用しています。
小規模なアプリであるためフットワーク軽く開発を進めたかったので、PythonのWebアプリフレームワークであるDjangoを採用しました。
デザインイメージ
前述したように、「ひよこ」のキャラクターを使って、柔らかい雰囲気を作り出す必要がありました。
また、キャラクターにアニメーションをつけることで、頑張って評価をしているひよこの性格を演出しました。
ちなみにキャラクターの候補はひよこ以外に、ナマケモノ、ねこなどがありました。
サイト全体のデザインもキャラクターのイメージに合わせて、硬くなりすぎないように仕上げてあります。
機能
手持ちのイラストを気軽に試すことができるように、画像をドラッグ&ドロップすることで評価ができる仕組みとしました。
また、イラストが手元にない方のために、複数のサンプルイラストを用意し、こちらをクリックすることでも同様にイラストの評価ができるようにしました。
判別モデル
プロによって描かれたイラストとそうでないイラストをそれぞれ約1000枚ずつ学習用素材として用意し、Fine-tuningによる画像分類を行いました。使用したモデルはVGG19です。
学習の結果ですが、Validation Accuracyは0.90前後で上げ止まり、Validation Lossは0.28前後で下げ止まった結果となりました。前処理の方法をいくつか試してもみても結果は大きく変わらず、おそらくこれ以上精度を上げるためにはさらに多くの学習用素材を用意する必要があると思われます。
イラスト画像は写真と異なり準備することがとても困難な素材です。また、プロによって描かれたものか否かのタグ付け、いわゆるアノテーションの作業も誰でもできるものではありません。1000枚という素材数は、ディープラーニングを行う上で決して十分な数ではないので、これら学習用素材をどのように増やしていくかは今後の課題の一つです。
次にやること
- 教師データの拡充→モデルの精度向上
- アプリのプロモーション
- その他試み
- イラストなどクリエイティブコンテンツについて、これまで定性的に判断していたことを定量的に評価できないかという試みは今後も続けていきたい