LoginSignup
18
2

More than 3 years have passed since last update.

AIは「みつをの詩」と「僕の詩」を見分けるか?

Last updated at Posted at 2019-12-18

<目次>
1. はじめに
2. AIをつくる /前菜
3. まとめ   /メインディッシュ

はじめに

こんにちは、足立と申します。ABEJAのAdventCalendarを初めて書きます!
プログラミングはできませんが、ルールは無いらしいので、好きなことを書きます。

最近は、ジムと英会話に通っておりますが、毎日が一向にキラキラしてきません。
そんな やるせない想いを抱き枕に、寝付けない夜を過ごしていると、とある感情が芽生えました。

[きっかけ] AIに負けたくない!

みなさんは、「AIに負けたくない!」と思うことはありますか?
僕は、あります。
しかし、かなり"手強い相手"だと言うことは、わかっています。
相手の弱点を突くことの重要性を、ポケモンを始めた6歳から知っている僕は、
AIが苦手らしい「クリエイティブ領域」で勝負を仕掛けることにしました。

[勝負テーマ] AIは、「みつをの詩」と「僕の詩」を見分けられるのか?

■ 勝負内容
・日本を代表する詩人の「みつをさんの詩」と、「僕が似せてつくった詩」を、
 AIが見分けられるのか勝負を仕掛けます。 ※以下、敬称略とさせて頂きます
■ 判定方法
・「僕の詩」に対して、AIが「みつをの詩」であると50%以上の正確度で判定した場合は、
 僕の勝ちということにします。

【AIモデル作成】 まず、AIに「みつをの詩」を覚えさせる

では、さっそく、AIに「みつをの詩」を覚えさせていきます。
プログラミングが出来ないため、ABEJA Platformのテンプレート機能※を使っていきます。
 ※ABEJA Platformにある、誰でも簡単にAIモデルが作成できる機能です

[1] さくっと「みつをの詩」の画像を集める

・pythonライブラリのicrawlerを使い、画像データを集めます。
 →ノイズを除いたところ「200枚」ほどの画像が集まりました。
スクリーンショット 2019-12-18 22.07.21.png

[2] ABEJA Platformにデータを移動

・データの置き場所を作って、

・データをドラッグ&ドロップするだけ。

[3] ABEJA Platform上で、そのままアノテーション

・アノテーションの種類を選びます。

・「Object Detection」でアノテーションをすることにしました。
・200枚程度なので、X JAPANのArt Of Lifeを一曲聞く内に、さくさく終わっちゃいました。
b5.png

[4] 学習する

・ABEJA Platformの中から、「Object Detection」のテンプレートを選び、
 先ほどアノテーションしたデータを選ぶだけで、学習が始まります。あら便利。
b6.png
・必要であれば、ハイパーパラメータも簡単に調整できます。
b9.png
b10.png
・無事、できあがったみたいです。
b10.png

[5] 推論APIを生成する

・そのままの勢いで操作を進めると、簡単に推論APIがつくれます。(語彙力)
b10.png

[6] いざ判定

【1作目】まずは、こちらの処女作から。
b10.png
・結果はいかに
b10.png
・なんと、「97.7%」の正確度が出ました。ビギナーズラックというべきところでしょうか。

【2作目】 調子に乗って2作目にいきます。
b10.png
・これも、良い筋いくのではないでしょうか。
b10.png
・おっと、これは「99%」の正確度が出ました。令和のみつをと言えるのではないでしょうか。

【3作目】 最後は100%を目指して、3作目にいきます。
b10.png
・3作目にもなると、筆が走ってくるようになりました。果たして結果は・・・?
b10.png
・これは「97.9%」。 ラストにしては、微妙な結果になってしまいました。

[まとめ] 今回の記事で伝えたかったこと

上記の様なAIの使い方では、いつまで経っても日本が「AI後進国」から抜け出せないということです。

 → 順番に、間違いを探していきましょう。

1. データ量が不十分

・AIの精度を決める重要な要素に、「データ量」があります。しかし、今回用意したのは「200枚」
 その200枚の画像の中身を見てみると、作品が重複しまくっているため、
 実質的には10〜15種類ぐらいの詩しか学習できていません。
 →学習用データとテスト用のデータがほぼ一緒になりうるため、
 そもそもの「精度の高さ」が嘘じゃないか問題にもなります。

2. AIのモデルが不適切

・「みつをの詩」を学習するにあたって、「Object Detection」が最適でしょうか。
 「Text Classification」などの方が良いのでは無いでしょうか?
・これはデータのアノテーション段階から依存するため、
 もしやり直すとすると、ものすごい工数がかかってしまいます。
 →実際のプロジェクトの担当者であったならば、冷や汗かくところです

3. 100%の精度を目指す

・上記のチャレンジでは、3回目には「100%の精度を目指す」なんぞ、言い始めてたりします。
 そもそもAIは、学習して、どんどん精度をあげていくものです。
 100%の精度を待っていたら、いつまで経っても実利用ができません。
・そもそも 「AI導入前のプロセスよりも高い精度であれば良いのではないか?」、
 たとえ 「精度が100%でなくても、最終チェックだけ人が行えばよいのではないか?」、
 など、あくまで一例ですが、AIの活用方法も検討しなければ、いつまで経ってもAIは活用できません。

4.目的が不明瞭

・そもそも、「AIに勝ちたい」という目的がよくわかりません。
 本質的な目的は何なのか、何がしたいのか、目的の設定が重要です。

  まだまだツッコミ所満載ですが、残りの間違い探しは皆さまにお任せします><

最後に

・みつをさんの詩を200枚アノテーションするときに、
 改めて みつをさんの詩の素晴らしさに心を打たれました。
・非常に前向きな姿勢で、毎日を過ごすことができるようになりました。
・今年も無事、年が越せそうです。

18
2
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
18
2