<目次>
- はじめに
- AIをつくる /前菜
- まとめ /メインディッシュ
はじめに
こんにちは、足立と申します。ABEJAのAdventCalendarを初めて書きます!
プログラミングはできませんが、ルールは無いらしいので、好きなことを書きます。
最近は、ジムと英会話に通っておりますが、毎日が一向にキラキラしてきません。
そんな やるせない想いを抱き枕に、寝付けない夜を過ごしていると、とある感情が芽生えました。
[きっかけ] AIに負けたくない!
みなさんは、「AIに負けたくない!」と思うことはありますか?
僕は、あります。
しかし、かなり"手強い相手"だと言うことは、わかっています。
相手の弱点を突くことの重要性を、ポケモンを始めた6歳から知っている僕は、
AIが苦手らしい「クリエイティブ領域」で勝負を仕掛けることにしました。
[勝負テーマ] AIは、「みつをの詩」と「僕の詩」を見分けられるのか?
■ 勝負内容
・日本を代表する詩人の「みつをさんの詩」と、「僕が似せてつくった詩」を、
AIが見分けられるのか勝負を仕掛けます。 ※以下、敬称略とさせて頂きます
■ 判定方法
・「僕の詩」に対して、AIが「みつをの詩」であると50%以上の正確度で判定した場合は、
僕の勝ちということにします。
【AIモデル作成】 まず、AIに「みつをの詩」を覚えさせる
では、さっそく、AIに「みつをの詩」を覚えさせていきます。
プログラミングが出来ないため、ABEJA Platformのテンプレート機能※を使っていきます。
※ABEJA Platformにある、誰でも簡単にAIモデルが作成できる機能です
[1] さくっと「みつをの詩」の画像を集める
・pythonライブラリのicrawlerを使い、画像データを集めます。
→ノイズを除いたところ「200枚」ほどの画像が集まりました。
[2] ABEJA Platformにデータを移動
・データの置き場所を作って、
・データをドラッグ&ドロップするだけ。
[3] ABEJA Platform上で、そのままアノテーション
・アノテーションの種類を選びます。
・「Object Detection」でアノテーションをすることにしました。
・200枚程度なので、X JAPANのArt Of Lifeを一曲聞く内に、さくさく終わっちゃいました。
[4] 学習する
・ABEJA Platformの中から、「Object Detection」のテンプレートを選び、
先ほどアノテーションしたデータを選ぶだけで、学習が始まります。あら便利。
・必要であれば、ハイパーパラメータも簡単に調整できます。
・無事、できあがったみたいです。
[5] 推論APIを生成する
・そのままの勢いで操作を進めると、簡単に推論APIがつくれます。(語彙力)
[6] いざ判定
【1作目】まずは、こちらの処女作から。
・結果はいかに
・なんと、「97.7%」の正確度が出ました。ビギナーズラックというべきところでしょうか。
【2作目】 調子に乗って2作目にいきます。
・これも、良い筋いくのではないでしょうか。
・おっと、これは「99%」の正確度が出ました。令和のみつをと言えるのではないでしょうか。
【3作目】 最後は100%を目指して、3作目にいきます。
・3作目にもなると、筆が走ってくるようになりました。果たして結果は・・・?
・これは「97.9%」。 ラストにしては、微妙な結果になってしまいました。
[まとめ] 今回の記事で伝えたかったこと
・ 上記の様なAIの使い方では、いつまで経っても日本が「AI後進国」から抜け出せないということです。
→ 順番に、間違いを探していきましょう。
1. データ量が不十分
・AIの精度を決める重要な要素に、「データ量」があります。しかし、今回用意したのは「200枚」
その200枚の画像の中身を見てみると、作品が重複しまくっているため、
実質的には10〜15種類ぐらいの詩しか学習できていません。
→学習用データとテスト用のデータがほぼ一緒になりうるため、
そもそもの「精度の高さ」が嘘じゃないか問題にもなります。
2. AIのモデルが不適切
・「みつをの詩」を学習するにあたって、「Object Detection」が最適でしょうか。
「Text Classification」などの方が良いのでは無いでしょうか?
・これはデータのアノテーション段階から依存するため、
もしやり直すとすると、ものすごい工数がかかってしまいます。
→実際のプロジェクトの担当者であったならば、冷や汗かくところです
3. 100%の精度を目指す
・上記のチャレンジでは、3回目には「100%の精度を目指す」なんぞ、言い始めてたりします。
そもそもAIは、学習して、どんどん精度をあげていくものです。
100%の精度を待っていたら、いつまで経っても実利用ができません。
・そもそも 「AI導入前のプロセスよりも高い精度であれば良いのではないか?」、
たとえ 「精度が100%でなくても、最終チェックだけ人が行えばよいのではないか?」、
など、あくまで一例ですが、AIの活用方法も検討しなければ、いつまで経ってもAIは活用できません。
4.目的が不明瞭
・そもそも、「AIに勝ちたい」という目的がよくわかりません。
本質的な目的は何なのか、何がしたいのか、目的の設定が重要です。
#### まだまだツッコミ所満載ですが、残りの間違い探しは皆さまにお任せします><
最後に
・みつをさんの詩を200枚アノテーションするときに、
改めて みつをさんの詩の素晴らしさに心を打たれました。
・非常に前向きな姿勢で、毎日を過ごすことができるようになりました。
・今年も無事、年が越せそうです。