4
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 3 years have passed since last update.

機械学習の自動化プラットフォームDataRobotを使って楽しむ冬のイベント予測チャレンジ 【PR】 DataRobotAdvent Calendar 2020

Day 11

Datarobotで紅白勝利チームと天気の関係性についてモデルづくりを体験してみたら結構失敗した話。

Last updated at Posted at 2020-12-10

#注意
この予想は初心者が初心者なりに挑戦してみた結果であり、
技術的要素に間違いがある可能性があります。ご注意ください。
#はじめに
普段はteachablemachineを使って、
image.png
こんな感じのモデルを作って遊んでいるのですが、
今回は初めて使ったData robotで
紅白当日の天気から勝利チームを予想できるかというテーマでモデルを作成することに挑戦しました。
まずどうしてこのテーマにしたのか少しだけお話したいと思います。
#経緯
はじめこのAdventカレンダーを見たとき、
teachablemachineで作ってる趣味画像かどうか識別するモデルでも作って、
今年のエアコミケの作品を物色しよう!!
というのが目的で、なんとなくモデルをつくったのですがあまり成果っぽい成果が出せなかったので、(記事下部におまけとしてこいつも載せときます。)
急遽もう少し扱いやすそうなデータにして作ろうと思い、
カレンダーの説明文にあった、紅白の勝利チーム予想をやってみようと思いました。
(これが後の悲劇に繋がります)
#準備
まず今回欲しいデータは、
紅白の過去の勝利チーム
>こちらは紅白歌合戦ヒストリーよりデータ収集しました。
問題なのは気象データの方で、
気象庁の天気データは、こちらで入手しようとした結果、データが1967年でまともなデータに至っては、1989年からしかありませんでした。
ということでここまでのデータをもとに作れる範囲でデータを作りました。
image.png
データ総数が50ちょっとしかなく動くのか不安ですが、とりあえず実行してみることにしました。
#実行編1
詳しい手順はきっと他の日の方がしっかり説明してくださってるはずなので、詳細はそちらの方を見ていただくとして、まず手順をざっくりと見ていきましょう
1.データを入れる
image.png
D&Dで十分です。
2.ターゲットを決める
image.png
はい。ここでつまずきました。
ターゲットに何故か知らないけどできません。
image.png
もう一度行ってみてもだめ。
ターゲットを変えてもだめ。
画像のときは動いたのにだめ。
まあ薄々感づいていたので、データ総数を紅白の回数である70個にして、
気象データを降水量データから判断することにしました。
その結果、だめでした
image.png
#結論
紅白は過去のデータだけじゃ予想できない。
あと30年ぐらい待たないと無理。
#そんなわけにも行かないので禁じ手使います。
うーん。試しに全く同じデータを倍にしてみるか。
image.png
コピペして倍にしてみました。
するとどうでしょう。
image.png
動くではないですか。
データ数大事ですね。
(teachablemachineのときはほとんどなくても動いたから盲点とも言える)
image.png
image.png
ではこれを使っていきましょう。
#実行編2
これを実行します。
image.png
モデルの詳細から予測を押して、こんな感じのExcelファイルをD&Dします。
image.png
あとは予測を計算して、結果をダウンロードすると、
image.png
0と1はよくわからないけど、多分、0が紅、1が白だと思います。
といった感じで、今年の紅白は、過去を2倍にした状態だと、2/3の確率で紅が勝つそうです。
(雪は過去の記録でなかったようなので対象には入れてません)

#まとめ
初心者(特にこの分野に全く理解のない人)にはちょっと厳しいのではないかと思いました。
でも、基礎を少しでも知っていれば、かなーりかんたんに複数のモデルを作成、実行でき、
かなりの時間短縮もできるのではないかと思います。
みなさんもはじめの一歩踏み出してみてはいかがでしょうか。

#おまけ(ボツ案)
#A
今回はうまく使えば、相手の趣味もわかっちゃう!?超お手軽好みのイラストかどうか判断してくれるモデルをサクッと作っていきます。

準備するもの
たくさんのイラスト(好き嫌いに分ける)
ファイル名と好き嫌いの書いてあるCSV
image.png
まずは新しいプロジェクトを用意して本編同様D&Dします。
このとき画像とCSVはZIPしてください。

あとはかんたんターゲットをstateにして開始を押して出来上がるのを待つだけ。

結果
image.png

分布
image.png
好きと嫌いが混ざってるところが多く結果はイマイチになりそう。
(これがネタを変えた原因)
別の画像セットを用意しまして、予想を押すと、
image.png

半々くらいで好き嫌いを混ぜたはずなのに、嫌いむっちゃ多くないですか。
多分画風によっても変わってくるんだなぁと思いました。

結論
まだ機械学習では、本当に好きな画像は見極められない。

#B
本物のみかんと鏡餅の上にあるみかんのような偽みかんを区別したい。

準備するもの
みかんと偽みかんの画像たくさん。
今回はGoogle画像検索を利用して200枚ずつ収集

結果
image.png

結果
あの、ぱっと見た感じはみかんのモデルのほうが正確そうに見えるのに、予想結果がこちら
image.png

みんなみかんなんですが。
上5行は去年の上に乗ってたニセみかんを撮った画像を入れて、
下五行にはみかんの画像を入れました。
結果はみんなみかん。
どうしてこうなった。
画像分布
image.png
ほとんどみかんと同じところにニセみかんもある。
あとなぜスカイツリー?まあみかんではないけど。

結論
みかんとニセみかんの識別は無理そう

4
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
4
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?