Datarobotで紅白勝利チームと天気の関係性についてモデルづくりを体験してみたら結構失敗した話。

Last updated at 2020-12-10Posted at 2020-12-10

注意

この予想は初心者が初心者なりに挑戦してみた結果であり、
技術的要素に間違いがある可能性があります。ご注意ください。

はじめに

普段はteachablemachineを使って、

こんな感じのモデルを作って遊んでいるのですが、
今回は初めて使ったData　robotで
紅白当日の天気から勝利チームを予想できるかというテーマでモデルを作成することに挑戦しました。
まずどうしてこのテーマにしたのか少しだけお話したいと思います。

経緯

はじめこのAdventカレンダーを見たとき、
teachablemachineで作ってる趣味画像かどうか識別するモデルでも作って、
今年のエアコミケの作品を物色しよう！！
というのが目的で、なんとなくモデルをつくったのですがあまり成果っぽい成果が出せなかったので、（記事下部におまけとしてこいつも載せときます。）
急遽もう少し扱いやすそうなデータにして作ろうと思い、
カレンダーの説明文にあった、紅白の勝利チーム予想をやってみようと思いました。
（これが後の悲劇に繋がります）

準備

まず今回欲しいデータは、
紅白の過去の勝利チーム
＞こちらは紅白歌合戦ヒストリーよりデータ収集しました。
問題なのは気象データの方で、
気象庁の天気データは、こちらで入手しようとした結果、データが1967年でまともなデータに至っては、1989年からしかありませんでした。
ということでここまでのデータをもとに作れる範囲でデータを作りました。

データ総数が50ちょっとしかなく動くのか不安ですが、とりあえず実行してみることにしました。

実行編1

詳しい手順はきっと他の日の方がしっかり説明してくださってるはずなので、詳細はそちらの方を見ていただくとして、まず手順をざっくりと見ていきましょう
１．データを入れる

D&Dで十分です。
2.ターゲットを決める

はい。ここでつまずきました。
ターゲットに何故か知らないけどできません。

もう一度行ってみてもだめ。
ターゲットを変えてもだめ。
画像のときは動いたのにだめ。
まあ薄々感づいていたので、データ総数を紅白の回数である70個にして、
気象データを降水量データから判断することにしました。
その結果、だめでした

結論

紅白は過去のデータだけじゃ予想できない。
あと30年ぐらい待たないと無理。

そんなわけにも行かないので禁じ手使います。

うーん。試しに全く同じデータを倍にしてみるか。

コピペして倍にしてみました。
するとどうでしょう。

動くではないですか。
データ数大事ですね。
（teachablemachineのときはほとんどなくても動いたから盲点とも言える）

ではこれを使っていきましょう。

実行編2

これを実行します。

モデルの詳細から予測を押して、こんな感じのExcelファイルをD&Dします。

あとは予測を計算して、結果をダウンロードすると、

0と1はよくわからないけど、多分、0が紅、1が白だと思います。
といった感じで、今年の紅白は、過去を2倍にした状態だと、2/3の確率で紅が勝つそうです。
（雪は過去の記録でなかったようなので対象には入れてません）