0
0

More than 3 years have passed since last update.

DeepRunning ~Level4.3.2~

Last updated at Posted at 2020-07-27

Level4.機械学習講座(理論と実践)

4-3.ロジスティック回帰モデル

4-3-10.ハンズオン

まずはdriveとマウントする。
ロジスティック回帰0001.png

おまじないの%matplotlib inlineはgoogle colabでグラフ表示をしてくれる。
知っていると便利ですね。

続いて、CSVファイルの読み込み。
driveを参照するようにしています。データセットも確認できました。

ロジスティック回帰0002.png

不要なデータの削除・欠損値の補完
ロジスティック回帰0003.png

nullを含む行の確認と補完
ロジスティック回帰0004.png
ロジスティック回帰0005.png

年齢を中央値で補完しますが、最終的に影響しないだろうか?

チケット価格から生死を判別する。
ロジスティック回帰0006.png

※大事なのは簡単にfitさせられるが、
 バックエンドでどのような計算をしているか理解をしておくこと。

動画にもあったように、61⇒62で生死が変わることも確認してみた。
ロジスティック回帰0007.png
ロジスティック回帰0008.png

ちゃんとグラフも出ています。

続いて、2変数から生死を判別する。
性別からGenderを作り、その後、Pclass_Genderを生成する。
ロジスティック回帰0009.png
ロジスティック回帰0010.png

ここで、境界線の式やプロットのやり方が載ってました。
全体が終わったら試してみます。
ロジスティック回帰0011(重要だよ).png

2変数から生死を判別します。
クラスが高く、女性の方が生き残れる・・・。
その仮定を考えるのがセンスなのかな。
ロジスティック回帰0012.png
ロジスティック回帰0013.png
ロジスティック回帰0014.png
ロジスティック回帰0015.png
ロジスティック回帰0016.png

うん。ちゃんと出力できました。

ここまででハンズオンは良いと動画で言っていましたが、
一通り動かして確認してみました。

ロジスティック回帰0017.png
ロジスティック回帰0018.png
ロジスティック回帰0019.png
ロジスティック回帰0020.png
ロジスティック回帰0021.png
ロジスティック回帰0022.png

ワーニングが出たので確認したところ、size⇒heightにせよ!とのことで、
修正して流しなおしています。
ロジスティック回帰0023.png
ロジスティック回帰0024.png
ロジスティック回帰0025.png
ロジスティック回帰0026.png

こちらも確認できました。

4-3-11.考察

•ロジスティック回帰にしても、バックエンドでの動作はイメージできるようにしておく必要がある。
 実際に運用することになった時に、パラメータの更新までの動作(計算方法)を理解していないと、
 とてもじゃないけど対応できないだろう思います。
・途中でも書きましたが、どの項目を使って検証するのか、
 選定についてはその筋の専門家の意見を参考にするとのお話もありましたが、
 キラリと光る感覚は養っておく必要があると思いました。あとは、実際に検証してみればよい。
・まったく同じPclass_Genderに属する人でも年齢によって生死が分かれているのは、
 他の変数を追加して掘り下げることになりますが、どこまでやるのかは良い塩梅を意識したいです。

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0