#Level4.機械学習講座(理論と実践)
##4-3.ロジスティック回帰モデル
###4-3-10.ハンズオン
おまじないの%matplotlib inlineはgoogle colabでグラフ表示をしてくれる。
知っていると便利ですね。
続いて、CSVファイルの読み込み。
driveを参照するようにしています。データセットも確認できました。
年齢を中央値で補完しますが、最終的に影響しないだろうか?
※大事なのは簡単にfitさせられるが、
バックエンドでどのような計算をしているか理解をしておくこと。
動画にもあったように、61⇒62で生死が変わることも確認してみた。
ちゃんとグラフも出ています。
続いて、2変数から生死を判別する。
性別からGenderを作り、その後、Pclass_Genderを生成する。
ここで、境界線の式やプロットのやり方が載ってました。
全体が終わったら試してみます。
2変数から生死を判別します。
クラスが高く、女性の方が生き残れる・・・。
その仮定を考えるのがセンスなのかな。
うん。ちゃんと出力できました。
ここまででハンズオンは良いと動画で言っていましたが、
一通り動かして確認してみました。
ワーニングが出たので確認したところ、size⇒heightにせよ!とのことで、
修正して流しなおしています。
こちらも確認できました。
###4-3-11.考察
•ロジスティック回帰にしても、バックエンドでの動作はイメージできるようにしておく必要がある。
実際に運用することになった時に、パラメータの更新までの動作(計算方法)を理解していないと、
とてもじゃないけど対応できないだろう思います。
・途中でも書きましたが、どの項目を使って検証するのか、
選定についてはその筋の専門家の意見を参考にするとのお話もありましたが、
キラリと光る感覚は養っておく必要があると思いました。あとは、実際に検証してみればよい。
・まったく同じPclass_Genderに属する人でも年齢によって生死が分かれているのは、
他の変数を追加して掘り下げることになりますが、どこまでやるのかは良い塩梅を意識したいです。