こんにちは!
前回はPythonエンジニアデータ分析試験の模試を受験してみました!!!
結果は前回の記事をご覧ください。
→前回の記事はこちら
今回はPython模擬試験を受けてみました!
結果は、、、
34点/40点満点
安定して8割5分出せているので嬉しいです!
いよいよ今日が本番なので頑張りたいと思います。
今回も直しを備忘録として残します。
模試の直し
不偏分散
とはすべてのデータについて平均値との差分の2条を計算しデータの個数-1で割ったもの
dateframeの曜日の引数
B:月~金
W:日~土
白色化
すべての特徴量を0、共分散行列を単位行列とする処理
標準化
特徴量1つ1つについて、分散0、標準偏差1になるように処理
主成分分析
・データの共分散行列の固有値を計算し、、大きい固有値に対応する固有ベクトルが主成分として選択される
・データを標準化して主成分分析を実行する場合、主成分は相関行列の固有ベクトルとして得られる。
モデル評価指標
precision_score関数で適合率
F値は回帰モデルを評価するためではなく、適合率と再現率のバランスを評価する。
再現率は、陽性データのうち、実際に陽性に分類できた割合
適合率は、陽性に分類したデータのうち、実際に陽性だった割合
15フォールドクロスバリデーション
15分割交差検証
データセットを15分割し、モデルテスト複数回行い、テスト結果の平均を汎化誤差とする
テストデータと学習データのデフォルト
学習:75
テスト:25
多クラス分類問題
ラベルが3つ以上あるデータを分類する問題。
ソフトマックス関数