111
Help us understand the problem. What are the problem?

More than 3 years have passed since last update.

posted at

updated at

Organization

kaggleのkernelから学ぶこんな可視化備忘録

自分が分析レポートを作るときに、機械学習や統計の知識がない人にもわかりやすいレポートを心がけるの備忘録。

A Data Science Framework: To Achieve 99% Accuracy

常に分析を始める前にdescribe()で綺麗にきちんとデータの情報を把握してから分析するようにしたい
Screen Shot 2019-04-10 at 21.59.12.png

カテゴリカルな変数と目的変数もきちんと相関出してる。真似したい!
Screen Shot 2019-04-10 at 22.04.22.png

このカーネル、とにかく可視化が綺麗!コードは引用元見てください!
カテゴリカルな説明変数と目的変数のヒストグラムと、連続値の箱ひげ図。箱ひげ図はこれよりもseaborn使った方が綺麗かもしれない。
Screen Shot 2019-04-10 at 22.05.21.png
同じ説明変数でも、分類ごとに目的変数との関係の棒グラフや折れ線グラフ
Screen Shot 2019-04-10 at 22.05.32.png
説明変数同士で分析しても面白いですね。真ん中のカテゴリカルな変数VS連続値の変数のグラフめちゃ綺麗
Screen Shot 2019-04-10 at 22.05.41.png
Screen Shot 2019-04-10 at 22.08.59.png
3つの要素をこんな風に盛り込むのも面白い
Screen Shot 2019-04-10 at 22.09.16.png

連続値VS連続値でも綺麗だなー
Screen Shot 2019-04-10 at 22.09.48.png

これもわかりやすい
Screen Shot 2019-04-10 at 22.10.45.png
こんなにたくさんモデル試したことないけど、こんな風にしたら面白い。
Screen Shot 2019-04-10 at 22.11.23.png

TP/TN/FP/FNがきちんとわかる
Screen Shot 2019-04-10 at 22.12.41.png

本当に綺麗な可視化だな〜こんなレポート作りたい

Comprehensive data exploration with Python

Screen Shot 2019-04-10 at 22.18.11.png
skewnessとkurtosisもきちんと求めて正規分布なのか見極めたい

等間隔の時系列データがある場合はこれやったら面白いな〜 あとシンプルにめちゃ綺麗
Screen Shot 2019-04-10 at 22.19.29.png

このカーネルで、データを扱うときの注意点が書いてあって、正規分布かをきちんと見るときは、skewnessとかを見る他に
Screen Shot 2019-04-10 at 22.22.16.png
こんな風に正規分布とfitして可視化するオプションがあるらしい
他にprobability plotできちんと沿っているか確認したりする
Screen Shot 2019-04-10 at 22.22.56.png
一番目のタイタニックの可視化だと、目的変数のsurvivedだけがプロットしてあったけど、これみたいにnon survivedもプロットしても面白いかも

Screen Shot 2019-04-10 at 22.27.48.png

Python Data Visualizations

説明変数を縦横軸にして、カテゴリカルな目的変数をこんな風にプロットする
Screen Shot 2019-04-10 at 22.28.53.png

特徴量を2次元にプロっトしたやつらしい、tSNEとかPCAと似たやつなのかな?
Screen Shot 2019-04-10 at 22.30.00.png

Head Start for Data Scientist

これめちゃめちゃかっこいいやばい
Screen Shot 2019-04-10 at 22.34.00.png

この木の可視化綺麗だなー
Screen Shot 2019-04-10 at 22.34.25.png

Exploration of data step by step

Screen Shot 2019-04-10 at 22.38.41.png
これすごい、このコードだけでそれぞれの目的変数のカテゴリーごとへの説明変数のContributionとネガティブかポジティブに働いてるかが一目でわかる、絶対使いたいScreen Shot 2019-04-10 at 22.39.56.png

NYC Taxi Fare - Data Exploration

これ画像データなんだけど綺麗すぎる

Screen Shot 2019-04-10 at 22.43.22.png

これくらいですかね、data visualizationでカーネルでVote400票まで探してみて、気になったのをあげてみました。あとはこの可視化をどんな風にするかはデータサイエンティストの裁量な気がします、がんばろー

特徴量エンジニアリングでももう一つ記事作ります

Why not register and get more from Qiita?
  1. We will deliver articles that match you
    By following users and tags, you can catch up information on technical fields that you are interested in as a whole
  2. you can read useful information later efficiently
    By "stocking" the articles you like, you can search right away
Sign upLogin
111
Help us understand the problem. What are the problem?