LoginSignup
1
0

More than 1 year has passed since last update.

Sweetviz Associationsの読み方

Last updated at Posted at 2022-05-19

はじめに

Sweetvizを使って乳がんのデータを可視化してみました。

sklearn.datasets.load_breast_cancer — scikit-learn 1.1.0 documentation

この記事はSweetvizのAssociationsに関するメモです。

Sweetvizとは

探索的データ解析(EDA)に使われるツールの一つです。
データセットを見やすく表示してくれます。

使い方

こんな感じで使います。

import sweetviz as sv
my_report = sv.analyze(df, 'target')
my_report.show_html()

Associationsの読み方

Associationsからは、数値相関だけでなく、不確実性係数1、相関比2を読み取ることができます。

スクリーンショット 2022-05-19 14.22.57.png

  • 四角
    • 質的変数(カテゴリー)との相関比
    • 量的変数同士の量的相関
四角 色が濃いほど、そのカテゴリーの割合が高い 色が濃いほど、そのカテゴリーの割合が低い
色が濃いほど、その数値が大きくなる 色が濃いほど、その数値が低くなる

注意点

カテゴリー同士の比較の場合、不確実係数が表示されます。その場合、線対称にならないので、注意が必要です。

  1. 不確実性係数(uncertainty coefficient) 2つの質的変数3間の相関を表す。

  2. 相関比(correlation ratio)とは2変数のうち一方が量的変数、もう一方が名義尺度である場合に、この2つの変数間の相関の程度を表す統計量。

  3. 質的変数(qualitative variable) カテゴリや名前など。数値で示される量的変数(quantitative variable)とセットで使われる。

1
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
0