1
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 1 year has passed since last update.

初学者による初学者のためのpandasでEDA~データ抽出編~

Posted at

EDAをする際にpandasなどのライブラリを用いた文法

【環境】

Google Colab
Python ver.1.5.3

【データ】
plotly_express に登録されている「Gapminder」

pandasを使って超初歩なデータ抽出

まずはデータ操作の準備

①pandasとplotly_expressをインポート

import pandas as pd
import plotly_express as px

②「Gapminder」のデータをデータフレーム化する

df = px.data.gapminder()

③どのようなデータか確認

df

出力結果↓
スクリーンショット (13).png

たとえば、'year'のカラムに入っているデータを抽出したいとき

df['year']

出力結果↓
スクリーンショット (14).png
Serieseで抽出される
スクリーンショット (15).png

locを使った抽出方法

'pop'列のデータをすべて抽出してみる。:(コロン)は「すべて」という意味。

df.loc[:, 'pop']

出力結果↓
スクリーンショット (17).png

:ではなく、行を指定して抽出できる。

df.loc[2:30, 'pop']

出力結果↓
スクリーンショット (16).png

'pop' だけでなく、リストを渡して複数のカラムを指定することもできる

df.loc[0:10, ['continent', 'pop']]

出力結果↓
スクリーンショット (22).png

iloc = 'pop'のようなキーワードではなく、インデックス/カラム番号を指定して抽出する

df. iloc[:, 3]

出力結果↓
スクリーンショット (23).png

カラム番号 3 の 'lifeExp' のデータが出力できる
スクリーンショット (13).png

loc 同様、リストを渡して複数のカラムを指定することもできる

df.iloc[:, [1, 2, 3]]

出力結果↓
スクリーンショット (24).png

Tを使い、カラムとインデックスの配置を逆にする(転置)

df.T

出力結果↓
スクリーンショット (25).png

本日は以上です。
最後までお読みいただき、ありがとうございました。

1
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?