PythonのPandasライブラリはデータの操作や解析に非常に便利なツールで、特にデータフレームを使ったデータ管理は非常に直感的です。
Pandasのインストール
PandasはPythonのパッケージ管理ツールであるpipを使ってインストールできます。
pip install pandas
Pandasのインポート
まず、Pandasをインポートします。Pandasはデータ操作に必要な関数が多く含まれているため、データ分析には欠かせません。
import pandas as pd
データフレームの基本的な作成方法
データフレームを作成するには、まずPythonの辞書やリストを使ってデータを構造化します。以下のように、各列のデータを辞書で定義し、pd.DataFrame()を使ってデータフレームに変換できます。
import pandas as pd
# サンプルデータを辞書で定義
data = {
'名前': ['田中', '佐藤', '鈴木', '高橋'],
'年齢': [28, 22, 35, 40],
'職業': ['エンジニア', 'デザイナー', 'データサイエンティスト', 'マネージャー']
}
# データフレームの作成
df = pd.DataFrame(data)
print(df)
名前 年齢 職業
0 田中 28 エンジニア
1 佐藤 22 デザイナー
2 鈴木 35 データサイエンティスト
3 高橋 40 マネージャー
別のデータ構造からデータフレームを作成する
Pandasでは、辞書以外のデータ構造(リストやNumPy配列など)からもデータフレームを作成できます。例えば、リストのリストを使ってデータフレームを作る方法を紹介します。
import pandas as pd
# リストのリストからデータフレームを作成
data = [
['田中', 28, 'エンジニア'],
['佐藤', 22, 'デザイナー'],
['鈴木', 35, 'データサイエンティスト'],
['高橋', 40, 'マネージャー']
]
# 列名を指定してデータフレームに変換
df = pd.DataFrame(data, columns=['名前', '年齢', '職業'])
print(df)
名前 年齢 職業
0 田中 28 エンジニア
1 佐藤 22 デザイナー
2 鈴木 35 データサイエンティスト
3 高橋 40 マネージャー
データフレームの初期設定を指定する
データフレームの作成時に、行や列にラベルを追加するなどの初期設定も可能です。以下は、行インデックスをカスタマイズしてデータフレームを作成する例です。
import pandas as pd
# リストのリストからデータフレームを作成
data = [
['田中', 28, 'エンジニア'],
['佐藤', 22, 'デザイナー'],
['鈴木', 35, 'データサイエンティスト'],
['高橋', 40, 'マネージャー']
]
# 行インデックスを指定してデータフレームを作成
df = pd.DataFrame(data, columns=['名前', '年齢', '職業'], index=['A', 'B', 'C', 'D'])
print(df)
名前 年齢 職業
A 田中 28 エンジニア
B 佐藤 22 デザイナー
C 鈴木 35 データサイエンティスト
D 高橋 40 マネージャー
まとめ
Pandasを使ったデータフレームの作成方法について基本を解説しました。データフレームはさまざまな形式のデータを統一的に扱うことができ、データ分析の基礎的な操作をスムーズに進められます。