はじめに
既存のDataFrameを加工したデータをDataFrameに追加 に関しての備忘録。
🦁結論🦁
既存のDataFrameを加工したデータをDataFrameに追加する場合には加工したデータをDataFrameに置換してから使う方が良い。
元データをそのまま保存できるなどの理由からDataFrame同士の結合の方が良い。
押さえておくべき点
- appendメソッドにて既存のDataFrameに別のDataFrameを追加する。
- concatメソッドにて複数のDataFrameできる。
- 新しいデータのインデックスが重複しないようにする必要がある。
利用シーン
- データの集計: 月ごとのデータを年度ごとのDataFrameに追加。
注意点
- 大量のデータを追加する場合、処理時間が長くなることがある
- インデックスが重複するとデータの整合性が崩れる。
- 追加するデータの型が一致しているか確認する必要あり。
- appendは新しいDataFrameを返すため、元のDataFrameは変更されない。
DataFrameに追記する例
import pandas as pd
# 基本のDataFrameを作成
data = {'名前': ['Alice', 'Bob']}
df = pd.DataFrame(data)
print("基本のDataFrame:")
print(df)
# 名前に「さん」を追記した新しいDataFrameを作成
new_data = df['名前'].apply(lambda name: name + 'さん')
new_df = pd.DataFrame({'名前': new_data})
print("\n名前に「さん」を追記した新しいDataFrame:")
print(new_df)
# 元のDataFrameに新しいDataFrameを追記
df_combined = pd.concat([df, new_df], ignore_index=True)
print("\n元のDataFrameに新しいDataFrameを追記した結果:")
print(df_combined)
まとめ✍️
DataFrameの元データを加工して使用する場合には処理を加えた後にDataFrameに変換してから結合する方が良さそう。
元データを残すことで再利用性も高くなる。