1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 3 years have passed since last update.

お前はどこ出身だよ

Posted at

Pandasでデータを2つ読み込んで結合したときに、こんなことないですか?

  • データの読み込み
import pandas as pd

sample001 = pd.read_excel("sample_excel_001.xlsx")
sample001.head()
89781cb2-5d55-73df-1acf-b17f433e7b07.jpeg
sample002 = pd.read_excel("sample_excel_002.xlsx")
sample002.head()
a66b2cc7-69c6-4bf2-dc4e-5f6e304a0578.jpeg

2つのデータをデータフレーム(sample001, sample002)に読み込みました。
"data001"列で2つのデータを結合できそうです。

  • データの結合(join)
merge_data = pd.merge(sample001, sample002, on="data001", how="left")
merge_data.head()
e1d8f492-631d-fa42-493e-26e091c9c4ed.jpeg "data001"は結合のキーワード列、"data003"はsample002のデータであることはすぐ分かります。"data002_x"、"data002_y"ってなんやねんって話ですよ。「どこ出身のデータですか?」ってなっちゃいますよね?(いや本当はわかりますよ?mergeの第一引数で指定したデータフレームがx付き)見てくれが嫌なので、せめてどこ出身のデータなのかはパッと分かるようにしたいですね。

出身の名乗らせ方

suffixesオプションを使えば、結合キー以外でカラム名が重複したときに、新しいカラム名の末尾に加える文字列を指定することができます。

merge_data_new = pd.merge(sample001, sample002, on="data001", how="left", suffixes=[".sample001", ".sample002"])
merge_data_new.head()
a9c397c7-23ce-94aa-1a10-1af997cbe426.jpeg

おー、これでどこ出身のデータかパッと判別できるようになりましたね!

最後に

できたらなんですが、末尾じゃなくて先頭に文字列を付けれたらいいですね。(SQLっぽくできるので)

1
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?