23
16

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 5 years have passed since last update.

【pandas】最も近い値でマージするmerge_asof関数

Posted at

はじめに

今まで存在を知らなかったのですが、めちゃめちゃ便利なのでメモ。
pandas の merge_asof関数について紹介します。
初投稿ですのでお手柔らかに。

基本的な例

import pandas as pd
df_left = pd.DataFrame({'a': [1, 5, 10], 'left_val': ['a', 'b', 'c']})
df_right = pd.DataFrame({'a': [1, 2, 3, 6, 7], 'right_val': [1, 2, 3, 6, 7]})

と2つのテーブルがあったとします。

このとき、

pd.merge_asof(df_left, df_right, on='a', direction='nearest')

と書くだけで、df_left のカラム['a'] に対し、df_right['a'] の最も近い値をキーとして、
2つのテーブルを結合することができます。

キャプチャ.PNG

図のように、

  • df_left['a'] = 1 に最も近い、df_right['a'] = 1の right_val を結合
  • df_left['a'] = 5 に最も近い、df_right['a'] = 6の right_val を結合
  • df_left['a'] = 10 に最も近い、df_right['a'] = 7の right_val を結合

していることが分かります。

許容する範囲の指定

"tolerance" という引数を使うことで、最も近い値をどこまで許容するか、
指定することができます。

import pandas as pd
pd.merge_asof(df_left, df_right, on='a', direction='nearest', tolerance=2)
キャプチャ2.PNG a=10 に最も近い df_right['a'] は7ですが、 指定した tolerance=2 よりも差が大きいので、NaNが入っています。

参考

公式リファレンス:https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.merge_asof.html

23
16
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
23
16

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?