pandas DataFrame
の値を最も近いインデックスで結合するための迅速で適切な方法がありますか?私は大きなデータフレームとハックのためにこれをしなければなりません。私が試したハックと回避策は遅く、それほど有用ではありません。最も近いインデックスによるパンダのDataFrame値への結合
df
とdf2
という2つのデータフレームがあるとします。ここでは、df2
の値をdf
に結合したいと思っています。
import numpy as np
import pandas as pd
df = pd.DataFrame(np.random.randint(0,100,size=(4, 6)),
index=[1,1.55,3.33,9.88],
columns=[1,2.66,4.66,8.33,11.11,12])
df2 = pd.DataFrame(np.random.randint(0,100,size=(2, 3)),
index=[1.51,3.31],
columns=[2.64,4.65,8.31])
In [23]: df
Out[23]:
1.00 2.66 4.66 8.33 11.11 12.00
1.00 98 40 28 36 49 92
1.55 52 51 61 64 28 98
3.33 66 33 91 21 24 79
9.88 30 21 13 62 89 22
In [24]: df2
Out[24]:
2.64 4.65 11.12
1.51 999 999 999
3.31 999 999 999
# The result should look like the following:
1.00 2.66 4.66 8.33 11.11 12.00
1.00 98 40 28 36 49 92
1.55 52 999 999 55 999 98
3.33 66 999 999 67 999 79
9.88 30 21 13 62 89 22
「クローズ」をどのように定義しますか?私たちは "価格は正しい"というルールを話していますか?ユークリッド距離?または.... – Back2Basics