私は、緯度/経度の点数が多い(305000)データフレームを持っています。私は、各反復、サンプルを取って、各連続する行の間のhaversineの距離を計算することによって、私のデータフレームのサイズを縮小したい。距離が小さすぎる場合は、2点のうちの1点を削除したい。どのように私はこれをPythonで行うことができますか?私はshift()を使いたかったのですが、それを使うライトの方法は分かりません。これは私がやろうとしていることです。lat lonポイントを減らす
rows=random.sample(df.index,50)
for i in range(50):
rows = np.random.choice(df.index.values, 1000)
sampled_df = df.ix[rows]
if haversine(sampled_df,sampled_df.shift()) < e
delete one row