私はpython pandasの新機能です。 私は10k +行のソートされたpandasデータフレームを持っています。ここ は、サンプルデータフレームである:複数の列に同じ値を持ち、別の列にあるデータを比較する、パンダのデータフレームの2つの行を結合する
例:
0 1 2 3 4 5
Hour:12 Min:31 Sec:24 Ms E_ID:459 Name:I_SECONDROW UE_C:10 M_ID:93 C_ID_1:20337
Hour:12 Min:32 Sec:33 Ms E_ID:459 Name:M_FIRSTROWW UE_C:10 M_ID:93 C_ID_1:20337
Hour:12 Min:30 Sec:31 Ms E_ID:459 Name:M_FIRSTROWW UE_C:10 M_ID:93 C_ID_1:20337
Hour:12 Min:32 Sec:33 Ms E_ID:459 Name:M_FIRSTROWW UE_C:10 M_ID:93 C_ID_1:20337
Hour:12 Min:31 Sec:19 Ms E_ID:459 Name:I_SECONDROW UE_C:10 M_ID:93 C_ID_1:20337
Hour:12 Min:32 Sec:22 Ms E_ID:459 Name:M_FIRSTROWW UE_C:10 M_ID:93 C_ID_1:20337
Hour:12 Min:30 Sec:26 Ms E_ID:459 Name:I_SECONDROW UE_C:10 M_ID:93 C_ID_1:20337
Hour:12 Min:30 Sec:26 Ms E_ID:459 Name:I_SECONDROW UE_C:10 M_ID:93 C_ID_1:20337
Hour:12 Min:30 Sec:26 Ms E_ID:459 Name:I_SECONDROW UE_C:10 M_ID:93 C_ID_1:20337
Hour:12 Min:32 Sec:17 Ms E_ID:459 Name:I_SECONDROW UE_C:10 M_ID:93 C_ID_1:20337
Hour:12 Min:30 Sec:24 Ms E_ID:459 Name:I_SECONDROW UE_C:10 M_ID:93 C_ID_1:20337
Hour:12 Min:32 Sec:46 Ms E_ID:459 Name:I_SECONDROW UE_C:9 M_ID:93 C_ID_1:20337
Hour:12 Min:30 Sec:24 Ms E_ID:500 Name:I_SECONDROW UE_C:1 M_ID:80 C_ID_1:20110
Hour:12 Min:30 Sec:26 Ms E_ID:500 Name:M_FIRSTROWW UE_C:1 M_ID:80 C_ID_1:20110
今はM_FIRSTROWW & I_SECONDROWとしてNAMEと2行(ペア)を結合すると、カラム1、3、4で同じデータを持ちます、5
選択したペアは、5秒以下の時間差を持つ必要があります。
期待出力:
Hour:12 Min:30 Sec:24 Ms E_ID:500 Name:I_SECONDROW UE_C:1 M_ID:80 C_ID_1:20110
Hour:12 Min:30 Sec:26 Ms E_ID:500 Name:M_FIRSTROWW UE_C:1 M_ID:80 C_ID_1:20110
Hour:12 Min:30 Sec:31 Ms E_ID:459 Name:M_FIRSTROWW UE_C:10 M_ID:93 C_ID_1:20337
Hour:12 Min:30 Sec:26 Ms E_ID:459 Name:I_SECONDROW UE_C:10 M_ID:93 C_ID_1:20337
Hour:12 Min:32 Sec:22 Ms E_ID:459 Name:M_FIRSTROWW UE_C:10 M_ID:93 C_ID_1:20337
Hour:12 Min:32 Sec:17 Ms E_ID:459 Name:I_SECONDROW UE_C:10 M_ID:93 C_ID_1:20337
私は同様の質問に答えました。そこを見てください:https://stackoverflow.com/questions/44998223/list-of-all-duplicate-columns-in-pandas/44998316#44998316 – cgte