アカウントのリンク構造を指定する2つの列を持つCSVファイルがあります。 私が持っている問題は、これらのリンクごとに2つの逆のエントリがあることです。Python - 一意の値に基づいて検索、一致、並べ替え、追加する
例
Column1 Column2
12513 52188
52188 12513
私も持っている他の問題は、あなたがすべてを見ることができるように同じアカウント番号にしてから、別のリンケージを指定する複数のエントリ
Column1 Column2
12513 52188
52188 12513
52188 19922
19922 52188
19922 12812
12812 19922
18216 59888
59888 18216
3856 59888
59888 3856
があるかもしれないということですアカウントが何らかの形で相互にリンクされている場合、私が探している出力は、スレーブアカウントにリンクされた1つのマスターアカウント(おそらく最も低い値のアカウント)を作成し、2つの逆のエントリも削除する必要があります。上記のデータから
出力例:
Column1 Column2
12513 52188
12513 19922
12513 12812
3856 59888
3856 18216
ファイルは、 は1つのマスターアカウントだけでなくはありますのでご注意くださいと約2万行が含まれています。
は不明である – RomanPerekhrest
'gitのクローンます。https:// github.com/NiallCosgrove/kayboxa' –
そのアップgithubの上今、コピー/貼り付けエラーを避けるためです。私は乱数の20000ペアでそれをテストし、1時間半かかる。 –