で同じ情報を持つ行を保管してください:Pythonのパンダのデータフレームは、このようになりますPythonのデータフレームを使用している場合は3列
ID_1 ID_2 haplotypeID locus
A1 A1 hap.1.1 KIRa
A1 A1 hap.1.2 KIRa
A2 A2 hap.2.1 KIRa
A2 A2 hap.2.2 KIRa
A3 A3 hap.1.1 KIRa
A4 A4 hap.2.2 KIRa
A4 A4 hap.1.2 KIRa
A1 A1 hap.1.1 KIRb
A2 A2 hap.2.1 KIRb
A2 A2 hap.2.2 KIRb
A3 A3 hap.1.1 KIRb
A3 A3 hap.1.2 KIRb
A4 A4 hap.2.2 KIRb
A4 A4 hap.1.2 KIRb
A1 A1 hap.1.1 KIRc
A2 A2 hap.2.1 KIRc
A3 A3 hap.1.1 KIRc
A3 A3 hap.1.2 KIRc
A4 A4 hap.1.2 KIRc
という名前の4つの列があります:ID_1、ID_2、ハプロタイプIDと軌跡。 ID_1、ID_2、およびlocusの3つの列に対して重複する行のペアのみを保持したいと考えています。上記の例では、出力は次のようになります。
ID_1 ID_2 haplotypeID locus
A1 A1 hap.1.1 KIRa
A1 A1 hap.1.2 KIRa
A2 A2 hap.2.1 KIRa
A2 A2 hap.2.2 KIRa
A4 A4 hap.2.2 KIRa
A4 A4 hap.1.2 KIRa
A2 A2 hap.2.1 KIRb
A2 A2 hap.2.2 KIRb
A3 A3 hap.1.1 KIRb
A3 A3 hap.1.2 KIRb
A4 A4 hap.2.2 KIRb
A4 A4 hap.1.2 KIRb
A3 A3 hap.1.1 KIRc
A3 A3 hap.1.2 KIRc
誰かが私を助けてくれることを願っています。前もって感謝します!
これは、複製したままにしたいときに削除する方法を示しています。私が探していたツールは "keep = False"です。 – Svalf