2
私はカラムがID, Product
のデータフレームを持っています。たとえば、リストのデータフレームで最も一般的な検索
ID Product
1 ['a','b']
2 ['a','b','e']
3 ['c','d']
4 ['a','b','c','d']
Productは、各リストに人が持っている製品が含まれているフィールドです。たとえば、ID 1の人物にはaとbという商品があります。私は、最も一般的な/共通の製品ペアを見つける必要があります。この例では、商品[a、b]が最も人気があります。人が1つの製品を持つことができないので、最も一般的な製品ペアでなければなりません。
私はそれが2つの以上の製品グループのために調べる必要があります。データセットをこれに変更する必要があります。 'ID製品 1 [ '、 'B'、 'E'] 2 ['、 'B'、 'E'] 3 [ 'C'、 'D'] 4 [」 「['a'、 'b'、 'e'] 'が最も人気のあるものとして見つかるはずです –
あなたの投稿にはどこにも言及されていませんでした。あなたは「ペア」という言葉を強調し続けていたので、あなたはペアワイズの組み合わせに従ってグループ化し、最大のカウントを持つペアを取ると仮定しました。新しい基準は何でしょうか? –
私はお詫び申し上げますが、ペアワイズの比較である必要はありません。基本的には、大部分の人が選択した製品群でなければなりません。それは他の言葉それは3,4,5などになることができます –