私は、アソシエーションルールを学び、財問題の古典的なバスケットにアルゴリズムを実装する方法を知っている、のような:相関ルール - 非バイナリ項目
Transaction ID Potatoes Eggs Milk
A 1 0 1
B 0 1 1
この問題では、各アイテムは、バイナリ識別子を持っています。 1はバスケットが品物を含むことを示し、0はそうでないことを示す。
しかし、同じ商品の多くを含むことができるバスケットをモデル化するにはどうすればよいでしょうか?たとえば、以下の、非常に非現実的な例を取ってください。
この場合には、バイナリ指標を使用してTransaction ID Potatoes Eggs Milk
A 5 0 178
B 0 35 7
は明らかに多くの情報を失うことになると私は考慮に入れ、バスケット内のアイテムが存在するだけでなく、アイテムが発生する頻度だけでなく、かかるモデルを求めています。
この問題にはどのようなアルゴリズムが適していますか?
実際のデータには100以上のアイテムがあり、ユーザーのバスケットのプロファイルに基づいて、他の使用可能なアイテムを消費する顧客の確率を計算したいと思います。