私は<user, item>
のデータセットを持っています。各エントリはどのユーザがどのアイテムを購入したかを記録します。推奨タスクでPythonのFastFMライブラリ(分解マシン)を使用するには?
<u1, i1>
<u1, i4>
<u2, i2>
<u3, i2>...
Iは
no_of_features = no_of_users + no_of_items
で符号化されたデータセットを作成し、これらのエントリの各々は、その特定のアイテムを購入したユーザを表すように、1に出力変数y
を設定しています。
注:この場合、すべてのyの値は1です。
エンコードされたデータセットには、次のようになります。
user1 user2 user3 .... item1 item2 item3 item4 .... y
1 0 0 .... 1 0 0 0 .... 1
1 0 0 .... 0 0 0 1 .... 1
0 1 0 .... 0 1 0 0 .... 1
0 0 1 .... 0 1 0 0 .... 1
を今、私は、任意のユーザx
と任意の項目y
用ケース<x, y>
ための推奨事項を生成するためにfastFM
を使用する方法を知っていただきたいと思いますか?
明らかにregression
は画像のとおりです。だからclassification
またはranking
のアプローチをfastFM
にする必要がありますか?またどのように?例えばclassification
を使用する場合、y=0
でインスタンスを生成する必要がありますか?私がranking
のアプローチを使用している場合、ランキングアプローチの出力によってアイテムを並べ、より高い値を持つものを推奨しますか?
私は[Data Science Exchange](http://datascience.stackexchange.com/)がこれのために良い場所になると思います。しかし、私はstackexchangeのプロユーザーではありません:-) –