MLlibでユーザベースのコラボレーションフィルタリングを構築して、last-fmデータセット(聴いているアーティストに基づいています)から同様のユーザを見つけようとしています。Spark MLlibでユーザベースの推奨を行うには?
Apache MahoutはGenericBooleanPrefUserBasedRecommenderで達成したいことを実行できますが、十分速くないので、Spark & MLlibを試したかったのですが、その実装が見つかりませんでした。誰もがこれを実装する方法アイデアのjava/scala/pythonの実装を作業していますか? MLlibにはALSによるアイテムベースの推奨がありますが、それは異なっています。
ALSのspark MLLibの実装に精通している場合は、userFeaturesを使用して、ユーザー間の類似性マトリックスを作成し、類似度に応じて結果をソートできます。 – jtitusj