推奨システムの評価行列を分解すると、評価行列はP * t(Q)と書くことができ、Pはユーザ係数行列を表し、Qは項目係数行列を表す。 Qの次元は、アイテムのランク*数として書くことができます。私は、Q行列の値が実際にアイテムの重さなどの何かを表しているのだろうかと疑問に思っていますか?また、Q行列の隠れパターンを見つける方法はありますか?共用フィルタのユーザおよびアイテムマトリクスの潜在的特徴モデルの値はどのようなものですか?
答えて
フィーチャを多次元データの分散の重要な方向と考えてください。ユーザーが購入した3つのアイテムのうちのどれをプロットしているかを3次元のチャートで想像してみましょう。アモルファスの塊であるが、ブロブの実際の軸または方向はおそらくx、y、z軸に沿っていない。それが向きを変えるベクトルは、ベクトル形式の特徴です。これを巨大な次元のデータ(多くのユーザ、多くのアイテム)に適用すると、この高次元のデータは非常に頻繁に少数のベクトルにまたがる可能性があり、これらの新しい軸に沿わない分散は非常に小さく、したがって、ALSのようなアルゴリズムは、データのスパンの大部分を表すこれらの少数のベクトルを検出します。したがって、「フィーチャ」は、データ内の主要な分散モードと見なすことができます。つまり、あるアイテムが他のアイテムとどのように異なるかを記述するアーキタイプです。
推薦者のPQ分解は、データの潜在的に巨大な圧縮を達成するために重要でない特徴を削除することに依存することに注意してください。これらの重要ではないフィーチャ(ユーザ/アイテムの入力に非常に小さな差異を説明するフィーチャ)は、ノイズとして解釈されることが多く、実際には廃棄されてより良い結果が得られるため、削除することができます。
隠しパターンを見つけることはできますか。確かに。新しいより小さいが密集したアイテムベクトルとユーザベクトルは、クラスタリング、KNNなどの手法で扱うことができます。これらは、新しい基底ベクトル、新しい軸で定義される新しい「空間」内のベクトルに過ぎません。このような操作の結果を解釈する場合は、ユーザー空間の項目&に変換する必要があります。
ALS(PQ行列分解)の本質は、ユーザの特徴ベクトルをアイテム空間に変換し、アイテムの重みによってランク付けすることです。最高ランクのアイテムが推奨されます。
- 1. UIPopoverControllerおよびdelegate-methodでのリリース。 "潜在的なメモリリーク"
- 2. OutputCacheおよび潜在的に危険なリクエスト
- 3. 目的C:switch insideループ - どのように(潜在的な)メモリリークを避けるか
- 4. 潜在的に共有メモリの場所は何ですか?
- 5. ExtJS 4アプリケーション間でのモデル、ビュー、およびコントローラの共有
- 6. Bashでgrep/cutした後のファイルの潜在的なサイズはどのように見えますか?
- 7. 潜在的なPHPメモリの豚かどうか?
- 8. HTMLSpanElement(および他のもの)の用途は何ですか
- 9. Rails:潜在的な他のモデルのリストの1つを参照するモデル
- 10. NetBeansおよびWindows用の最も一般的なC/C++コンパイラ
- 11. C#およびVisual Studio Macのこのようなもの
- 12. 私のDjangoのフィルタおよびテンプレート
- 13. の.htaccess偽のディレクトリおよびユーザ名
- 14. 潜在的な公開SSH鍵の部分を検証するにはどうすればよいですか?
- 15. サービスディスカバリのための領事およびHAプロキシ - どのようなものを使用しますか?
- 16. ユーザが値を入力できるようにするssrsの動的フィルタ
- 17. GROUP_BYは、フィルタおよびR
- 18. この潜在的なメモリリークの原因は何ですか?
- 19. 自己、親、静的およびどのように使用する場合は?
- 20. コードおよびフィルタ値AX 2009
- 21. テキスト入力の特徴抽出のパイプライン方法で使用するカスタムNERおよびPOSタグャーの作成
- 22. MongoDBのC#のフィルタ使用およびまたはオペレータ
- 23. GroovyはAndroid用の潜在的な開発言語です
- 24. 潜在的な役割: `site.yml`と` webservers.yml`にはどのような内容を書きますか?
- 25. 配列はCプログラミング言語の構造体および共用体とどう違うのですか?
- 26. アンドロイドのasynctaskの潜在的なバグ
- 27. CFSocketCreateWithNativeの後の潜在的なメモリリーク
- 28. '%value%'のようなグリッドビューでのフィルタはどのようにですか?
- 29. サイトへの潜在的な脅威をどのように監視する必要がありますか?
- 30. データタイプR8、I2、および好きなものは何ですか?