recommendation-engine

    6

    3答えて

    は、私は、PostgreSQLのテーブル含むいくつかの車百万レコードを持っている: +----+--------+------+---------+-----------+-------------+------------+------------+ | id | price | year | mileage | fuel_type | body_type | brand | model |

    2

    1答えて

    私は推奨エンジンを開発中です。私は全体の類似性マトリックスを記憶しておくことはできないと思う。 10,000点の類似点を計算したところ、4,000万点を超えています。私はそれらをバイナリファイルに保存し、160 MBになります。 うわー! 問題は約20万点のアイテムがあるということです。 複数のグループにグループ化して各グループの類似性マトリックスを作成しても、それらをある時点でメモリにロードする

    0

    1答えて

    私は3つの列を持つデータフレームを持っています。最初の2つは要因、3つ目は数値です。私はちょうど、 > beer_ratings[1230:1250,] beer_beerid review_profilename review_overall 1230 52211 WITTBEER 4.0 1231 52211 orbitalr0x 3.0 1232 522

    -1

    1答えて

    neo4j-reco README expleをスタンドアロンサーバで実行します。 外部neo4jサーバーを使用して接続するにはどうすれば変更できますか?

    0

    1答えて

    私は推薦エンジンに取り組んでいます。私が直面している1つの問題は、アイテムの類似性マトリックスが巨大であることです。 類似度マトリックスを20,000アイテム計算し、バイナリファイルを保存しました。このバイナリファイルはほぼ1GBに調整されていました。私はそれが大きすぎると思う。 多くのアイテムがある場合、類似性マトリックスを処理するにはどうすればよいですか?

    0

    1答えて

    私は、データフレームをrealRatingMatrixに変換しようとしていました。しかし、そのためには、まずデータフレームを行列と行列に変換してからrealRatingMatrixにします。 データフレームdfには、475984 rowsと3 columnsが含まれています。 Column1column2はcustomer namesとcolumn3 ステップが続くそれぞれのユーザによって与えられ

    0

    2答えて

    私は推薦場所を作りたいが、私は自分のsklearnに問題がある。私はライブラリを更新していますが、動作しません。 D は、それは私のライブラリのコードです:私は私を助けてください アナコンダとのpython 2.7を使用します。 from sklearn.cluster import KMeans import numpy as np import pandas as pd from skl

    0

    2答えて

    私はいくつかの英語の文章を提供するプログラムを作っています。例えば : まず、私は文を提供し、ユーザーにを「今日は学校を行かなければなりません」。 その後、そのような文章をもっと習得したい場合は、その文章と文法の類似性が高い文章がいくつか見つかります。 文章を提供する唯一の方法は類似性を計算することだと思います。 2つの文の間の文法の類似度を計算する方法はありますか? またはそのアルゴリズムを作る

    1

    1答えて

    PySparks mllibパッケージは、明示的および暗黙的なデータそれぞれについて推奨モデルをトレーニングするtrain()およびtrainimplicit()メソッドを提供します。 暗黙的なデータでモデルを訓練したいと思っています。具体的には、商品購入データ。 uはaは u1, i1, 1 u1, i2, 1 u2, i2, 1 u2, i3, 1 ... un, im, 1 :それは、ユーザ

    0

    1答えて

    TripadvisorのようなWebサイトでユーザーが検索すると、システムはユーザーの入力を含む項目をフィルタリングしてから、推薦システムが結果の順序を決定しますか? 言い換えれば、検索エンジンの出力がおすすめシステムの入力ですか? これは、ユーザーの設定を考慮していないため、ユーザーに関連する項目を除外しませんか?また、結果の多様性が影響を受ける可能性があります。 この質問では、Better o