data-mining

    -1

    1答えて

    LSH algorithm : 、それは ハッシュテーブルの各エントリの先頭に進数では何ベクトルキーとそれ以降の値はベクトル値ですか? 量子化バケットとは、ハッシュテーブルと同じですか? ここで、はハッシュ関数で、 ハッシュ関数とハッシュコードとハッシュ値の違いは何ですか? ハッシュテーブルごとまたはハッシュコードごとにハッシュコード定数がありますか? 最も近いネイバーアイテムの検索プロセスは、同

    0

    1答えて

    ボールツリーから半径を照会してデータを取得する方法は?例 from sklearn.neighbors import BallTree import pandas as pd bt = BallTree(df[['lat','lng']], metric="haversine") for idx, row in df.iterrow(): res = df[bt.query_r

    2

    1答えて

    私はビンを持ち、ラベルは 'points'でなければなりませんが、ラベルは90以上の点として表示され、90以下の点は私のビンごとに表示されます。ここに私のコードです。 print(y_test.values) cm = confusion_matrix(y_test.values, preds) def plot_confusion_matrix(cm, classes,

    0

    1答えて

    相関を使用してフィーチャ選択を使用して重要/関連性の高い変数を選択することの違いは何ですか?フィーチャ選択を研究するとき、ピアソン相関を含む統計的テストを使用することがわかります。 私たちのグループは、大学のプロジェクトの一部であり、データマイニングを行う際に重要な変数を特定したいと考えています。パートナーはR Studioを使用して相関分析を行い、Sci-kit Learnを使用して再帰的な機能

    0

    1答えて

    私はtitleという名前のフィールドを持つMongoDBにいくつかのアイテムを持っていますが、ここではこれに焦点を当てます。私が最もよく使われる言葉に、全体の時間を取得したい は、例えば、期待される結果は、だから私は、その後バープロットをレンダリングして物事を見ることができます { "christmas 2017": 30, "foo bar": 4, "apple

    -2

    2答えて

    Breunig & Sanderの公表に従って、ローカル外れ値係数(LOF)の正しい計算式を得たいです。 Iこの式を発見した:疑われる外れ値のLRDを介して分割 LOF =(MinPts領域に位置するオブジェクトのLRDの平均)、これはMinPtsの重心です。 これが正しい場合、私は疑いがあります。 、疑いのある外れ値のLRDを介して分割 LOF =(疑わすなわち重心のLRDを含むMinPts領域

    0

    2答えて

    インターネットには非常に複雑な例があります。私は自分のコードにそれらを適用できませんでした。私は14の独立変数と1つの従属変数からなるデータセットを持っています。私はRで分類しています。私のコードは以下の通りです: dataset <- read.table("adult.data", sep = ",", na.strings = c(" ?")) colnames(dataset) <- c

    0

    1答えて

    私はRapidMinerの新機能として、Yahoo Financeから過去の財務データセット(日付、オープン、クローズ、ハイ、ロー、ボリュームトレードの属性を持つ)を持っています。セグメントには、以下の画像のように:データセットAに対するために(すなわち、セグメント1を 私はまた、このようなデータセットの複数の上でこの区分化を実行する上で計画していた後、それぞれのセグメント間の比較しますデータセッ

    -1

    1答えて

    私は5つのクラスタにデータを分割しようとしています。しかし、私は次のエラーが表示されます > colSums(sapply(train1,is.na)) train_id name item_condition_id category_name 0 0 0 0 brand_name price shipping item_