data-mining

-1熱

1答えて

LSH algorithm ：、それはハッシュテーブルの各エントリの先頭に進数では何ベクトルキーとそれ以降の値はベクトル値ですか？量子化バケットとは、ハッシュテーブルと同じですか？ここで、はハッシュ関数で、ハッシュ関数とハッシュコードとハッシュ値の違いは何ですか？ハッシュテーブルごとまたはハッシュコードごとにハッシュコード定数がありますか？最も近いネイバーアイテムの検索プロセスは、同

0熱

1答えて

TypeError：unhashable type： 'numpy.ndarray' - ボールツリーから半径を照会してデータフレームからデータを取得する方法は？

ボールツリーから半径を照会してデータを取得する方法は？例 from sklearn.neighbors import BallTree import pandas as pd bt = BallTree(df[['lat','lng']], metric="haversine") for idx, row in df.iterrow(): res = df[bt.query_r

2熱

1答えて

混同行列はaとbをラベルとして生成しますが、必要なものは生成しません

私はビンを持ち、ラベルは 'points'でなければなりませんが、ラベルは90以上の点として表示され、90以下の点は私のビンごとに表示されます。ここに私のコードです。 print(y_test.values) cm = confusion_matrix(y_test.values, preds) def plot_confusion_matrix(cm, classes,

0熱

1答えて

フィーチャ変数の相関とフィーチャ選択の計算の違いは？

相関を使用してフィーチャ選択を使用して重要/関連性の高い変数を選択することの違いは何ですか？フィーチャ選択を研究するとき、ピアソン相関を含む統計的テストを使用することがわかります。私たちのグループは、大学のプロジェクトの一部であり、データマイニングを行う際に重要な変数を特定したいと考えています。パートナーはR Studioを使用して相関分析を行い、Sci-kit Learnを使用して再帰的な機能

0熱

1答えて

パンダのデータフレームを使ったnGram周波数

私はtitleという名前のフィールドを持つMongoDBにいくつかのアイテムを持っていますが、ここではこれに焦点を当てます。私が最もよく使われる言葉に、全体の時間を取得したいは、例えば、期待される結果は、だから私は、その後バープロットをレンダリングして物事を見ることができます { "christmas 2017": 30, "foo bar": 4, "apple

-2熱

2答えて

ローカル外れ値検出（LOF）の計算方法

Breunig & Sanderの公表に従って、ローカル外れ値係数（LOF）の正しい計算式を得たいです。 Iこの式を発見した：疑われる外れ値のLRDを介して分割 LOF =（MinPts領域に位置するオブジェクトのLRDの平均）、これはMinPtsの重心です。これが正しい場合、私は疑いがあります。、疑いのある外れ値のLRDを介して分割 LOF =（疑わすなわち重心のLRDを含むMinPts領域

0熱

2答えて

Rのnaive bayes分類アルゴリズムのrocカーブ解析はどのように実装できますか？

インターネットには非常に複雑な例があります。私は自分のコードにそれらを適用できませんでした。私は14の独立変数と1つの従属変数からなるデータセットを持っています。私はRで分類しています。私のコードは以下の通りです： dataset <- read.table("adult.data", sep = ",", na.strings = c(" ?")) colnames(dataset) <- c

0熱

1答えて

RapidMiner - 時系列セグメンテーション

私はRapidMinerの新機能として、Yahoo Financeから過去の財務データセット（日付、オープン、クローズ、ハイ、ロー、ボリュームトレードの属性を持つ）を持っています。セグメントには、以下の画像のように：データセットAに対するために（すなわち、セグメント1を私はまた、このようなデータセットの複数の上でこの区分化を実行する上で計画していた後、それぞれのセグメント間の比較しますデータセッ

-1熱

1答えて

storage.mode（x）< - "double"：kmeansの強制で導入されたNAs

私は5つのクラスタにデータを分割しようとしています。しかし、私は次のエラーが表示されます > colSums(sapply(train1,is.na)) train_id name item_condition_id category_name 0 0 0 0 brand_name price shipping item_