data-mining

    -3

    1答えて

    map-reduceフレームワークでナイーブベイズ分類アルゴリズムを使用してデータセットを分類しようとしています。 私の質問は、データセットを訓練とテストに分けて、訂正された分類されたインスタンスと不正確な分類されたインスタンスから正確さを計算する方法です。

    -1

    1答えて

    私は例えば特定のインスタンスを選択していない値のフィルターで取り除くことにより、インスタンスを選択し、自分のJavaコードがあります。 RemoveWithValues filter = new RemoveWithValues(); String[] options = new String[4]; options[0] = "-C"; // Choose attribute to

    -2

    1答えて

    温度、湿度、塵埃、光度、カーボンモノオキサイド、レインデータなどの環境データをセンサーで収集し、クラウドに送信するプロジェクトに取り組んでいます。 。今、私は、来るべき日に起こる条件に基づいてアラートを生成したいと思っています。このためにどの機械学習アルゴリズムを使用すべきですか?私はニューラルネットワークに取り組んでいましたが、過去の日数に基づいて温度を予測できますか?私はそれをしようとしました

    2

    2答えて

    私はDBSCANのようなクラスタリングアルゴリズムを使用しています。 -1と呼ばれる「クラスタ」を返します。これらのポイントは、クラスタの一部ではありません。これらの点については、この点がどのように異常であるかの指標のようなものを得るために、その点から最も近いクラスターまでの距離を求めたいと思います。これは可能ですか?または、この種のメトリックの代替手段はありますか?

    0

    1答えて

    私は2つの時系列の気象測定(すなわち、XとY)を持っています。 XとYの両方の時系列は、1年間にわたる日々の測定値を用いて構築された。 X時間系列対Y系列を散布図としてプロットし、すべての点を日付順に昇順に接続することにより、1年周期を表す閉ループが得られます。私はN個の場所で測定しているので、類似の形状を持つものを見つけるためにクラスタリングしたいN個のループ(つまり、1年周期)があります。 非

    0

    1答えて

    データ視覚化とデータマイニング機能を実行するために使用されるデータファイルをユーザーがログインしてアップロードできるWebアプリケーションを構築しています - Web上にSAS EG/Orange同等品を想像してください。 データの効率的な取得と処理、および各方法の賛否両論を容易にするために、これらのファイルを(データベースまたはファイルに)保存するベストプラクティスは何ですか?

    -2

    1答えて

    私はCosine類似度公式を使って2つのベクトル間の類似性を計算しています。 ベクトル2(-1237373741、27、1、1、331289590、1818540802) ベクトル2(-1237373741、49、1、1、331289590、1818540802):私はこのような二つの異なるベクターを試し 2つのベクターには少し違いがありますが、結果はです。 なぜわからないのですか?誰でも私のため

    0

    2答えて

    sklearnまたはscikitモジュールから次のPerceptron関数を実行し、n_teraの数は40です。誤分類の総数はであり、試験データのうちの4つはであった。 sklearn_percep=Perceptron(n_iter=40,eta0=0.1,random_state=0) 後、私は100であることをn_iteratをしたが、今で誤分類は45のうち、16に増加しました。私はn_

    1

    1答えて

    誰かが私に説明することができます、なぜ協会ルールの学習は教師なし学習のアプローチと考えられますか? {a, b, c} {a, b, d} => a -> b => b -> a 私はそれを参照してください方法は、唯一の任意のデータ・セットがあります。私はそれを理解方法は、アルゴリズムは、コヒーレントデータ・セットの束を取り、これらのセットに基づいて関連付けを計算していることです。特定の