knn

    0

    1答えて

    初心者データ科学ここに。 私は高次元のデータセットを持っています。 2308の寸法を持つ83のサンプルがあり、その形状は(83,2308)である。さらに、長さ83のサンプルタイプの配列を持ち、その形状は(83、)です。 私は元のデータセットのサブセットでKNNクラシファイア(2人の隣人)を訓練し、それを使って残りのデータポイントのサンプルタイプ(テストサブセット)を予測しようとしています。私の訓練

    0

    1答えて

    分類される必要があるトレーニングセットとテストポイントTが与えられている。 トレーニングセットをn個の部分に分割すると、各部分でknnアルゴリズム(k = 1)を実行します。その後、各パートの結果を比較します。トレーニングセット全体を通して1-nnを実行した場合と同じ結果が得られますか? n = 4.トレーニングセットを4つに分割する トレーニングセットの4つの部分で1-nnアルゴリズムを実行した

    2

    1答えて

    私は自分のkNN分類子を実装しようとしています。 、私はループのいずれかを使用していない場合は def euclidean_distance(X_train, X_test): """ Create list of all euclidean distances between the given feature vector and all other featur

    0

    1答えて

    割り当てとして、私は自分のkNNクラシファイアをforループを使用せずに作成する必要があります。私はscipy.spatial.KDTreeを使用して、テストセット内の各ベクトルの最近隣を見つけました。次に、scipy.stats.modeを使用して予測クラスのリストを返します。しかし、セットのサイズが非常に大きい場合、これは非常に長くかかる。例えば、私はthis page import nump

    -1

    1答えて

    ユークリッド距離を使ってデータのクラスを予測する学習セットにk-nnを適用したいと思います。 は、私はあなたがclassパッケージにknn()機能を試すことができ、この方法

    0

    1答えて

    アルゴリズム、オプションのデフォルトの範囲を持っているいくつかのパラメータを持っている sklearn.neighbors.KNeighborsClassifier(n_neighbors=5, weights='uniform', algorithm='auto', leaf_size=30, p=2, metric='minkowski', metric_params=None, n_jobs

    0

    1答えて

    クラスタ化されたドキュメントのセットがあります。各ドキュメントにはラベルが付いています。私はこれに基づいて分類器を作って訓練してテストして、うまく動作するようにして、新しい文書/テキストを与えると適切なクラスターに落ちたかったのです。だから、私はcountVectorizerを使ってドキュメントをフィーチャに変換しました。私はこのcountVectorizerが、私が提供した一連の文書(1000以

    0

    1答えて

    私は、サンプル行列、トレーニング行列、およびグループ行列を持っています。私は廃止されたknnclassify()関数を使用しました。私はそれをfitcknn()関数に置き換えたいと思います。私はmatlabに新しいです。 fitcknn()メソッドはどのように機能し、コードを動作させるために必要な変更は何ですか?スクリーンショットが添付されています。 enter image description

    0

    1答えて

    データの99行からなるダミーデータが1つあります.1つの列はフリーテキストデータ であり、1つの列はカテゴリーです。それは、顧客サービスまたは非顧客サービスのいずれかに分類されています。 私はRのスクリプトに99行のデータを渡し、コーパスを作成し、データを整理して解析し、DocumentTermMatrixに変換しました。 DTMをデータフレームに変換して見やすくしました。カテゴリを新しいデータフ

    1

    1答えて

    私はk-NNを初めて使用しているため、UCI MLリポジトリのタイタニックデータセットで学ぶことをお勧めします。 私は精度(accs)に基づいて最良のkパラメータを選択する部分に到達しました。しかし、私がRstudioの演習を複製すると、k = 1が得られます。答えはk = 73とする。どこで私は間違えましたか? #load dataset titanic_train<-read.csv("ht