knn

0熱

1答えて

初心者データ科学ここに。私は高次元のデータセットを持っています。 2308の寸法を持つ83のサンプルがあり、その形状は（83,2308）である。さらに、長さ83のサンプルタイプの配列を持ち、その形状は（83、）です。私は元のデータセットのサブセットでKNNクラシファイア（2人の隣人）を訓練し、それを使って残りのデータポイントのサンプルタイプ（テストサブセット）を予測しようとしています。私の訓練

0熱

1答えて

マルチスレッドプログラム内の最近隣のk個

分類される必要があるトレーニングセットとテストポイントTが与えられている。トレーニングセットをn個の部分に分割すると、各部分でknnアルゴリズム（k = 1）を実行します。その後、各パートの結果を比較します。トレーニングセット全体を通して1-nnを実行した場合と同じ結果が得られますか？ n = 4.トレーニングセットを4つに分割するトレーニングセットの4つの部分で1-nnアルゴリズムを実行した

2熱

1答えて

k最近傍分類器numpyを使用

私は自分のkNN分類子を実装しようとしています。、私はループのいずれかを使用していない場合は def euclidean_distance(X_train, X_test): """ Create list of all euclidean distances between the given feature vector and all other featur

0熱

1答えて

kNNクラシファイアの性能（スピード）向上

割り当てとして、私は自分のkNNクラシファイアをforループを使用せずに作成する必要があります。私はscipy.spatial.KDTreeを使用して、テストセット内の各ベクトルの最近隣を見つけました。次に、scipy.stats.modeを使用して予測クラスのリストを返します。しかし、セットのサイズが非常に大きい場合、これは非常に長くかかる。例えば、私はthis page import nump

-1熱

1答えて

ユークリッド距離を使ってデータのクラスを予測するK-nn R

ユークリッド距離を使ってデータのクラスを予測する学習セットにk-nnを適用したいと思います。は、私はあなたがclassパッケージにknn()機能を試すことができ、この方法

0熱

1答えて

Sklearn GridSearchCVは、エスティメータのパラメータの可能なすべてのデフォルトオプションを実行しますか？ scikit学習における

アルゴリズム、オプションのデフォルトの範囲を持っているいくつかのパラメータを持っている sklearn.neighbors.KNeighborsClassifier(n_neighbors=5, weights='uniform', algorithm='auto', leaf_size=30, p=2, metric='minkowski', metric_params=None, n_jobs

0熱

1答えて

クラシファイアアルゴリズムを使用して単一テキストを分類する方法

クラスタ化されたドキュメントのセットがあります。各ドキュメントにはラベルが付いています。私はこれに基づいて分類器を作って訓練してテストして、うまく動作するようにして、新しい文書/テキストを与えると適切なクラスターに落ちたかったのです。だから、私はcountVectorizerを使ってドキュメントをフィーチャに変換しました。私はこのcountVectorizerが、私が提供した一連の文書（1000以

0熱

1答えて

matlabの古くなったknnclassify（）関数を新しいfitcknn（）関数に置き換えるにはどうすればいいですか？

私は、サンプル行列、トレーニング行列、およびグループ行列を持っています。私は廃止されたknnclassify()関数を使用しました。私はそれをfitcknn()関数に置き換えたいと思います。私はmatlabに新しいです。 fitcknn()メソッドはどのように機能し、コードを動作させるために必要な変更は何ですか？スクリーンショットが添付されています。 enter image description

0熱

1答えて

KNNを使用してRを生産

データの99行からなるダミーデータが1つあります.1つの列はフリーテキストデータであり、1つの列はカテゴリーです。それは、顧客サービスまたは非顧客サービスのいずれかに分類されています。私はRのスクリプトに99行のデータを渡し、コーパスを作成し、データを整理して解析し、DocumentTermMatrixに変換しました。 DTMをデータフレームに変換して見やすくしました。カテゴリを新しいデータフ

1熱

1答えて

k-NNの精度が間違っています

私はk-NNを初めて使用しているため、UCI MLリポジトリのタイタニックデータセットで学ぶことをお勧めします。私は精度（accs）に基づいて最良のkパラメータを選択する部分に到達しました。しかし、私がRstudioの演習を複製すると、k = 1が得られます。答えはk = 73とする。どこで私は間違えましたか？ #load dataset titanic_train<-read.csv("ht