pdist

    0

    1答えて

    私は、配列の距離行列を計算するためにscipyでpython 2.7を使用しています。 返された凝縮行列で希望の距離値を見つける方法がわかりません。 from scipy.spatial.distance import pdist import numpy as np a = np.array([[1],[4],[0],[5]]) print a print pdist(a) が [

    1

    1答えて

    私は時系列をクラスタリングしようとしています。クラスタ内要素は同じ形状であるが、スケールが異なる。したがって、クラスタリングのメトリックとして相関測度を使用したいと考えています。相関やピアソン係数の距離を試しています(提案や代替は大歓迎です)。 しかし、distにいくつかのNaN値があるため、Z = linkage(dist)を実行すると、次のコードでエラーが返されます。これは、別の方法として虚偽

    -2

    1答えて

    私はpythonでpdist関数に問題があります。私はそれらの間の距離を求めたい点の座標を持っていますが、それらを座標とみなして座標ではなく2つの点の間の距離を見つけません(座標ではなく十進数としての座標を考慮します)。私はこれまでこの問題を解決する方法を見つけることができませんでした。どんな助けもありがとうございます。言い換えれば、私は自分の座標に何か変換を加えるべきですか?ここではサンプルコー

    0

    2答えて

    pdistを使用して質問がありましたら、アドバイスをいただければ幸いです。 pdist(D)は、通常、複数次元の距離の合計を返しますが、距離を別々に取得したいと考えています。例えば、データセットSが10 * 2のマトリックスで、別に距離を得るためにpdist(S(:,1))とpdist(S(:,2))を使用していますが、データに多数のディメンションがある場合は非常に非効率的です。これをより効率的に

    1

    1答えて

    私は非常に大きなサイピーススパースcsrマトリックスを持っています。これは100,000×2,000,000次元の行列です。それをXとしましょう。各行は、2,000,000次元の空間内のサンプルベクトルです。 サンプルの各ペア間のコサイン距離を非常に効率的に計算する必要があります。私はXのベクトルのサブセットでsklearn pairwise_distances関数を使用しています。これは、稠密な

    2

    1答えて

    この質問再開:Compute the pairwise distance in scipy with missing values テストケースを:(ユークリッド距離を使用して)私は一緒にグループ化され、異なる長さのtahtと直列の対距離を計算したいと私は最も効率的な可能な方法でそれをしなければなりません。それはこれをすることができ作業になり 片道: import pandas as pd im