2012-02-22 7 views
1

いくつかのSciPy関数は、 "scipy.spatial.distance.pdistによって返される凝縮距離行列"を取ると文書化されています。ここで、pdistが返すものは、距離行列の上側の対角線部分の行主要な1次元配列形式です。これはすべてうまくいいですし、自然で明白ですが、どこに文書化されているか定義されていますか?私はむしろ突然変化するデータ構造については何も想定していません。 (与えられた、それは変更する可能性のあるものはたくさんありませんが、マトリックスのようなインデックスを可能にするオブジェクトに配列をラップすることも可能性があります)。SciPyの凝縮距離マトリックスのフォーマット/構造は安定していますか?

答えて

1

正直なところ、 scipyユーザーまたはdevリスト、それはscipyの将来計画についてです。

しかし、構造体は、ドキュメントの文字列では、scipy.spatial.pdistscipy.spatial.squareformの両方についてかなり厳密に文書化されています。

など。 pdistのために:

Returns a condensed distance matrix Y. For 
    each :math:`i` and :math:`j` (where :math:`i<j<n`), the 
    metric ``dist(u=X[i], v=X[j])`` is computed and stored in the 
    :math:`ij`th entry. 

    See ``squareform`` for information on how to calculate the index of 
    this entry or to convert the condensed distance matrix to a 
    redundant square matrix. 

これのBecuase、およびscipy.spatialで非常に多くの他の機能は、この形式の距離行列を期待しているという事実、私は真剣に減価償却の警告やアナウンスの数なしに変更になるだろう疑うだろう。 scipy自体に

モジュール(のscikitsをscipyのダウンロードではなく)かなり安定しており、変更が行われたときに後方互換性に入れ対価の大きな取引があります(そして、このため、従来の「嫌なもの」でのかなりがありますscipy:例えば、コアのscipyモジュールがいくつかの関数でデフォルトが異なるnumpyに過ぎないという事実)。

+0

ありがとうございます!私はこの質問がscipyメーリングリストにもっと適していることに同意しますが、あなたがここで答えを出すのは確かに十分で、私が望んでいたものです。 – gspr

関連する問題