2016-07-20 2 views
1

私のDoc2Vecトレーニングモデルで簡単に評価するために、400次元ベクトルを2次元に変換し、ドキュメントをノードのセットとして視覚化する必要があります。任意の2つのノード間の距離はそれらの類似性に反比例する(非常に似ているノードは互いに接近している)。Python - Sklearn MDSクラスを使用して2DでDoc2Vec多次元ベクトルを視覚化する

検索の結果、MDS(多次元スケーリング)とsklearn MDSライブラリが見つかりました。

今私はそれぞれが400次元を持っている2.2Mのベクトルを持っていますが、どのようにして最低のコストで正しい構文でMDS関数をスケルトンに渡すことができるのか分かりません。私は2.2Mのベクトル間の類似性行列を作成することは不可能であることを知っている。

答えて

0

私は、比較的小さなデータセットであっても、MacBook Proで作業している間に、Doc2Vecの次元数を(デフォルトでは100から30に)減らすことが絶対的に重要であることを発見しました。

Thisは、(tSNEの削減と古くなったインターフェースではあるが)良い出発点であった。

関連する問題