2012-02-02 6 views
0

私はジャマとコルト(私はJavaでコード)を通過しました。どちらも、行数がcoloumnsの数を超えるような配列を使用することを期待しています。Javaでsvdの問題

しかし、潜在意味解析(LSA)の場合、私は5冊の本があり、合計1000個の奇数語があります。私は、用語の文書の行列を使用すると私は5 * 1000の行列を取得します。

これはうまくいきませんので、私は行列を転置しなければなりません。転置で私は1000 * 5を使用します。私はsvdを実行すると1000 * 5と私は5 * 5のSの行列を取得します。次元削減を実行するには、5 * 5行列が小さく見えます。

何ができますか?

答えて

0

使用しているテキストセグメントのサイズが大きすぎます。文書(列)は、ページまたはテキストの数ページ、おそらく最大の章を表す必要があります。私は段落の大きさも使用しているのを見ました。