0
私は、elasticsearchで索引付けされたドキュメントのLatent Semantic Analysisを実装するために、ここ数日間過ごしました。 最初のステップは、用語 - 文書行列を構築することです。私は入力としてインデックスを取るスタンフォードnlpライブラリを使用すると思う意味lowercasing、ストップワードを削除し、多分stemmingと行列を生成するか、それはちょうどelasticsearch Java APIを使用してそれ?elasticsearchインデックス用のLSAの実装