elasticsearchインデックス用のLSAの実装

私は、elasticsearchで索引付けされたドキュメントのLatent Semantic Analysisを実装するために、ここ数日間過ごしました。最初のステップは、用語 - 文書行列を構築することです。私は入力としてインデックスを取るスタンフォードnlpライブラリを使用すると思う意味lowercasing、ストップワードを削除し、多分stemmingと行列を生成するか、それはちょうどelasticsearch Java APIを使用してそれ？elasticsearchインデックス用のLSAの実装

出典

2017-05-19 Sara

はい、_analyze elasticsearchのエンドポイントを使用して、テキストにtokenizing/character mapping/stemming/...を実行して結果を返すことができます。

出典

2017-05-20 15:26:19

elasticsearchインデックス用のLSAの実装

答えて

関連する問題