0

私は、elasticsearchで索引付けされたドキュメントのLatent Semantic Analysisを実装するために、ここ数日間過ごしました。 最初のステップは、用語 - 文書行列を構築することです。私は入力としてインデックスを取るスタンフォードnlpライブラリを使用すると思う意味lowercasing、ストップワードを削除し、多分stemmingと行列を生成するか、それはちょうどelasticsearch Java APIを使用してそれ?elasticsearchインデックス用のLSAの実装

答えて

0

はい、_analyze elasticsearchのエンドポイントを使用して、テキストにtokenizing/character mapping/stemming/...を実行して結果を返すことができます。

関連する問題