私は朝からかなりのチュートリアルを読んでいます。私の問題は、2つのドキュメント間の類似性を見出すことです。私はこの目的のためにjavaでLSAを使用することを楽しみにしています。LSA - SVDを見つけた後の手順
用語文書行列の作成を理解してから、SVD(Dimensionality reduced)が適用されました。 3行列が結果として得られます。これは馬鹿に聞こえるかもしれませんが、私はかなり長い間このことに固執しています。今、もし私が2つの文書の間の類似点を見つけなければならないとすれば、何をしなければならないのですか?
私は2つのドキュメントだけを比較しているので、LSAを使用すると効果的でしょうか? – CTsiddharth