文の類似性アルゴリズムへのアプローチ

私は文の類似性アルゴリズムを実装したいと思います。それはシーケンス予測アルゴリズムを使用して実装することは可能ですか？どのようなアプローチが可能か、文章類似アルゴリズムに適した方法があれば、あなたの意見を分かち合いましょう。文の類似性アルゴリズムへのアプローチ

2016-11-19 Aniruddh

文章を別々の文書として扱い、文書間の類似性を見つける従来の方法を使用することができます。ここでsklearnを使って答えました： Similarity between two text documents もしあなたが望むなら、tensorflowで同じコードを試してみてください。

私も強く、より洗練されたアプローチをカバーし、この答えを読むことをお勧めします。https://stackoverflow.com/a/15173821/3633250

2016-11-19 16:25:50

を見つけるには、あなたが言及した最初のリンクにかかわらず、情報マキシム.Oneより質問のおかげで、解決策はword2vec変換に似て言及しているべきです私は、配列予測を使用する考えを落とします。 – Aniruddh

@Aniruddh申し訳ありませんが、私はあなたの第二の質問に従わなかった - 元の質問では、シーケンス予測については何もありません。 –

あなたはDoc2Vecの使用を検討できます。各文章（文書）は、n次元空間にマップされます。最も類似文書、

model.most_similar(“documentID”)

2016-11-22 12:37:01 user799188

答えて