2016-11-19 25 views
0

私は文の類似性アルゴリズムを実装したいと思います。それはシーケンス予測アルゴリズムを使用して実装することは可能ですか?どのようなアプローチが可能か、文章類似アルゴリズムに適した方法があれば、あなたの意見を分かち合いましょう。文の類似性アルゴリズムへのアプローチ

答えて

2

文章を別々の文書として扱い、文書間の類似性を見つける従来の方法を使用することができます。ここでsklearnを使って答えました: Similarity between two text documents もしあなたが望むなら、tensorflowで同じコードを試してみてください。

私も強く、より洗練されたアプローチをカバーし、この答えを読むことをお勧めします。https://stackoverflow.com/a/15173821/3633250

+0

を見つけるには、あなたが言及した最初のリンクにかかわらず、情報マキシム.Oneより質問のおかげで、解決策はword2vec変換に似て言及しているべきです私は、配列予測を使用する考えを落とします。 – Aniruddh

+0

@Aniruddh申し訳ありませんが、私はあなたの第二の質問に従わなかった - 元の質問では、シーケンス予測については何もありません。 –

1

あなたはDoc2Vecの使用を検討できます。各文章(文書)は、n次元空間にマップされます。最も類似文書

model.most_similar(“documentID”)

Reference

関連する問題