2017-05-04 6 views
0

類似性(コサインかもしれない)を使っていくつかの文章をクラスタリングしようとしていて、あらかじめ定義されたクラスにテキストを入れるために分類器を使用しています。Word2vecの分類とクラスタリングテンソルの流れ

私の考えは、テンソルフローを使用して埋め込み単語を生成し、それを各センテンスごとに平均することです。次に、クラスタリング/分類アルゴリズムを使用します。

tensorflowはword2vec生成アルゴリズムを使用する準備ができていますか?

単語モデルのバッグは良い出力を生成しますか?

答えて

1
  • 、tensorflowはすぐに使用word2vecを提供していませんが、それはa tutorial on word2vecを持っていません。

  • はい、単語のバッグ(最先端なく)驚くほど良好な出力を生成することができ、そして驚くほど高速であるという利点を有します。私は少量のデータ(数万文)を持っており、分類のためにF1> 0.90を達成しています。

+0

私はTensorflowについて、word2vecや手袋に使用する準備ができていないことを知りました。彼らはword2vecモデルを実装するためのチュートリアルを提供しました。私はDL4J(JAVA)を見ました。私はそれを守っていきたいと思います。 – LonsomeHell

関連する問題