2017-10-12 14 views
0

私はgensim library for word2vecを使用しています。無関係なテキストの例についてモデルを訓練したいと思います。たとえば、「猫は茶色です。何時ですか?」しかし私は、モデルが同じ文脈で、「何を」「ブラウン」としていることを前提としているかどうか思ったんだけど、異なる文脈を持つgensim

[["The", "cat", "is", "brown"], ["What", "time", "is", "it"]]

私はモデルを次のように入力を作成しました。

apiで答えを見つけようとしましたが、見つかりませんでした。

答えて

0

gensim APIは、同じコンテキストで "brown"と "What"を考慮しません。不均一なウィンドウは、文境界の近くで使用されます。ウィンドウサイズがのが1であるとしましょうあれば、あなたの例のために、(コンテキスト、ターゲット)のペアは、以下のように次のようになります。

([cat],The), ([The,is],cat), ([cat,brown],is), ([is],brown) ([time],What), ([What,is],time), ([time,it],is), ([is],it)

を私はこれがあなたの疑問をクリア願っています。

関連する問題