0
私は列車のデータにword2vecを訓練しますが、列車のデータにはないテストデータの単語がいくつかありますので、どのようにして元のようなデータ分布や数値範囲に一致する単語ベクトルを生成できますか?unknow wordのランダムなword2vecベクトルを取得する方法は?
私は列車のデータにword2vecを訓練しますが、列車のデータにはないテストデータの単語がいくつかありますので、どのようにして元のようなデータ分布や数値範囲に一致する単語ベクトルを生成できますか?unknow wordのランダムなword2vecベクトルを取得する方法は?
あなたのボキャブラリーの頻繁でない単語のリストを取って、それらを平均して、未知語のおおよその単語ベクトルを得ることができます。
OR
のは、あなたのターゲット未知語がw
であり、そのc-2
、c-1
、c1
とc2
コンテキスト言葉ですコンテキストc-2 c-1 w c1 c2
以内としましょう。未知語の良い近似として、すべてのコンテキスト単語の埋め込みの平均をとることができます。