1
私はGensimを使用してサイズ4の文章を練習しており、トレーニングデータセットには1192のユニークワードがあります。モデルlen(model.vocab)の単語の数は141ですが、意味がありません。これを見る理由はありますか?どのように私はそれらのモデルを変更することができますトレーニングのすべての単語の鍵を持っている?デフォルト値は5である モデルは= Word2Vecは(窓、min_count = 1)gensimの語彙数はトレーニングデータの語彙数よりもはるかに少ない