私の仕事は、利用可能なタグのリストから文書や投稿にタグ(説明的な単語)を割り当てることです。私はGensimのDoc2vecで作業しています。 doc2vecを文書のタグ付けに使用できることを読んでいます。しかし、私はこのタスクのための適切なパラメータ値を得ることができませんでした。これまで、私は 'size'と 'window'という名前のパラメータの値を変更してテストしました。私が得ている結果はあまりにもナンセンスであり、またこれらのパラメータの値を変更することによって結果に傾向が見いだせません。つまり、一部の値が少し改善され、一部の値が下がってしまいます。誰もがこのタスクのために適切なパラメータ値が何を示唆することができますか?私は十分な訓練データがあれば 'サイズ'(特徴ベクトルならばサイズを定義する)が大きくなければならないことを発見しました。しかし、残りのパラメータについては、私は確信していません!ドキュメントタグ付けのためのDoc2vecのパラメータ値 - Gensim
0
A
答えて
0
どのパラメータが最適なのかは、トレーニングデータのサイズ&のサイズ、およびダウンストリームの目標とまったく同じです。
gensimのデフォルト値は、最初の推測値が妥当か、他の誰かが同様のデータセット/問題で正常に使用したことを確認した値です。
しかし実際には、保持されているテストセットに基づいた自動評価を作成し、Doc2Vec
のパラメータを最適な範囲/組み合わせのパラメータの多くの小さな調整を検索してメタ最適化することによって理想的に実験する必要があります。
関連する問題
- 1. gensim doc2vecのサイズパラメータは、
- 2. モデルのためのGensim Doc2Vec巨大なファイルを生成する
- 3. Gensim word2vec/doc2vecマルチスレッド並列クエリ
- 4. doc2vec/gensim - エポックでシャッフル文章の問題
- 5. Doc2Vec Gensimドキュメントとトピックの類似点
- 6. Gensim Doc2Vec - Doc2Vec関数にコーパス文を渡す
- 7. doc2vec - doc2vec訓練とinfer_vectorのための入力形式()のpython
- 8. gensim doc2vecは、私がgensim PythonライブラリにDoc2Vecモデルを使用しています非決定結果
- 9. gensimのdoc2vec(PV-DM)のドキュメント・ベクトルの更新
- 10. Gensim Doc2Vecモデルは、私だけが私の特徴ベクトルを生成するgensim <strong>Doc2Vec</strong>モデルを使用していますベクトル
- 11. python gensim doc2vecの元の文章を取得するtaggedlinedocument
- 12. gensim Doc2Vecモデルのトレーニング文書を更新する
- 13. GensimパッケージからDoc2Vecの出力を理解する
- 14. Gensim Doc2Vec例外はAttributeError:「str」はオブジェクトが属性の言葉 "
- 15. gensimのDoc2Vec関数の "size"パラメータをどのように解釈すればよいですか?
- 16. Doc2vec Gensim:各エポック中に単語埋め込みが更新されない
- 17. gensim 0.11.1でDoc2Vecからドキュメントベクターを取得するには?
- 18. gensim Doc2Vecから単語ベクトルを取得するには?
- 19. 大きなDataFrameにGensim Doc2vec infer_vector()を使用するには?
- 20. Gensim Doc2vecモデルがK平均にクラスタリングする
- 21. Gensimセグメンテーションフォールト
- 22. Doc2vecとword2vecのマイナスサンプリング
- 23. doc2vecクラスタリングn * nドキュメント間の類似性
- 24. gensim doc2vecを分類に使用することは可能ですか
- 25. gensimでpre-trainedモデルを読み込み、doc2vecでトレーニングする方法は?
- 26. 'utf-8' codec error while doc2vec
- 27. キー値をコピー/貼り付けするためのelseステートメント
- 28. Doc2VecモデルPython 3との互換性
- 29. doc2vecモデルの読み込み中にEOFErrorが発生しました
- 30. pythonのパラメータのデフォルト値はargsかkwargsで受け付けられますか?