初めてDoc2Vecを使用しています 著者の作品を分類しようとしています。私はLabeled Sentences(段落、または指定された長さの文字列)を持つモデルを訓練しました。words =段落の単語のリスト、およびtags = authorの名前です。私の場合、私は2人の著者しか持たない。 訓練されたモデルからdocvecs属性にアクセスしようとしましたが、モデルを訓練したときの2つのタグに対応する2つの要素しか含まれていません。私は訓練にフィードした各段落のdoc2vec numpy表現を取得しようとしていますので、後でそれを訓練データとして使用できます。これどうやってするの?おかげさまで 各文書の訓練されたDoc2Vecモデルからnumpyベクトルを取得する
0
A
答えて
0
バルクトレーニングは、指定したタグのベクトルのみを作成します。 (model.docvecs['paragraph000']
のように)段落ごとに大量に訓練されたベクトルを読みたい場合は、訓練中に各段落に固有のタグを付ける必要があります('paragraph000'
など)。ドキュメントに他のタグを付けることもできますが、一括トレーニングのみが、提供されたタグのドキュメントベクトルを記憶しています。
トレーニング終了後、infer_vector()
に提供する他のテキストのベクトルを推論することができます。もちろん、トレーニング中に使用されたのと同じ段落を入力することもできます。
関連する問題
- 1. doc2vec用に事前に訓練されたword2vecモデルをロードする
- 2. doc2vec - doc2vec訓練とinfer_vectorのための入力形式()のpython
- 3. Azureマシンスタジオから訓練されたモデルをダウンロードするには?
- 4. 訓練中にmin_countが1に設定されていても、Doc2VecモデルのKeyError
- 5. テンソルフローで訓練されたモデルからテストデータセットの予測を得る方法
- 6. 3Dモデルから訓練されたモデル(機械学習)を作成する
- 7. ケラス - 訓練されたレイヤの重みを取得する
- 8. Catboostから訓練された樹木を得るには?
- 9. Amazon Webサービス:非csvデータを使用して訓練されたモデルを取得
- 10. tensorflow:訓練されたモデルを保存/復元する方法
- 11. Rパッケージに訓練されたモデルを保存する
- 12. Sparkで訓練されたWord2Vecモデルをロードする
- 13. 訓練されたRandomForestClassificationModelモデルをロードするには?
- 14. KeyError例外私は2つの機能を備えたLinearRegressorを訓練している訓練されたモデル
- 15. 訓練されたKerasモデルをロードしてトレーニングを続ける
- 16. Theano/lasagne:訓練されたモデルで予測する方法
- 17. gensim Doc2Vecから単語ベクトルを取得するには?
- 18. 訓練された文字レベルのLSTMモデルを使ってテキストを生成
- 19. Sparkでの訓練されたcrossValidationモデルの読み込み
- 20. 事前に訓練されたウエイトを持たずにtensorflowで書かれたAlexNetモデルはありますか?
- 21. 訓練されたSVMをscikit-learnからOpenCVにインポートする
- 22. Tensorflow:C++で訓練されたモデルを使用
- 23. MALLETで訓練されたLDAモデルの奇妙なperplexity値
- 24. 訓練されたモデルの配布方法は?
- 25. 単数ではなく複数で訓練されたCRFモデル
- 26. 分類器から訓練特徴名のリストを取得
- 27. 訓練されたモデル上で新しい目に見えない文書の境界値または混乱値を取得する方法は?
- 28. 「Show and Tell:A Neural Image Caption Generator」の事前訓練モデルを取得する場所
- 29. CNTK:訓練されたモデルデータへのアクセス
- 30. doc2vec - 文書のベクトルをより速く推論する方法
私は実際にそれを理解し、あなたが言ったように段落番号をタグとして使用しています。 (1著者あたり10000ベクトル)私は両方の著者のためにこれを行い、それとsvmモデル(sklearn)を訓練する。しかし、それらの数字のdocvec配列をベクトルとして使うと、恐ろしい精度を得ます。〜50%。私は73%のnltk pos_tagを持っていますので、何か間違ったことをする必要があります。 –
ありがとうございました。私は私の段落にinfer_vectorを使って、バイナリ分類タスクで93.28%の精度を得ています!! ;) –