Matlabでnntoolを使用した神経トレーニングネットワークを開発しています。異なる長さのテキストファイルを入力すると11250個(10から500語まで)、冗長性を排除すれば10から200語単語)、私は私のトレーニングアルゴリズムを実行するためのデジタルデータとしてこの入力テキストを表現する良い方法を見つけることができませんでした。 私は単語の語彙を作成することを考えましたが、その語彙には16000個の巨大な単語が含まれていることがわかりました。いくつかのテキストファイルには共通の単語がいくつかあります。神経訓練ネットワークのテキスト表現
0
A
答えて
0
すぐに解決するには、「bag of words」または「tfidf」を探してください。これが何であるかわからない場合は、https://en.wikipedia.org/wiki/Vector_space_modelまたはhttps://en.wikipedia.org/wiki/Document_classificationからここをクリックしてください。
NLPについての書籍はありますか?たぶんこれは価値があるかもしれません:http://www.nltk.org/book/が始まります。
関連する問題
- 1. Tensorflowの2層訓練神経モデルの予測
- 2. どのようにPythonで神経ネットワークを使用して訓練するのですか?
- 3. Neurolabはネットワークを再訓練します
- 4. 乗算Iネットワークを訓練してい
- 5. 人工神経ネットワークの正規化
- 6. 回帰ネットワークを訓練するときのNaNの損失
- 7. 訓練用ニューラルネットワーク
- 8. python wrraper caffeでネットワークを訓練しますか?
- 9. フルバッチ訓練を用いたニューラルネットワークへの手紙画像の訓練
- 10. 神経、フェニックス、GPIO?
- 11. 類似画像訓練セットジェネレータ
- 12. クラシファイアが訓練された後、wekaでテキストを分類する
- 13. ネットワークが訓練されているかどうかを知るには
- 14. テンソルフローの私の神経ネットワーク層のNanのを避ける方法は?
- 15. どのようにmatlabで神経ネットワークのパフォーマンスをスピードアップするには?
- 16. 神経質jQueryのアニメーション
- 17. の神経talk2エラーが:eval.lua
- 18. 私の訓練データ分布の巨大な負の効果を後続の神経回路網分類機能に取り消すには?
- 19. WEKAのMultilayerPerceptron:訓練後、再びトレーニングを
- 20. Tensorflow:訓練ステップ上の遅延変数
- 21. テンソルフロー訓練なし(変更のみバイアス)
- 22. SVMの高速化(モデル訓練)
- 23. CNTK:訓練されたモデルデータへのアクセス
- 24. SegNet - 自分のデータセットを訓練
- 25. 神経ネットワークの最適化が失敗する(Scipy fmin_cgを使用)
- 26. 具体的には、ラムよりも神経ネットワークを鍛える方法は?
- 27. XGboost - 増加訓練誤差 "メイ"
- 28. 特異性を訓練する
- 29. Tensorflow Estimator自己修復訓練オーバーフィットで
- 30. テンソルフロースリム事前訓練されたアレックスネット
あなたのニューラルネットワークの全体的な目標は何ですか?期待される出力は何ですか?これがスパム分類器であれば、語彙のサイズであるバイナリベクトルは、0/1が特定の単語の存在を示しています。通常行われていることです。 – rayryeng