2016-05-03 13 views
0

Matlabでnntoolを使用した神経トレーニングネットワークを開発しています。異なる長さのテキストファイルを入力すると11250個(10から500語まで)、冗長性を排除すれば10から200語単語)、私は私のトレーニングアルゴリズムを実行するためのデジタルデータとしてこの入力テキストを表現する良い方法を見つけることができませんでした。 私は単語の語彙を作成することを考えましたが、その語彙には16000個の巨大な単語が含まれていることがわかりました。いくつかのテキストファイルには共通の単語がいくつかあります。神経訓練ネットワークのテキスト表現

+1

あなたのニューラルネットワークの全体的な目標は何ですか?期待される出力は何ですか?これがスパム分類器であれば、語彙のサイズであるバイナリベクトルは、0/1が特定の単語の存在を示しています。通常行われていることです。 – rayryeng

答えて

関連する問題