2017-07-21 7 views
-3

具体的に言えば、NLPの問題を扱っており、LSTMを単語の最初のシーケンスが与えられたときに単語予測に訓練しています。私のデータセットは200k redditのコメントです。私は彼らがシーケンス(許可しない繰り返し)に送り込む場合 ディープ・ラーニング・モデルのトレーニングでは、入力するデータセットの要素の順番が重要ですか?

は、それは私がランダムに時間(繰り返し入力が可能)で、例の1を供給 場合は問題かいますか?

+0

ここに例がありますか?単語?または全体のシーケンス? – lejlot

+0

例は全体のコメント、単語のシーケンスです。 –

+0

はタスクによって異なります。どのような作業が正確ですか? – langkilde

答えて

0

データは実際には一連のコメントなので、シーケンスで処理する必要はありません。実際、通常は、ネットワークが順序に依存するものを学習しないように、ランダムな順序でデータを処理する方が良いです。反復は、一様にサンプルする限り、まったく問題ではありません。

関連する問題