2016-03-30 7 views
1

私は製品のレビューやツイートなどの短いテキストのセンチメント分類のタスクのためにLSTMモデルをトレーニングしようとしています。ショートテキストのセンチメント分類タスクに必要なトレーニングセットの最小サイズは何ですか

私は肯定/否定/中立というラベルのトレーニングセットを探していますが、実際に人間のタグに基づいており、開始や顔文字ではなく、そこにあるものは無料ですか? Iv'eは小さなトレーニングセットしか見つけず、結果が悪かった。 Iv'eは私のネットワークとスタックされたレイヤのサイズを増やそうとしましたが、改善はしませんでした。

妥当な結果が得られるように、そのようなトレーニングセットの最小サイズは何ですか(F1> 0.8)。

答えて

0

あなたは実際には100個ほどのリストを作成する必要があります。それぞれのリストは、否定的または肯定的な形容詞です。

を参照してください:あなたがそれらを使用する場合
http://na2english.wikispaces.com/file/view/ADJECTIVES%20TO%20DESCRIBE%20FILMS.pdf/400672720/ADJECTIVES%20TO%20DESCRIBE%20FILMS.pdf

http://arxiv.org/ftp/arxiv/papers/1011/1011.4623.pdf

は明らかにそれらを引用するが、言語は無料ですので、あなたの仕事のためにそれらを使用することができます。

あなたが構築するデータベースのサイズより重要性が高いのは、効果を高めるために特定のアプリケーションを対象とする単語を選ぶことでしょう。

このプロジェクトは、特定の商業目的で、またはより一般化された研究努力を目指していますか?

関連する問題