2017-05-23 16 views
1

私はcoreNLPを使ってセンチメント分析に取り組んでいます。私自身のデータセットでトレーニングに関する質問がありました。誰かが私に何か考えを与えることができれば大きな助けになります。スタンフォードコアNLPセンチメント分析:自分のデータを使ったトレーニング

dev.txtとどのようなデータを、私は、このファイルに追加する必要があります何ですか?

java -mx8g edu.stanford.nlp.sentiment.SentimentTraining -numHid 25 -trainPath train.txt -devPath dev.txt -train -model model.ser.gz 

もの独自のデータセットを訓練するためにhttps://nlp.stanford.edu/sentiment/code.htmlによると、また、クラスPTBTokenizerを確認しましたが、データを訓練できるようにtext2PTBトークンが見つかりませんでしたか?

私のデータでどのように訓練できますか?例えば、試験データ

  • ため

    この世界は「ポジティブ」

  • は「この世界は悪い人でいっぱいです」「とても美しいです「
  • 」」ニュートラル「私はまったく悲しいありませんよ」 "ネガティブ"
+0

これは少し詳細ですが、私はあなたが 'coreNLP'を意味すると信じています。 – JJoao

答えて

0

私は呼んで私の作品の答えを見つけた

java -cp "*" -mx5g edu.stanford.nlp.sentiment.BuildBinarizedDataset -input sample.txt 

sample.textにはトレーニングデータが含まれています 例 1今日は楽しい1日です。これは

(1(1今日)(1(1(1(1が生成されます 3良い 3良い日 3良い一日 )(1ではない))(3(1 a)の(3(

関連する問題