2016-09-08 19 views
0

NERモデルを指定されたhereとしてトレーニングする方法を知っており、実際には非常に成功しています。私はまた、hereについて話したように、3つのカシューレスモデルについて知っています。しかし、私が自分のカジュアルなモデルを鍛えたいのであれば、そのトリックは何ですか?トレーニングのために大文字の文書がたくさんある。私は同じトレーニングプロセスを使用しているのですか、またはカスレスモデルに特別な/異なる機能があるのですか、または設定が必要なプロパティがありますか?私は、提供されたケースレスモデルがどのように作成されたかについての説明を見つけることができません。スタンフォードcorenlpでcaseless NERモデルをトレーニング

+0

ところで、動的分類ではd文書や文章は大文字と小文字が混在しており、適切なモデルに切り替えることができます。 – demongolem

答えて

2

私たちのモデルにはプロパティの変更が1つしかありません。これは、単語が分類のために処理される前に大文字小文字の情報を削除する関数を呼び出させたいということです。

wordFunction = edu.stanford.nlp.process.LowercaseAndAmericanizeFunction

単にもあります:私たちは(また、アメリカの綴りにいくつかの単語をマッピングし)、このプロパティの値であることを行う

文書フォーマットを決定するためのより多くの自動ものを持っ

wordFunction = edu.stanford.nlp.process.LowercaseFunction

(ハード/ソフトの改行)、大文字または小文字の言語はいいですが、現時点ではこれらのものはありません。

関連する問題