私はSimpleTagger
チュートリアルhereを提供しようとしていました。私は、すなわちマレットSimpleTaggerの異なる数の述語
java -cp "class:lib/mallet-deps.jar" cc.mallet.fst.SimpleTagger --train true --model-file nouncrf sample
と
java -cp "class:lib/mallet-deps.jar" cc.mallet.fst.SimpleTagger --model-file nouncrf stest
ページで提供されるとまったく同じコマンドを実行しました。
ここに私のsample
とstest
ファイルがあります。
$ cat sample
Bill CAPITALIZED noun
slept non-noun
here LOWERCASE STOPWORD non-noun
$ cat stest
CAPITAL Al
slept
here
しかし、私の出力は、そのページ上のものと異なっています。これは私が得る出力です。
Number of predicates: 9
noun
non-noun
non-noun
私の質問は、 "述語の数" とは何を意味しない
- ですか?
- なぜ9つの述語が得られるのに対し、公式ソースは同じ入力ファイルに対して5つの述語を主張しますか?
私はマレット2.0.8を使用しています。あなたがトレーニングを開始すると
もし私がそれを助けるならば、私は9も得ます – user1893354