2017-05-08 6 views
1

私はテキスト分類(Naive Bayesで)のためにMALLETを使用していますが、私はこのFeatureSequence2FeatureVector()メソッドがパイプの一部として使用できる特徴ベクトルを作成する方法があることを理解しています。私の質問は、引数なしでFeatureSequence2FeatureVector()を使用し、FeatureSequence2FeatureVector(ブール値x)を使用するときにどの重み付けスキーマが実装されるかです。 2番目のものでは、x = TRUEはBernoulli Naive Bayesになるはずです。しかし、引数がなくx = FALSEのバージョンはどうですか?MALLET - どの加重スキーマですか?

答えて

1

デフォルトでは、FeatureSequence2FeatureVectorは、機能値を生の機能カウントに設定します。たとえば、文字列「犬猫犬は」

{ "dog" 1.0, "cat": 1.0 } 
+0

おかげになります引数として渡す

{ "dog": 2.0, "cat": 1.0 } 

trueにマップされます。 FeatureSequence2FeatureVector()とFeatureSequence2FeatureVector(false)の両方が多項式を実装し、FeatureSequence2FeatureVector(true)がBernoulli Naive Bayesをこの特定のケースで実装すると言ってもいいと思います。右? –

関連する問題