scikit-learnでNaive Bayes(MultinominalNB)を使用して小さなテキスト(つぶやき)を分類しています。 私の列車データには1000個の機能があり、テストデータには1200個の機能があります。 列車データとテストデータの両方に500の機能が共通しているとします。Naive Bayes目に見えない機能がscikitを処理するlearn
MultinominalNBがscikitで目に見えない機能に対応していない学び、そして私にエラーを与える、なぜ私が疑問に思う:
Traceback (most recent call last):
File "/Users/osopova/Documents/00_KSU_Masters/01_2016_Spring/Twitter_project/mda_project_1/step_4.py", line 60, in <module>
predict_Y = classifiers[i].predict(test_X)
File "/Library/Python/2.7/site-packages/sklearn/naive_bayes.py", line 65, in predict
jll = self._joint_log_likelihood(X)
File "/Library/Python/2.7/site-packages/sklearn/naive_bayes.py", line 672, in _joint_log_likelihood
return (safe_sparse_dot(X, self.feature_log_prob_.T)
File "/Library/Python/2.7/site-packages/sklearn/utils/extmath.py", line 184, in safe_sparse_dot
return fast_dot(a, b)
ValueError: matrices are not aligned