0
私は22465のテスト文書を持っていますが、私はこれを88の異なるトピックに分類しています。 私はpredict_probaを使用して、予測される上位5トピックを取得しています。これらの5つのトピックの精度をどのように印刷することができますか?分類器で上位5のトピックの精度を取得するにはどうすればよいですか?
model1 = LogisticRegression()
model1 = model1.fit(matrix, labels)
y_train_pred = model1.predict_log_proba(matrix_test)
order=np.argsort(y_train_pred, axis=1)
print(order[:,-5:]) #gives top 5 probabilities
n=model1.classes_[order[:, -5:]]
正確性について
z=0
for x, y in zip(label_tmp_test, n):
if x in y:
z=z+1
print(z)
print(z/22465) #This gives me the accuracy by considering top 5 topics
がどのように私は同じように上位5トピックの精度を見つけることができます。
は精度に関しては、これは私がやっている何ですか? Scikitメトリックは、あなたの中に
q=model1.predict(mat_tmp_test)
print(metrics.precision_score(n, q))