2016-12-08 10 views
1

の精度、リコール、Fスコアと同じ値を取得する分類問題のロジスティック回帰を実装しました。私は精度、リコール、F1スコアで同じ値を得ています。同じ価値があるのは大丈夫ですか?意思決定ツリーとランダムフォレストの実装にもこの問題があります。精度、リコール、F1スコアも同じ値を得ました。Apache Sparkのロジスティック回帰アルゴリズム

// Run training algorithm to build the model. 
     final LogisticRegressionModel model = new LogisticRegressionWithLBFGS() 
       .setNumClasses(13). 
       run(data.rdd()); 
//Compute raw scores on the test set. 
     JavaRDD<Tuple2<Object, Object>> predictionAndLabels = testData.map(
       new Function<LabeledPoint, Tuple2<Object, Object>>() { 
        public Tuple2<Object, Object> call(LabeledPoint p) { 
         Double prediction = model.predict(p.features()); 
         return new Tuple2<Object, Object>(prediction, p.label()); 
        } 
       } 
     ); 
// Get evaluation metrics. 
     MulticlassMetrics metrics = new MulticlassMetrics(predictionAndLabels.rdd()); 
     double precision = metrics.precision(); 
     System.out.println("Precision = " + precision); 

     double recall = metrics.recall(); 
     System.out.println("Recall = " + recall); 

     double FScore = metrics.fMeasure(); 
     System.out.println("F Measure = " + FScore); 

答えて

1

私も同じ問題に直面しています。私は決定木、ランダムな森林、GBTを試しました。毎回、同じ精度、リコール、F1スコアを取得します。精度も同じです(混同行列によって計算されます)。

私は自分の公式と書かれたコードを使って精度、精度、リコール、F1スコアの測定値を取得しています。

from pyspark.ml.classification import RandomForestClassifier 
from pyspark.mllib.evaluation import MulticlassMetrics 

#generate model on splited dataset 
rf = RandomForestClassifier(labelCol='label', featuresCol='features') 
fit = rf.fit(trainingData) 
transformed = fit.transform(testData) 

results = transformed.select(['prediction', 'label']) 
predictionAndLabels=results.rdd 
metrics = MulticlassMetrics(predictionAndLabels) 

cm=metrics.confusionMatrix().toArray() 
accuracy=(cm[0][0]+cm[1][1])/cm.sum() 
precision=(cm[0][0])/(cm[0][0]+cm[1][0]) 
recall=(cm[0][0])/(cm[0][0]+cm[0][1])` 
print("RandomForestClassifier: accuracy,precision,recall",accuracy,precision,recall) 
+0

使用した式やコードを示す方が便利です。 –

+0

あなたの答えは本当に有用ではありません。コードを追加して説明してください。 –

関連する問題