は、あなたの結果を評価するためにMLlibを使用しようとしました。
私は、あなたがここでデモを見ることができますMLlib
でMulticlassMetricsを使用し、RDDにデータセットを変換しました:Spark DecisionTreeExample.scala
private[ml] def evaluateClassificationModel(
model: Transformer,
data: DataFrame,
labelColName: String): Unit = {
val fullPredictions = model.transform(data).cache()
val predictions = fullPredictions.select("prediction").rdd.map(_.getDouble(0))
val labels = fullPredictions.select(labelColName).rdd.map(_.getDouble(0))
// Print number of classes for reference.
val numClasses = MetadataUtils.getNumClasses(fullPredictions.schema(labelColName)) match {
case Some(n) => n
case None => throw new RuntimeException(
"Unknown failure when indexing labels for classification.")
}
val accuracy = new MulticlassMetrics(predictions.zip(labels)).accuracy
println(s" Accuracy ($numClasses classes): $accuracy")
}
はあなたに感謝、これはRDDベースであり、それは「mllibを使用しています" としょうかん。私はデータフレームとデータセットと "ml" libを扱います。 – user3309479
ああ申し訳ありません。この[リンク](https://www.mapr.com/blog/predicting-breast-cancer-using-apache-spark-machine-learning-logistic-regression)をチェックしてください。私はmlにあまり慣れていない。 – Darshan