2016-05-03 12 views
3

にDecisionTreeClassifierからtoDebugStringをゲット私はこの1つのようなパイプラインを使用してDecisionTreeClassifierモデルを訓練しました。私は今、モデルの精度を評価することができます。たとえば、PySpark ML

mc_evaluator = MulticlassClassificationEvaluator(
labelCol="target_idx", predictionCol="prediction", metricName="precision" ) 

accuracy = mc_evaluator.evaluate(predictions) 
print("Test Error = {}".format(1.0 - accuracy)) 

などがあります。今、ツリーモデルの構造をチェックする必要があります。ドキュメントではtoDebugStringという属性を指していますが、ML DecisionTreeClassifierにはこれがありません.MLLib DecisionTreeクラシファイアのみの属性のようです。 MLバージョンからパイプライン内のモデルからツリー構造を取得してプロットするにはどうすればよいですか?

+0

問題:https://issues.apache.org/jira/browse/SPARK-15092 – Ivan

答えて

2

これはpysparkに私の仕事:オープン

model.stages[2]._call_java('toDebugString') 
+0

をこれが今の良い回避策です。私が提出したJIRAは、これらのケースを処理するためにいくつかの変更を開始しました。あなたはここに歴史をたどることができます:https://github.com/apache/spark/pull/12919/commits/91c293af911d173670fb71857a38601745322285 – Ivan