2017-12-06 19 views
0

パイプラインを使用してロジスティック回帰を推定しました。スパーク:パイプラインモデルからのMLロジスティック回帰モデルのサマリーの抽出

from pyspark.ml.feature import VectorAssembler 
from pyspark.ml.classification import LogisticRegression 
lr = LogisticRegression(featuresCol="lr_features", labelCol = "targetvar") 
# create assember to include encoded features 
    lr_assembler = VectorAssembler(inputCols= numericColumns + 
           [categoricalCol + "ClassVec" for categoricalCol in categoricalColumns], 
           outputCol = "lr_features") 
from pyspark.ml.classification import LogisticRegression 
from pyspark.ml import Pipeline 
# Model definition: 
lr = LogisticRegression(featuresCol = "lr_features", labelCol = "targetvar") 
# Pipeline definition: 
lr_pipeline = Pipeline(stages = indexStages + encodeStages +[lr_assembler, lr]) 
# Fit the logistic regression model: 
lrModel = lr_pipeline.fit(train_train) 

そして私は、モデルの概要を実行しようとした:ロジスティック回帰を当てはめる前に

私の最後の数行。ただし、以下のコード行:中

trainingSummary = lrModel.summary 

結果:「PipelineModel」オブジェクトには属性「要約」を持っていない

通常の回帰のモデルに含まれている1は、要約情報を抽出することができる方法上の任意のアドバイスパイプラインモデル?

ありがとうございます!

答えて

1

だけの段階からモデルを取得:

lrModel.stages[-1].summary 

モデルは、以前のパイプラインで置き換える-1のインデックスである場合。

関連する問題