0
パイプラインを使用してロジスティック回帰を推定しました。スパーク:パイプラインモデルからのMLロジスティック回帰モデルのサマリーの抽出
from pyspark.ml.feature import VectorAssembler
from pyspark.ml.classification import LogisticRegression
lr = LogisticRegression(featuresCol="lr_features", labelCol = "targetvar")
# create assember to include encoded features
lr_assembler = VectorAssembler(inputCols= numericColumns +
[categoricalCol + "ClassVec" for categoricalCol in categoricalColumns],
outputCol = "lr_features")
from pyspark.ml.classification import LogisticRegression
from pyspark.ml import Pipeline
# Model definition:
lr = LogisticRegression(featuresCol = "lr_features", labelCol = "targetvar")
# Pipeline definition:
lr_pipeline = Pipeline(stages = indexStages + encodeStages +[lr_assembler, lr])
# Fit the logistic regression model:
lrModel = lr_pipeline.fit(train_train)
そして私は、モデルの概要を実行しようとした:ロジスティック回帰を当てはめる前に
私の最後の数行。ただし、以下のコード行:中
trainingSummary = lrModel.summary
結果:「PipelineModel」オブジェクトには属性「要約」を持っていない
通常の回帰のモデルに含まれている1は、要約情報を抽出することができる方法上の任意のアドバイスパイプラインモデル?
ありがとうございます!