2017-05-10 6 views
0

documentationから取った次スパークMLlibコード考えてみましょ予測:私は同じように動作し合う方法がある参照org.apache.spark.ml.regression.LinearRegression:フィット、電車、そして

import org.apache.spark.ml.regression.LinearRegression 

// Load training data 
val training = spark.read.format("libsvm") 
    .load("data/mllib/sample_linear_regression_data.txt") 

val lr = new LinearRegression() 
    .setMaxIter(10) 
    .setRegParam(0.3) 
    .setElasticNetParam(0.8) 

// Fit the model 
val lrModel = lr.fit(training) 

// Print the coefficients and intercept for linear regression 
println(s"Coefficients: ${lrModel.coefficients} Intercept: ${lrModel.intercept}") 

// Summarize the model over the training set and print out some metrics 
val trainingSummary = lrModel.summary 
println(s"numIterations: ${trainingSummary.totalIterations}") 
println(s"objectiveHistory: [${trainingSummary.objectiveHistory.mkString(",")}]") 
trainingSummary.residuals.show() 
println(s"RMSE: ${trainingSummary.rootMeanSquaredError}") 
println(s"r2: ${trainingSummary.r2}") 

を訓練する。しかし、私はAPI docsで予測方法を見つけることができません。

予測機能はありませんか?さて、私は、モデルの係数とモデルの傍受を予測して追加しようとしている点の内積をとって予測を行うことができることを知っています。

しかし、それは、図書館の作家が期待することです。

答えて

1

お探しの方法はtransformです。これはほぼすべてMLモデルの一部です。これは、features.という名前のDataFrameを受け取ります。

+0

「予測」は出力列名ですか? –

関連する問題