ためにScalaでロジスティック回帰を実行するにはは、私は以下のようにデータファイルを読んだどのようにDATAFRAME
val df = sqlContext.read.format("com.databricks.spark.csv").option("header", "true").load("D:/ModelData.csv")
+---------+---------+---+-----+-------+
|c1 | c2 |c3 | c4 | c5 |
+---------+---------+---+-----+-------+
| 1| 1| 13| 100| 1|
| 1| 1| 13| 200| 0|
| 1| 1| 13| 300| 0|
+---------+---------+---+-----+-------+
それではモデルへの私の入力はC5とC4です(C1、C2、C3のすべてのために同じです。行)
val df3=df.select("c5", "c4")
val lr = new LogisticRegression()
.setMaxIter(10)
.setRegParam(0.3)
.setElasticNetParam(0.8)
val lrModel = lr.fit(df3)
val trainingSummary = lrModel.summary
println(trainingSummary)
しかし、これは動作していないようです。何も表示されません。何か助けていただければ幸いです。
なぜあなたは機能としてラベルを使用しないのですか?教師付きモデリングの目的は、ラベルを決定することです。機能としてそれを使用することは私には意味がありません。 – Rumo
これはあなたがフローを理解するのを助けるための単なる例でした。ラベル以外の他の値を使うことができます。 –
@Rumo私は自分の答えを更新しました。 :)今それはうまくいくはずです。ではない? –