こんにちは、基本的にKAFKA + SPARK Streamingを使用して、私たちの論文のTwitter Spamをキャッチしたかったのです。そして私はstreamingKmeansを使いたいと思っていました。私は「LABEL」を渡す必要があるのはなぜストリーミングKmeans Spark JAVA
model.predictOnValues(testData.map(lp => (lp.label, lp.features))).print()
:予測のためのコードの1行があり、このスパークStreamingKmeans Scalaの例(https://github.com/apache/spark/blob/master/examples/src/main/scala/org/apache/spark/examples/mllib/StreamingKMeansExample.scala)で
:しかし、私は非常に初心者や深刻な疑問を持っています特徴 ?私は全体のアイデアが間違っていますか?私たちは "ラベル"を予測したくないのですか?彼らがスパムであるかどうか私のつぶやきを予測する方法は?
predictOn
は先生ありがとうによりpredictOnValues
を交換したいと思います。私は間違いなくこれを試みます。あなたは私の質問をするために私が参加することができるかわいそうな部屋を知っていますか? –答えを受け入れていただきありがとうございます。私はそのような部屋はありませんが、私は、SOはいつも大変な疑問に答えるためにとても開いていると思います –