2016-04-30 15 views
0

こんにちは、基本的にKAFKA + SPARK Streamingを使用して、私たちの論文のTwitter Spamをキャッチしたかったのです。そして私はstreamingKmeansを使いたいと思っていました。私は「LABEL」を渡す必要があるのはなぜストリーミングKmeans Spark JAVA

model.predictOnValues(testData.map(lp => (lp.label, lp.features))).print()

:予測のためのコードの1行があり、このスパークStreamingKmeans Scalaの例(https://github.com/apache/spark/blob/master/examples/src/main/scala/org/apache/spark/examples/mllib/StreamingKMeansExample.scala)で

:しかし、私は非常に初心者や深刻な疑問を持っています特徴 ?私は全体のアイデアが間違っていますか?私たちは "ラベル"を予測したくないのですか?彼らがスパムであるかどうか私のつぶやきを予測する方法は?

答えて

0

予測については、lp.featuresが使用されますが、lp.labelは、引き継がれるキーとみなされます。 docsからの引用:

このモデルを使用して、DStreamの値を予測し、そのキーを引き継ぎます。私はあなたの例では推測

あなたは単に

+0

predictOnは先生ありがとうによりpredictOnValuesを交換したいと思います。私は間違いなくこれを試みます。あなたは私の質問をするために私が参加することができるかわいそうな部屋を知っていますか? –

+0

答えを受け入れていただきありがとうございます。私はそのような部屋はありませんが、私は、SOはいつも大変な疑問に答えるためにとても開いていると思います –

関連する問題