私は非常に単純なSpark scala word countプログラムをデバッグしようとしました。スパークは「怠け者」なので、「アクション」ステートメントにブレークポイントを置き、そのコード行を実行する必要があると思うので、そのステートメントの前にRDD変数をチェックしてデータを確認することができます。だから、私は14行目にブレークポイントを置いて、そこにデバッグが来たら、私は14行目を実行するためのステップを踏んだ。しかしそれをした後、デバッグセッション変数ビューのvaraibles text1、text2のデータは見えない。私は、デバッグビューの "all"変数内のデータを見ることができます)。私はこの権利をしていますか? text1/text2変数のデータが表示されないのはなぜですか?eclipseでRDD内のデータを見つける場所Spark scala debug session?
これは私がどこかでテキスト2変数ビューで
(aa,2),(bb,1),(cc,2)
などを見ることを期待言葉でテキストファイルAA AA BB CCはCC
です:
は私wordCount.txtはこのようなものですと仮定します。しかし、私はそこのようなものは見つけられません。コードのスクリーンショットを参照してください。
私はeclipse NeonとSpark2.1を使用しています。これはeclipseのローカルデバッグセッションです。広範な検索の後に私が情報を得ることができないので、あなたの助けは本当に感謝しています。 は、ここに私のコードです:あなたが期待するよう
package Big_Data.Spark_App
import org.apache.spark.SparkConf
import org.apache.spark.SparkContext
object WordCount {
def main(args: Array[String]){
val conf=new SparkConf().setAppName("WordCountApp").setMaster("local")
val sc = new SparkContext(conf)
val text = sc.textFile("/home/cloudera/Downloads/wordCount.txt")
val text1 = text.flatMap(rec=>rec.split(" ")).map(rec=>(rec,1))
val text2 = text1.reduceByKey((v1,v2)=>v1+v2).cache
val all = text2.collect() //line 14
all.foreach(println)
}
}
Here's the debug variable view shows that no actual data in text2 variable
クイックレスポンスに感謝してくれたJamborta!私はそのリンクをチェックアウトします。これにより、既存のコードをデバッグするのが難しくなります。 – Jerry
@Jerry多分追加情報が役に立ちますか? – jamborta
私はちょうどあなたの新しいコードを使用し、はいそれは働いた!もう一度あなたの専門知識に感謝します! – Jerry