2進配列に基づいてrddのいくつかの要素(機能)を選択したいと思います。私は、要素がそのインデックスに存在するかどうかを指定する、サイズが40の0,1
で構成される配列を持っています。rddのフィルタ要素[0,1]の配列による配列[文字列]
マイRDDは、フォームkddcup99データセット
val rdd=sc.textfile("./data/kddcup.txt")
val data=rdd.map(_.split(','))
どのように対応するインデックスの値がバイナリ配列の1であるdata(rdd[Array[String]])
の要素をフィルタリングするか選択することができますが作成されましたか?
あなたは例のデータと予想される出力を共有することができますしてください? – mtoto