ファイルがあり、mllibアルゴリズムに渡したいと思います。だから私は、次の例など何かやっている:if条件に基づいてspark rdd mapアクションの行をスキップする方法
val data = sc.textFile(my_file).
map {line =>
val parts = line.split(",");
Vectors.dense(parts.slice(1, parts.length).map(x => x.toDouble).toArray)
};
を、これは時々私が欠けている機能を持っていることを除いて動作します。それはある行の1つの列にデータがなく、このような行を捨てたい場合があります。
は、だから、私はこのskipLineのアクションを行うことができますどのようにこのmap{line => if(containsMissing(line) == true){ skipLine} else{ ... //same as before}}
ような何かをしたいですか?