RDDが22列を超えています(したがって、フィルタリングを行うためにDataframeに変換できません)。 7〜10の範囲を得るためには4列3および10に列7の範囲を有する第二のデータフレーム、私はスライス機能に以下の方法を使用します。Spark(1.5.2) - Scala
var aux = rdd.map(_.slice(7, 10))
しようとしたときに私の問題が来ます3から4の間隔でこの間隔に参加してください。私は、スライス方法が1つの範囲しか受け入れないことを見ました。単一の変数で両方の範囲を取得するために、この制限をスキップする方法はありますか?
プレースホルダ '_'を2回使用することはできません。 'rdd.map(row => row.slice(3、4)++ row.slice(7、10))'のようなことをしなければなりません。また、 'slice'に最後のインデックスが含まれていないことに注意してください:' _.slice(3,4) 'はインデックス' 3'だけを保持します。 –