RDDにはname
と表示されています。Scala RDD文字列操作
scala> name
res6: org.apache.spark.rdd.RDD[String] = MapPartitionsRDD[24] at map at <console>:37
私は、各レコードの先頭からname
文字を削除し、long
形式で残りの数字を返す新しいRDDを作成したいname.foreach(println)
name5000005125651330
name5000005125651331
name5000005125651332
name5000005125651333
を使用して、それを検査することができます。
望ましい結果:
5000005125651330
5000005125651331
5000005125651332
5000005125651333
私は次のことを試してみました:
val name_clean = name.filter(_ != "name")
しかし、これは返します
name5000005125651330
name5000005125651331
name5000005125651332
name5000005125651333
ような何かを'name.map(_。drop(4).toLong)'はそれを行うべきです(最初の4つの文字を削除するだけです無条件に、彼らはそれが何であるかをチェックしません。 –
Paulに感謝します。私はそれを認識しませんでした。働いた!返信として投稿すること自由に感じてください – LearningSlowly