0
てファイル私たちはsaveAsTextFile APIを使用することができます。ここHDFSに最初の5行を書くスパーク
sc.textFile("hdfs://localhost:8020/user/hadoop/data-master/retail_db/products/part-00000").map(rec => (rec.split(",")(4).toDouble, rec)).sortByKey(false).map(_._2)
スパークコードをHDFSファイルに最初の5行を書きたい、しかし、我々は、行を制限する必要がありながら、それは行動です変換を通じて。
私は疑問に思っています。これは既にここで解決済みです:https://stackoverflow.com/questions/34206508/is-there-a-way-to-take-the-first-1000-rows-of- a-spark-dataframe –
[Spark Dataframeの最初の1000行を取得する方法はありますか?](https://stackoverflow.com/questions/34206508/is-there-a-way-to-take - 最初の1000行のスパークデータフレーム) –