0
を使用して配列に変換して、私は、CSVは、以下のデータを含むファイルがあります。ロードCSVデータは、データフレームへとApacheスパーク(Java)の
1,2,5
2,4
2,3
私は、配列
の文字列のDATAFRAME持つスキーマにロードしたいです出力は以下のようになります。
[1, 2, 5]
[2, 4]
[2, 3]
これは、ここでのScalaを使用して回答されています Spark: Convert column of string to an array
私はそれがJavaで起こるようにしたいです。
助けてください
質問にはDSLが使用されています。それはJavaでもほぼ同じです。あなたは何かを書こうとしましたか?はいの場合、どのようなエラーがありましたか? – philantrovert
私はRDDを読み込み、以下のようにそれにスキーマを添付しようとしていました: JavaRDD rowRDD = sparkSession.read()。textFile( "D:\\ sanjaya \\ OAWorkspace \\ spark-basics \\ src \\ main \\リソース\\ marketbasketdata.csv ") \t \t \t \t .javaRDD()マップ((機能。)記録 - > { \t \t \t \t \tのString []属性= record.split("、」)。 \t \t \t \t \t return RowFactory.create(Arrays.asList(attributes));
– sanjaya