1
複数のファイルを1つのデータフレームとしてロードできますか?私はロードするために一つのファイルを持っている場合、通常、私は、例えば呼び出します。複数のファイルをデータフレームにロード
file1 = "https://stackoverflow.com/a/b/c/folder/file1.csv"
dc = sqlContext.read.format('com.databricks.spark.csv').options(header='false', inferschema='true').load(file1)
しかし、私は、フォルダ/a/b/c/folder/*.csv
下のすべてのファイルをロードします。
'dc = sqlContext.read.format( 'com.databricks.spark.csv')。 load( "a/b/c/folder/*。csv") 'それはエラーを投げますか?それは動作しますか? –
「java.lang.ArrayIndexOutOfBoundsException:18002」というエラーが発生する – hdy