1
URLにあるcsvをディスクに書き込まずにPysparkのデータフレームに読み込むにはどうすればよいですか?pyspark csvをデータフレームに書き込むことなくディスクに書き込む
ノー運と、次の試してみた:
import urllib.request
from io import StringIO
url = "https://raw.githubusercontent.com/pandas-dev/pandas/master/pandas/tests/data/iris.csv"
response = urllib.request.urlopen(url)
data = response.read()
text = data.decode('utf-8')
f = StringIO(text)
df1 = sqlContext.read.csv(f, header = True, schema=customSchema)
df1.show()
スーパー役に立った、ありがとう! – RobinL