0
EMRのzeppelinノートブックを使用して、s3をソースとして使用してストリームを印刷しようとしています。EMRとS3ソース上でスパークストリーミング
%pyspark
from pyspark.streaming import StreamingContext
from pyspark.sql import Row, SparkSession
ssc = StreamingContext(sc, 45)
streams=ssc.textFileStream('s3://realtime-nyc-bike/')
streams.pprint()
ただし、何も印刷されません。バケット名は正しいです。何が問題なの?スパークストリーミングドキュメントから