2017-09-27 26 views
0
sc = pyspark.SparkContext() 
sqlCxt = SQLContext(sc) 
df=sqlCxt.read.format("csv").option("delimiter","|").load("D:/SparkPy/u.item") 

エラーを使用してデータフレームにCSVファイルを読み込むときにエラーを取得:私はバージョン2.2.0にスパークを更新するときJupyterノートに

ERROR:root:An unexpected error occurred while tokenizing input The following traceback may be corrupted or invalid The error message is: ('EOF in multi-line string', (651, 72))

+0

このエラーは、pysparkとは関係ありません。ファイルに引用符、アポストロフィなどがありません。エラーメッセージの行番号を確認してください。 – ashwinids

+0

これはcsv問題のように見えません。たとえダミーcsvを作成して使用しても、同じエラーが発生しています。 –

+0

あなたは上記のエラーを生成する最小可能なダミーcsvファイルの内容を共有できますか? – ashwinids

答えて

0

問題は解決しました。

Python 3.6はSpark v2.2.0と互換性があります

関連する問題