Jupyterノートに

sc = pyspark.SparkContext() 
sqlCxt = SQLContext(sc) 
df=sqlCxt.read.format("csv").option("delimiter","|").load("D:/SparkPy/u.item")

エラーを使用してデータフレームにCSVファイルを読み込むときにエラーを取得：私はバージョン2.2.0にスパークを更新するときJupyterノートに

ERROR:root:An unexpected error occurred while tokenizing input The following traceback may be corrupted or invalid The error message is: ('EOF in multi-line string', (651, 72))

出典

2017-09-27 Shreya Singh

このエラーは、pysparkとは関係ありません。ファイルに引用符、アポストロフィなどがありません。エラーメッセージの行番号を確認してください。 – ashwinids

これはcsv問題のように見えません。たとえダミーcsvを作成して使用しても、同じエラーが発生しています。 –

あなたは上記のエラーを生成する最小可能なダミーcsvファイルの内容を共有できますか？ – ashwinids

問題は解決しました。

Python 3.6はSpark v2.2.0と互換性があります

出典

2017-09-30 05:51:27

答えて

関連する問題