0
sc = pyspark.SparkContext()
sqlCxt = SQLContext(sc)
df=sqlCxt.read.format("csv").option("delimiter","|").load("D:/SparkPy/u.item")
エラーを使用してデータフレームにCSVファイルを読み込むときにエラーを取得:私はバージョン2.2.0にスパークを更新するときJupyterノートに
ERROR:root:An unexpected error occurred while tokenizing input The following traceback may be corrupted or invalid The error message is: ('EOF in multi-line string', (651, 72))
このエラーは、pysparkとは関係ありません。ファイルに引用符、アポストロフィなどがありません。エラーメッセージの行番号を確認してください。 – ashwinids
これはcsv問題のように見えません。たとえダミーcsvを作成して使用しても、同じエラーが発生しています。 –
あなたは上記のエラーを生成する最小可能なダミーcsvファイルの内容を共有できますか? – ashwinids