2017-06-12 23 views
0

私はパンダを使用してデータセットをインポートしようとすると、次のエラーメッセージ取得しています:Python3.x、パンダ、CSV、UTF-8エラー

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xa0 in position 10: invalid start byte

を私はエンコーディングについて読むと

としてそれを使用しようとしました
df=pd.read_csv("file.csv",encoding="ISO-xxxx") 

エラーが無効な構文であることを示しました。

君たちが見てしたい場合、私は私のデータへのリンクを共有しています:https://www.kaggle.com/venkatramakrishnan/india-water-quality-data

+0

あなたは "無効な構文" エラーのトレースバックを表示することができますか? – lenz

+1

問題を再現する最小のデータセットまでそのデータセットをトリムしてから、質問に編集してください。前半または後半を削除しても、問題はまだ発生しますか? 1行に絞り込むことはできますか?問題が問題そのものに表示されない限り、(ファイルを外部から削除/変更した後で)問題を将来にわたって実証できるようにするため、問題は話題にはなりません。 – halfer

+0

無効な構文エラーが削除されました。私はトレースバックをチェックし、それを自分で解決しました。 –

答えて

0
import pandas as pd 

df = pd.read_csv('IndiaAffectedWaterQualityAreas.csv',encoding = 'latin-1') 

上記のコードはのpython 3.6パンダ「0.20.1で記述された解決策の一つであります'

なぜこの問題が発生しますか?

There are some special character which by default utf-8 is cannot be used to decode. if you have the raw data,try making the csv using pandas with the following code:

df.to_csv('IndiaAffectedWaterQualityAreas.csv',encoding = 'latin-1')