2017-02-17 14 views
0

私はPythonには新しく、Pythonで大きなエクセルファイルを読み込もうとしています。私はxlsxファイルをcsvに変換してパンダで作業しました。私は以下のコードを書いた:PythonとUnicodeDecodeErrorで大規模なエクセルファイルを読む:

import pandas as pd 
pd.read_csv('filepath.csv') 
df = csv.parse("Sheet") 
df.head() 

をしかし、それは、このエラーを与える:それは、このエラーを与える理由 UnicodeDecodeError: 'charmap' codec can't decode byte 0x81 in position 28: character maps to <undefined>

あなたは私を教えてくださいことはできますか?または、大規模なExcelファイルを読むためのアドバイスがありますか?私はまた、openpyxlモジュールで動作するようにしようとしたが、私はので、私のPythonのバージョンのread_onlyを使用することができませんでした。(私は、Python 2.7.8を使用しています)

+0

は、あなたがまだ 'pd.read_excel'を試してみましたか? –

+0

私は試しましたが遅いです – OykuA

+0

通常は、UnicodeテキストファイルにExcelを保存して、テキストファイルを開くためにpd.read_csv(filename、sep = '\ t、encoding =' utf-16-le ')を使用します。 –

答えて

0

pd.read_csv('filepath.csv',encoding ='utf-8') 

で試してみてください、他の多くのエンコーディングがあります。 encoding = 'iso-8859-1'またはencoding = 'cp1252'またはencoding = 'latin1'のような技術。あなたの要件に応じて選択することができます。

+0

これを行うと、次のエラーが発生します。CParserError:データのトークン化中にエラーが発生しました。 Cエラー:3行目の1つのフィールドが予想される28 – OykuA

+0

デリミタを使用してみてください。 'pdfread_csv( 'filepath.csv'、sep = None、encoding = 'utf-8')' –

+0

うまくいきました。しかし、それはちょうど5行を読んで、私のファイルには5行以上があります。 – OykuA

0

Microsoft ExcelでUnicodeテキストファイルにExcelを保存します。

enter image description here

を開き、この行を含むファイル:

df = pd.read_csv(filename,sep='\t',encoding='utf-16-le') 
print(df.head()) 
+0

ExcelをUnicode Text Fileに保存するにはどうすればよいですか? – OykuA

+0

オプションとして保存に移動し、** Unicode Text ** **を**タイプとして保存**を選択します。投稿した回答に追加した画像を確認してください。 –

関連する問題