私は持っている巨大なcsvファイルからデータを読み取ろうとしています。私はこのエラーUnicodeDecodeError: 'utf-8' codec can't decode byte 0xae in position 13: invalid start byte
を私に見せている。この例外をスローする原因となる行をスキップする方法はありますか?何百万という行から、これらはほんの一握りであり、手動でそれらを削除することはできません。私はerror_bad_lines = Falseを追加しようとしましたが、それは問題を解決しませんでした。 Anaconda 4.4.0を使ってPython 3.6.1を使用しています。私はそれが役立つならば、Macを使用しています。私はこれに新しいです。pandasからread_csvを使用してcsvファイルを誤って読み取る
0
A
答えて
0
あなたのファイルにはデコードできない非アスキー文字がいくつかあるようです。 (それは場合に役立ちます)パンダはread_csvの引数としてエンコーディングを受け入れる:
my_file = pd.read_csv('Path/to/file.csv', encoding = 'encoding')
デフォルトのエンコーディングを使用すると、これらのエラーを取得する可能性がある理由である、Noneです。 Here is a link to the standard Python encodings - 「ISO-8859-1」(別名「latin1」)または「utf8」を試してみてください。
パンダでは、csvを読み込むときにスキップする行を指定できますが、その場合は非常に難しい行のインデックスを知る必要があります。
関連する問題
- 1. pandasを使用してread_csvを使用してヘッダーを読み取る
- 2. Pandasを使用してcsvファイルからヘッダー情報を読み取る
- 3. pandasはread_csvを使用して `set`パラメータを読み込みますか?
- 4. pcs-csvを使ってcsvファイルから最初の行を読み取る
- 5. 最初の列名は、私はread_csvを使用してCSVファイルからデータを読み取るために、次のコードを使用してCSV
- 6. SSLを使ってHTTPSからpandasデータフレームにファイルを読み取る
- 7. Pandas - read_csvを使用してGeneratorオブジェクトからDataframeを作成
- 8. パンダを使用してループ内のCSVファイルを読み取る
- 9. ストリームリーダーをCで使用して.csvファイルを読み取る#
- 10. PHP OOPコンストラクタを使用してCSVファイルを読み取る
- 11. LabVIEWを使用してCSVファイルを読み取る方法は?
- 12. Ajaxを使用してcsv/textファイルを読み取る
- 13. PHPを使用してCSVファイルから日付範囲を読み取る
- 14. テンプレート関数を使用してCSVファイルから数値を読み取る
- 15. PHPを使用してCSVファイルからマルチバイト文字を読み取る方法
- 16. Pythonでpandasを使用して列名でCSVを読み取る方法は?
- 17. csvファイルをpandasデータフレームにfloatとして読み込み
- 18. CSVファイルからデータを読み取り、vb.netを使用してSQLに挿入
- 19. pandasを使用してPythonで大きなCSVファイルを読む
- 20. Csvファイルからデータを読み取る
- 21. ファイルからCSVデータを読み取る
- 22. CSVファイルからデータを読み取る
- 23. RAMからCSVファイルを読み取る
- 24. csvからデータフレーム名を読み取ってループ内で使用する方法
- 25. pandas&boto3を使用してs3からcsvファイルを読み取っているときにメモリエラーが発生しました。 Pythonのエラー:free():無効なポインタ:
- 26. Javaを使用してXMLファイルから値を読み取る
- 27. javascriptを使用してディスクからxmlファイルを読み取る
- 28. PHPを使用してURLからMP4ファイルを読み取る
- 29. コマンドラインを使用してファイルからデータを読み取るJava
- 30. ajaxを使用してファイルからデータを読み取る
私はcsvファイルを読み込めました。しかし、ファイルからの黒いセルごとに、DataFrameはnanと表記します。私は 'df.col [0] == nan'のような等価文を作成したい。しかし、それはナノが定義されていないと言います。平等声明に何を入れることができますか? – anon
"nan"の行を削除しますか?あなたがそれをしたい場合は、あなたが 'のDFの= dfのような何かを行うことができます[df.Column_nameは "ナン" ==]' 作業をする必要があり、または[ 'Column_nameの']。STR DF 'のDFの= dfの[。 compare( "nan")] ' インデックスiとjを持つdf.iat [i、j] ==" nan "'のような値を持つセルを見つけるには、 'のようにします。 – Peter