私は51,347行のデータセットを持っています。 pandasを使用してデータをインポートし、区切り文字を "|"に設定すると、私は394行を失う。delimiter = "|"を使用してインポートすると、Pandasに行がありません。
import pandas as pd
df = pd.read_csv("Basin11.txt", sep='|', error_bad_lines=False,
dtype={'Start Date': str, 'Greater Than/Less Than': str,
'Parameter Code': float, 'Start Time': str, 'Start Depth': float, 'Composite Category': str,
'Composite Type': str})
print(len(df.index))
sep変数を削除すると、データは複数の列として読み込まれることはありませんが、適切な行数が読み込まれます。それはこのファイルの問題だと思われます。 Basin11.txt File
なぜデータが失われているのか分かりますか?
私は、約394行に "無料"のテキストの連続があると思います|アンエスケープerror_bad_lines = Falseはそれらの行をサイレントに無視します – Boud
error_bad_lines = Falseを削除しようとしましたが、長さには影響しません。 sep = '|'以外の各引数を個別に削除しました。 – Will