非常に大きなcsv(Excelで開くことはできず、簡単に編集できます)でも100,000行目のどこかに読み込みたい場合は、プログラムがクラッシュする余分な列が1行あります。この行はエラーが発生しているため、追加の列であるという事実を無視する方法が必要です。約50列があるので、ヘッダーをハードコーディングし、名前やusecolsを使用することは好ましくありません。私は、おそらく他のcsvのこの問題に遭遇し、一般的な解決策が必要です。残念ながらread_csvで何も見つかりませんでした。コードはこのように簡単です:誤った行をスキップするPandasデータフレームread_csvで不良データ
def loadCSV(filePath):
dataframe = pd.read_csv(filePath, index_col=False, encoding='iso-8859-1', nrows=1000)
datakeys = dataframe.keys();
return dataframe, datakeys
誤ったデータをスキップするにはerror_bad_lines = Falseを設定します – EdChum