中:読む私は私がパンダに読み込むCSVファイルを持っているすべてが、CSVファイルの最後の行パンダ
#!/usr/bin/env python
import pandas as pd
import sys
filename = sys.argv[1]
df = pd.read_csv(filename)
残念ながら、これらのファイルの最後の行は、多くの場合、破損している(カンマの間違った番号を持っています)。現在、各ファイルをテキストエディタで開き、最後の行を削除します。
この特別な非自動化されたステップを踏まなければならないのを防ぐために、CSVをロードする同じpython/pandasスクリプトの最後の行を削除することはできますか?
数字の抽出に関する質問を削除しましたが、とにかく私は 'str.extract'を使って提案するつもりでした:df.columns [2:]のcol:for: df [col] = df [col] .str.extract (r '(\ d +)')。astype(int) ' – EdChum
@EdChumありがとう! – eleanora
@EdChumあなたのコードは小数点を残していますか? – eleanora