私は多くの異なるデータファイルをさまざまなパンダのデータフレームに読み込んでいます。これらのデータファイルの列はスペースで区切られています。しかし、ファイルごとにスペースの数は異なります(その中にはスペースが1つしかなく、スペースが2つあります)。どのような方法があり、私ができることですパンダでセパレータをカスタマイズするread_csv
import pandas as pd
df = pd.read_csv('myfile.dat', sep = ' ')
:したがって、私は、ファイルをインポートするたびに、私は手動でそのファイルにアクセスして、使用されているスペースの数を見るとsep
にスペースのそれらの多くの数を与えなければなりませんセパレータとして「任意の数のスペース」を取るようにパンダに指示しますか?また、パンダにセパレータとしてタブ(\t
)またはスペースのどちらかを使用するように指示する方法はありますか?
を使用することができます!ありがとう。セパレータとしてスペースやタブを使用するようにパンダに指示する方法はありますか? – Peaceful
空白はタブにもマッチするかもしれませんが、正規表現に条件を追加するだけでいいと思います: 'sep = \ s + | \ t +' –
なぜpandasのドキュメントにこれが言及されていないのだろうか。 – Peaceful