ファイルに格納されたデータを使用してデータフレームを作成する必要があります。そのために私はread_csv
メソッドを使いたいです。しかしながら、セパレータはそれほど規則的ではない。一部の列はタブ(\t
)で区切られ、他の列はスペースで区切られています。さらに、いくつかの列は2つまたは3つ以上のスペースで、またはスペースとタブの組み合わせ(たとえば3つのスペース、2つのタブ、1つのスペース)で区切ることもできます。read_csvで区切り記号をより柔軟な空白にするには?
パンダにこれらのファイルを適切に扱うように指示する方法はありますか?
ところで、私はPythonを使用する場合、私はこの問題はありません。私は使用します:
for line in file(file_name):
fld = line.split()
それは完璧に動作します。フィールド間に2または3のスペースがあるかどうかは気にしません。スペースとタブを組み合わせても問題はありません。パンダは同じことができますか?
また、 'skipinitialspace'を使って初期空間をスキップすることもできます – jarondl