2016-10-06 7 views
0

列が可変スペースで区切られたファイルを読み込もうとしています。私は、その列に予約されている文字数で各列の幅を定義してファイルを読み取る方法があるのだろうかと思っていました。例えば各列の幅を文字数で定義して、Pythonのパンダでデータを読む

A B   C D 
- ---------- -- --- 
1 foo  32 9.5 
4 bar   5.4 
5 foofoo_bar 44 

のは、我々は上記のデータを読み取ることがあるとしましょう。ただし、ファイル内の2番目の行(ダッシュ記号付き)は、特定の列が持つことができる最大文字数を示します。

質問には、データセットの各列の最大幅が指定されています.pandasやその他のパッケージを使用してPythonでデータセットを読み取る方法はありますか?

答えて

3

pandas.read_fwf()を使用してください。固定幅ファイルの読み取りを表します。

+1

これは素晴らしい機能です。残念ながら、私がこの質問を投稿したデータはちょっと壊れているので、この関数でさえもうまくいきません。しかし、それはまったく同じ方法でフォーマットされた同様の破損していないデータセットでも働いていました。答えをありがとう! – Pras

1

np.genfromtxt)は、区切り文字ではなく列幅のリストです。

関連する問題