テキストファイルを読んで、マルチインデックスDataFrame
を作成します。マルチインデックスを作成し、テキストファイルからデータをdf.loc[[],[]]
で割り当てるか、DataFrame
に行を連結し、最後にDataFrame
のインデックスを設定する方が速いのですか?または、リストまたはdict
を使用してファイルから読み取ったデータを保存してから、DataFrame
を作成する方が速いのですか?より多くのpythonicまたは高速オプションがありますか?テキストファイルからデータを読み込み、それをデータフレームに割り当てる最も速い方法は何ですか?
例テキストファイル:
A = 1
B = 1
C data
0 1
1 2
A = 1
B = 2
C data
1 3
2 4
A = 2
B = 1
C data
0 5
2 6
出力DATAFRAME:
A B C data
1 1 0 1
1 2
1 2 1 3
2 4
2 1 0 5
2 6
更新1月18日:これはHow to parse complex text files using Python?にリンクされているが、私はまたblog article explaining how to parse complex files to beginnersを書きました。
おそらく、あなたは['timeit'](https://docs.python.org/3/library/timeit.html)モジュールを使ってテストすることができます。 –
テキストファイルのサイズはどれくらいですか? –
@MartinEvans 100 MBのオーダー – bluprince13