私はpandas.read_hdfで、大きな(約10 GB)HDF5テーブルに読んでいます。私は一度にチャンクにアクセスできるようにiterator = Trueを使用しています(たとえば、chunkksize =一度に100,000行)。パンダread_hdf:chunkksizeまたはiteratorを使用するときに列名を取得する方法は?
は、どのように私はすべての列名または「キー」のリストを得るのですか?
また、どのようにpandas.read_tableのためのものと類似何get_chunk方法はありません来ますか?直接唯一の方法チャンクを反復される(「データでのチャンクのために: 『)、あなたは意志で異なる番号のチャンクにアクセスすることはできません(』データ[300]」)?
編集:私は最初のチャンクにアクセスした後破るループを備えたカラム名にアクセスできるように
が見える:
for i,v in enumerate(data):
if i != 0:
break
colnames = v.columns
しかし、その後、私の2番目の質問はまだ残る:アクセスする方法はありませんTextFileReaderイテレータ(例えば、[0] read_table、または辞書のようなルックアップと、データのget_chunk方法を模倣する)、代わりにforループ上記奇妙単一の反復を行うパンダ上の個々の各チャンク?
素晴らしい感謝! – quantumflash