2016-10-27 44 views
1

SQLデータベースからpandasデータフレームまでの大きな関係を読み込んでいる間は、タプルの数が静的にわかっており、I/Oレートが推定できるので、進捗バーがあるといいでしょう。 tqdmモジュールの機能がtqdm_pandasで、列に対するマッピング機能の進捗状況が報告されているようですが、デフォルトではこのようなI/Oで進行状況を報告する効果はありません。 pd.read_sqlへの呼び出しでtqdmを使用して進行状況バーを表示することはできますか?データベース読み取りでtqdmを使用できますか?

+1

'pandas'はデータベースにクエリを送出して応答を待つだけなので、恐れはありません。結果セット全体が到着するまで中間フィードバックはありません。 –

答えて

4

あなたはこのような何かをするchunksizeパラメータを使用することができます。

chunks = pd.read_sql('SELECT * FROM table', con=conn, chunksize=100) 

df = pd.DataFrame() 
for chunk in tqdm(chunks): 
    df = pd.concat([df, chunk]) 

私はこれは同様に、より少ないメモリを使用すると思います。

関連する問題