2017-07-31 14 views
0

問題文: gzipファイルを含むディレクトリがあり、各gzipファイルにはテキストファイルが含まれています。 すべてのgzipファイルを解凍し、解凍された各テキストファイルを読み込み、その出力を1つのテキストファイルに結合して条件を適用し、条件が満たされればそれをExcelに書き出すようなコードを書いています。 上記の処理はちょっと面倒で時間がかかります。 誰でもgzipされたtxtファイルから直接データを読み込んで、その内容をExcelに書き込むコードを書くのを手伝ってもらえますか?解凍せずにgzip形式でテキストファイルを読むには、その行をPythonを使用してExcelに書き込む方法はありますか?

+0

あなたが読むためにそれらを解凍する必要がありますあなたはそれらをメモリに解凍できると確信しています。 – Nullman

+0

[gzcat](https://askubuntu.com/questions/813451/what-does-the-gzcat-and-zcat-command-do)の使用はどうですか? –

答えて

1

IIUC最初read_csvを使ってパンダを使用することができます。

df = read_csv('yourfile.gzip', compression='gzip') 

その後、dfにあなたの条件を適用し、to_excelを使用してExcelにデータフレームをライトバック:

df.to_excel(file.xls) 
関連する問題