tar.gzで圧縮されたcsvファイルからpandas DataFrameを作成するにはどうすればよいですか?私はzipファイルでこれを行うこのコードを見つけました。 tar.gzとcsvファイルをダウンロードせずにtar.gzで動作させるには、次のコードで何を変更する必要がありますか?tar.gzで圧縮されたcsvからPanda Dataframeを作成するには?
import pandas, requests, zipfile, StringIO
r =requests.get('http://data.octo.dc.gov/feeds/crime_incidents/archive/crime_incidents_2013_CSV.zip')
z = zipfile.ZipFile(StringIO.StringIO(r.content))
df=pandas.read_csv(z.open('sample_CSV.csv'))
私のファイルはhttps://ghtstorage.blob.core.windows.net/downloads/mysql-2016-06-16.tar.gz
注意ZIPファイルは、ほぼ40ギガバイトであること。これは解凍され、メモリにロードされます。あなたはどれくらいのRAMを持っていますか? – ayhan