2017-12-21 10 views
0

pandasのread_excelメソッドを使用してExcelシートをdfに読み込もうとしています。 Excelファイルには6〜7種類のシートが含まれています。それから2〜3枚は非常に巨大です。私はファイルから1枚のエクセルシートを読みたいだけです。 シートをコピーして読むと時間が90%短縮されます。データフレームに1枚だけを読み込む

私は、pandasで使用されているxlrdは常にシート全体をメモリに読み込むことを読んでいます。私は入力の形式を変更することはできません。

パフォーマンスを向上させる方法をお勧めしますか?

+0

'XLSX = pd.ExcelFile( 'path_to_file.xls')'と 'DF = pd.read_excel(XLSX、 'シート1')' – jezrael

+0

について何これは私たちが現在使用しているものです。それは、それが見えるシートをすべてロードします。 [This](https://stackoverflow.com/questions/26521266/using-pandas-to-pd-read-excel-for-multiple-worksheets-of-the-same-workbook)StackOverflowの質問は、上記に最も関連しています質問は私が出会った。しかし、それは私が推測する問題を解決しません –

+0

'data_file = pd.read_excel( 'path_to_file.xls'、sheetname =" Sheet1 ")'の何が問題なのですか? – SamuelNLP

答えて

0

を参照してください。非常に簡単です。ちょうどこれを行う。

import pandas as pd 
xls = pd.ExcelFile('C:/users/path_to_your_excel_file/Analysis.xlsx') 
df1 = pd.read_excel(xls, 'Sheet1') 
print(df1) 
# etc. 
df2 = pd.read_excel(xls, 'Sheet2') 
print(df2) 
関連する問題