私はxlsxファイルを所有しています。各行には30個の列があります。openpyxlを使用して情報全体をリストに保存します。python openpyxlの読み込みが遅すぎる
def get_value(i,ws,article_row):
value=ws.cell(row=article_row,column=i).value
i+=1
return value,i
def geneList(f):
wb = load_workbook(filename=f, read_only=True)
ws = wb.worksheets[0]
max_row = ws.max_row
info_list=[]
for ar_row in range(2,max_row+1):
i=3#start from the 3rd column: sourceid
sourceID,i=get_value(i,ws,ar_row)
pv,i=get_value(i,ws,ar_row)
pubtype,i=get_value(i,ws,ar_row)
......
item_dict={'sourceID':sourceID,'pv':pv,'pubtype':pubtype,
...}
info_list.append(item_dict)
すべての情報を読むには約20分かかります。私はこの問題を解決する方法を知らないのですか?それは、情報を解析するのを遅らせることです。 .xlsxを.csvに変換しますか?または、別のツールを使って読む?
完全なコードを投稿してください。ただし、読み取り専用ファイルに正しいAPIを使用していないため問題が疑われます。 –
https://gitlab.com/antmomo/evan_test/blob/32dae4566daa13e9388527da1a84be96ab03499a/contribution_journal.py –