2017-09-26 29 views
0

私はPython 2.7にopenpyxlを使用して、既存の.xlsxファイルを開いて変更しています。このExcelファイルには、約2500個の列とわずか10個の行があります。問題は、openpyxlがファイルをロードするのに時間がかかったことです(ほぼ1分)。 openpyxlのロードプロセスをスピードアップする方法はありますか?他のスレッドからは、read_onlyとwrite_onlyでいくつかのヒントを見つけました。しかし、私は同時に読んで書くべきであるので、私はこのヒントを私に適用することはできません。誰にも示唆がありますか?おかげで、あなたは非常に多くのOpenpyxl既存のExcelをロードするには時間がかかります

+0

本当にそうではありませんが、それはファイル内のその他のものによって異なる場合があります。 25000セルは非常に高速に読み込まれるはずですが、ロードされたファイル内に他のアイテムがある可能性があります。 –

答えて

-1

は、私はあなたがExcelファイルで何をする必要があるかわかりませんが、私はパンダのデータフレームとして.xmlsファイルを開くしようとするだろう:パイソンを使用している

import pandas as pd 
df = pd.ExcelFile('file path') 
+0

パンダExcelのサポートは、xlrdがサポートするものによって制限されています。これはファイル形式のサブセットに過ぎません。 –

+0

パンダを使って開くのは早いですが、開いた後はすべてのセル(セル単位)を読み、severalsセル(blockwiseまたはcolumnwiseではなく)にコメントを書き込む必要があります。パンダで可能ですか? – leanh2

0

私は何をしなければなりませんExcelファイル(2K列以上、約2.5MB)を開き、Excel内の値をseverals .xmlファイルの値と比較します。違いはExcelのコメントとして書かれます。 excelには、テキスト、数字、およびいくつかのフォーマット(セルの背景色)しかありません。 openpyxlの読み込み速度を向上させるかどうかを調べるために、すべてのフォーマットを削除しようとします。

+0

私はPythonで簡単な測定をしました。このExcelファイルをxlrdで開くには4秒かかり、openpyxlで22.5秒かかりました。 openpyxlはとても遅いですか? – leanh2

関連する問題