ExcelデータをPythonのデータフレームにインポートするにはどうすればいいですか?行5から始まり、ヘッダーを含むpythonデータフレームにExcelを読み込む
現在のところ、現在のExcelワークブックでは、ピボットテーブルを更新してその他の処理を行うオープニング時にいくつかのvbaが実行されます。
次に、ピボットテーブルの更新結果をPythonのデータフレームにインポートして、さらに解析したいと考えています。
import xlrd
wb = xlrd.open_workbook('C:\Users\cb\Machine_Learning\cMap_Joins.xlsm')
#sheetnames
print wb.sheet_names()
#number of sheets
print wb.nsheets
ファイルのリフレッシュとオープンがうまく機能します。しかし、どのようにして、最初のシートから、5行目のヘッダーから最後のレコードnまでのデータを選択しますか?
ありがとうAndy。 .xlsmファイルで動作するpd.ExcelFileを取得できず、.xlsxファイルと.xlsmファイルで動作するはずのopenpyxlをインストールできないようです。私はちょうどxbaとして保存するように私のvbaを変更しました。 skip_rows = 4の部分を除いてすべてが機能しましたが、後でPythonで不要な行を削除しました.df2 = df [2:] – IcemanBerlin
ああ。実際にskiprows = 4で調整されたskip_rows = 4とその部分もうまくいきました。まことにありがとうございます。 .xlsmファイルがうまくいけば、銀色の星...ゴールドを得ます;) – IcemanBerlin
おっと! githubにxlsmファイルに関する問題を追加します。 –