2017-06-02 8 views
0

私はpandas.read_excelでExcelシートを読み込もうとしています。そのskiprows引数は、行番号を渡すことによって行をスキップすることを可能にします。ただし、パターンマッチに基づいて行をスキップするにはどうすればよいですか?私はスキップする必要がある行の数が可変なので、行の数を指定することは私の使用例ではうまくいきません。パターンを供給できる方法はありますか?特定の文字列を含む行の前にあるすべての行をスキップします( 'Test')?これをpandas read_excelで実現できない場合は、このようにデータフレームにExcelを読み込む代わりの回避策がありますか?どんな提案も大歓迎です。ありがとう。pandas.read_excelで正規表現に基づいて行をスキップするには?

+0

あなたは「'skip_rows'の引数としてではなくサンプルデータと我々はできるパターンなしパターンの指標とし、このオーバーループこれらのインデックスのそれぞれを使用してを参照するリストを作成することができますより具体的な回答を提供する –

答えて

0

私の提案は、Excelシート全体をデータフレームに読み込んだ後、不要な行を削除することです。簡単な例として:

import pandas as pd 

# Read out first sheet of excel workbook 
df = pd.read_excel('workbook.xlsx') 

# Find label of the first row where the value 'Test' is found (within column 0) 
row_label = (df.iloc[:, 0] == 'Test').idxmax() 

# Drop all rows above the row with 'Test' 
df = df.loc[row_label:, :] 
+0

素晴らしい、ありがとう! –

関連する問題