2017-03-12 15 views
-1

私はhtmlを正規表現で分割して得たデータリストを持っています。IndexError:リストのインデックスが範囲外です

data_list = re.findall(r'<tr.*?>(.*?)<\/tr>', html) 

私はDATA_LISTのループは、私が

open = re.findall(r'kurs".*?>(.*?)<\/td', x)[0].strip('</span>') 

例えばオープン変数を定義したいと、それは私にエラーを与える:

Traceback (most recent call last):

File "", line 2, in open = re.findall(r'kurs".?>(.?)</td', x)[0].strip('')

IndexError: list index out of range

は、この事前に

答えて

0

をありがとうエラーは、そのようなインデックスを持つ要素がリストに存在しないことを意味します。したがってリストには最初の要素はありません。返されたre.findallは何も見つかりませんでした。

ちなみに、HTMLを解析するために正規表現を使用することは推奨されません.Web対応のBeautifulSoupやlxmlなどのフレームワークを使用することをお勧めします。

関連する問題