2017-05-09 3 views
-2

私がリストを持っている - は、HTMLデータテーブルから洗浄&パイソンループ

['8', '1', 'X', '308', '134', '157', '46', '237', '107', '58', '843', '137', '26', '549', '---', '---', '---', '---'] 
['79', '2', '341', 'X', '401', '1148', '687', '1619', '1604', '674', '2504', '1666', '257', '3154', '---', '---', '---', '---'] 
['18', '3', '132', '356', 'X', '241', '153', '536', '258', '174', '1293', '348', '67', '1056', '---', '---', '---', '---'] 
['12', '4', '163', '891', '241', 'X', '112', '508', '227', '154', '1481', '321', '54', '747', '---', '---', '---', '---'] 
['9/2', '5', '39', '370', '120', '90', 'X', '116', '75', '31', '485', '79', '15', '285', '---', '---', '---', '---'] 

を掻き取り、各[ ]私はdbテーブルに保存するデータの行を表します。さて、どのように私は各[ ]をループし、それが新しい行であるとして扱うのですか? forループを実行すると、新しいそれぞれが新しいデータ行であることを認識していないようです。[ ]また、私は私がきちんと内の各リストを取得するために

data_list=[] 
rows = table.tbody.findAll("tr") 
for row in rows: 
    cols = row.find_all('td') 
    cols = [ele.text.strip() for ele in cols] 
    data_list.append(cols) 

が現在のループで使用コメントセクションからあなたのコードに基づいて特定のDBの列

+2

'for mylist:add_row_to_database(row)'のようなリストです。 – timgeb

+2

あなたがそれをこすったら、それが配列形式の適切な配列に入っていることを確認してください。 '[[...]、[...]]' – Brian

+0

どのように正しいフォーマットになっていますか?ここで私のスクラップコードは次のとおりです。rows = table.tbody.findAll( "tr") 行の行数: cols = row.find_all( 'td') cols = [elem colのeletext.strip() – rmrrmr9

答えて

0

にデータを保存できるように、それぞれの行を分割する必要が想像しますこのようなリスト

for li in data_list: 
    for data in li: 
     print data