2017-02-13 27 views
0

htmlタグを含むcsvファイルがあります。次の関数を使用してhtmlタグを削除するためにDataFrameを繰り返し処理しようとしていますが、 'TypeError:expected string or buffer'が発生しています。このエラーの助けに感謝します。Python DataFrameからHTMLタグを削除する

import re 

def clean_html(raw_html): 
    for index, row in raw_html.iterrows(): 
     cleanr = re.compile('<.*?>') 
     cleantext = re.sub(cleanr, '', raw_html) 
     return cleantext 

答えて

0

re.sub関数にraw_html変数を渡しています。行データを渡してみてください。

cleantext = re.sub(clean, '', row['a1']) 
関連する問題