これはあなたを助けるかもしれない:
# -*- coding: utf-8 -*-
import re
or_str = '<meta content=",\n\n\nÓscar Mauricio Lizcano Arango,\n\n\n\n\n\n\n\nBerner León Zambrano Eraso,\n\n\n\n\n" name="keywords"><meta content="Congreso Visible - Toda la información sobre el Congreso Colombiano en un solo lugar" property="og:title"/><meta content="/static/img/logo-fb.jpg"'
new_str = or_str.replace("\n","")
li = re.findall('meta content=",(.*)" name="keywords"', new_str);
new_str = ''.join(li)
print re.findall('(.*?),',new_str)
私はNULL
に、すべての改行文字\n
を変更するreplace()
メソッドを使用していました。
次に、findall
を使用して名前を探し、それをリストに入れて、findall
がリストを返すので、findall
を使用してすべての名前をリストの要素として格納しました。