テキスト列にre.findallを使用して、次のいずれかをスペースで検索しようとしています。 2回目のだけではなく、WAR、そのWARduringと私はそのregex re.findallを使って両側に空白文字を含む部分文字列を見つけよう
もが何だろうしたくないので、私は私だけ
['WAR', 'CFO', 'CIO']
を望んでいた、これに代えて、次のスクリプト
url = '#MnA deals for 2015 across all #oilandgas sectors were lower than WAR WARduring the CFO Great CIO Recession'
regex=re.findall(r'WAR|CIO|CISO|CTO|C-Suite|CMO|CFO|Founder+',url)
print regex
['WAR', 'WAR', 'CFO', 'CIO']
を使用しています
['WAR', 'WARduring','CFO', 'CIO']
が電子に感謝のように、私は添字の前で見てみたいすべてのものを得るためにオペレータも
>>> re.findall(r'\b(?:WAR|CIO|CISO|CTO|C-Suite|CMO|CFO|Founder+)(?=\s|$)', url)
['WAR', 'CFO', 'CIO']
(?=\s|$)
キーワードの後に空白文字や線の端の存在を主張します:非常にあなたが先読みを使用することができます
'Founder +'の '+'はリテラル '+'ですか? –