文字列の一部が他の文字列と一致するかどうかを調べる方法はありますか?他の文字列に含まれる文字列の一部regex python
string_list = ['Benefit Cosmetics', 'Anastasia Beverly Hills']
string = '|'.join(string_list)
私はurl
でstring
にマッチしたいと思います。例えば:私はこの
url = pd.DataFrame({'urls' : ['www.amazon.com/ANASTASIA-Beverly...Brow/dp/B00GI21NZA', 'www.ulta.com/beautyservices/benefitbrowbar/']})
のように見えると私はのように見える文字列を持つURLを持っているために
。 Benefit Cosmetics
とwww.amazon.com/ANASTASIA-Beverly...Brow/dp/B00GI21NZA
と
www.ulta.com/beautyservices/benefitbrowbar/
と
Anastasia Beverly Hills
。
私はurl['urls'].str.contains('('+string+')', case = False)
を試してきましたが、これは一致しません。
これを行う正しい方法は何ですか?
チェックアウト:http://www.pythontutor.com/visualize.html#mode=edit –