2017-07-03 3 views
2

私はBeautifulSoupでウェブページ内の単語/用語を見つけるpythonスクリプトを作成しようとしています。ユーザーがハイフン付きまたはハイフン付きのいずれかの語句を入力し、両方の語句を確認するようにします。 「データ駆動型」は「データ駆動型」もチェックします。正規表現でハイフン付きまたはハイフンなしの両方のバージョンを選択します

Slaying the ‘old school’ bosses with data-driven platforms. 

Slaying the ‘old school’ bosses with data driven platforms. 

と正規表現:私はこのテキストがある場合

(.+(\W(data((-)|(\s))driven)\W).+) 

を次にそれが唯一のハイフン付きのバージョンではなく、非ハイフン付きのバージョンをキャプチャします。

私はそれを動作させるためにどのように変更できますか?私はそれを見ていますhttp://regexr.com/

+1

この表現は私にとってはどちらの場合でもうまくいくようです。 – FamousJameous

+0

Ach - 私は "グローバル"を選択していない...あなたは正しい! –

答えて

0

あなたのパターンはハイフネーションとハイフネーションの両方をキャプチャするので、何が問題なのですか?私はあなたのパターンの理由を知らないが、それは私に複雑に見える。この単純な方法はどうですか?

data[- ]driven 
+0

あなたが正しいです、私はグローバルを選択していませんでした。また、素晴らしいと簡単なバージョンのおかげで。 –

関連する問題