2016-07-26 6 views
4

私は組織の連絡先Webページが異なる430のHTMLファイルを持っていますが、このファイルから電子メールを抽出しました。Regex To Exclude Email-Expression

私が検出に上がってきたこの正規表現の簡単なコードでは、ファイル

\S*@\S* 

私は私が使用できるように、電子メール以外のすべてのものを選択しようとしている

私の問題全体の電子メールを検索します電子メール以外のすべてを削除するには、Notepad ++の "すべての文書をすべて開く"機能を使用します。これは正規表現で可能ですか?

とにかく上記の正規表現以外のものをすべて選択できますか?

+0

ありがとうございます:) –

+0

* *: '(\ b [A-Za-z0-9 ._%+ - ] + @ [A-Za-z0-9 .-] + \ -Za-z] {2,4}/b)| .'である。 * *: '$ 1'で置き換えてください。次に、*編集 - >空白操作 - >不要な空白とEOL *メニューオプションを削除することができます。 –

+0

@WiktorStribiżとtrincot皆さんは素晴らしいですが、私は本当にこのことを学びたいと思います。正規表現に私の知識を広げるために使用できる推奨リソースがありますか?ありがとうございました:)私の一日を作った –

答えて

2

メモ帳++の最新バージョンを持っていることを確認し、必要な正規表現をサポートしているためにインストール:\n
正規表現    

(^|\s+)[^@]+(\s+|$)
はと交換してください:

は、どのような検索します

.とnewliが一致しましたneオプションはアクションに影響しません。

+0

あなたは伝説です、おかげでトリコット –

+0

あなたは歓迎です。 – trincot

+0

*あなたのパターンにドットが含まれていないので、 '.'は改行*にマッチします。 –

1

一部のパターンと一致しないすべてのテキストを削除する必要があります。

あなたは(...)キャプチャグループで電子メールを一致してキャプチャする必要があると、あなたは、単に他ののすべてを一致さする必要があります。

( + your_pattern + )|.のパターンを使用し、$1に置き換えてください。

または、使用:あなたは編集使用する場合があります、そして、$1

- >ブランクオペレーション - >を:

([^\s<>"][email protected][^\s<>"]+)|. 

または

(\b[A-Za-z0-9._%+-][email protected][A-Za-z0-9.-]+\.[A-Za-z]{2,4}\b)|. 

と交換不要な空白とEOLを削除するメニューオプション。

+0

おかげさまでウィクトル、あなたは伝説です –

+0

あなたは大歓迎です。ところで、SOのおかげで一般的な言い方は助けになった答えをアップアップすることです。 –