2017-09-23 9 views
0

私は非常に大きなデータベースを持っていますが、質問は間違った形式の電子メールアドレスを見つけることです。助けてください、ありがとう!grep/egrepを使用して間違った電子メールアドレスを見つける方法は?

1:間違った電子メールアドレス(@が付いていて、間違ってフォーマットされている行)のレコード数はいくつですか?電子メールアドレスにはユーザーIDがあり、ドメイン名には英字、数字、ピリオド、およびダッシュを使用できます。電子メールアドレスにはトップレベルドメイン(something.top-leveldomain)が必要です。トップレベルドメインの形式は、com、org、eduなどです。

私は電子メールアドレスの検索方法を知っています:grep -E "\ b [A-Za-z0-9 ._% ] + @ [A-Za-z0-9。] +。[A-Za-z] {2,6} \ b "HW1_Data.txt; grep -E -v "\ b [A-Za-z0-9。_%+ - ] + @ [A-Za-z0-9 .-] +。[A-Za-z] { 2,6} \ b "HW1_Data.txt、メール以外のものはすべて手に入れてしまいます。どうすればいいのか分かりません。

答えて

0

電子メールの可能性があるすべての行を取得するにはgrep @ HW1_Data.txtを実行してくださいアドレス。次に、有効でないものを除外します。答えは

grep @ HW1_Data.txt | a-Za-z0-9。_%+ - ] + @ [A-Za-z0-9.-] +。[A-Za-z] {2,6} \ b "

+0

これは私がやっていることですが、このコマンドはメールを除いてすべてを取得します!間違った形式の電子メールを取得する必要があります – James

関連する問題