私はスパイダーしたいURLのリストを含むフラットファイルを持っています。私は特定の長さのものだけをチェックしたい。私はリストから短いURLをbashで切り詰める方法を知らない。 doループを単純に作成して、ファイル内の5行以下のスラッシュを含む行を削除することは可能でしょうか?特定の長さのURLを削除する
grep '://.*/.*/.*/.*/.*/' urls.txt
これが唯一の少なくとも5つのスラッシュを持つ行にマッチします:あなたは単にすることができます "/"
私はスパイダーしたいURLのリストを含むフラットファイルを持っています。私は特定の長さのものだけをチェックしたい。私はリストから短いURLをbashで切り詰める方法を知らない。 doループを単純に作成して、ファイル内の5行以下のスラッシュを含む行を削除することは可能でしょうか?特定の長さのURLを削除する
grep '://.*/.*/.*/.*/.*/' urls.txt
これが唯一の少なくとも5つのスラッシュを持つ行にマッチします:あなたは単にすることができます "/"
使用
grep '//.*/.*/.*/' filename
詳細を編集してください。コード専用と「試してください」の回答は、検索可能なコンテンツが含まれていないため、推奨されません。なぜ誰かが「これを試してみる」べき理由を説明しません。私たちはここで知識のためのリソースとなるよう努力しています。 – abarisone
少なくとも5つのスラッシュとpattermに一致しないすべての行を選択するために 'grep'を使用。 –
これを使って、bashの '/'を数えることができます:http://stackoverflow.com/a/16679640/1716866。 – leekaiinthesky