1
私は毎日チェックして内容が更新されているかどうかを確認する必要がある2500個のドメインが大量にあります。各ページには、そのソースにスタンプ追跡することができhtmlから各ドメインに別々のBashスクリプト一括抽出コンテンツ
timeSincePublish:123412412
を持って、私はすべてのドメインに対して、このスタンプをチェックして、脇にそれぞれ1のためにそれを抽出する必要があります。
今私は、このコマンドを持っている:
url.txt
からすべてのドメインを分析し、スタンプを抽出しますが、私はちょうどスタンプを保存することができますし、私がどのように私は出力でき、ドメインとタイムスタンプ知っていただきたいと思い
cat url.txt | xargs -n 1 curl -L0 | grep -oP '"timeSincePublish":(\d+)' -
csv
などです。
だから私は持っているでしょう:
domain.com - timesincepublished: 133213124
eweqwe.com - timesincepublished: 312316
を行うことができ、これは.SHファイルにすべきですか? bashスクリプトとして実行しますか? –
そのままコマンドラインで実行できます。関数内で.bashrcに追加することができます。これをファイルに入れてbashスクリプトとして実行することができます。選択はあなた次第です。 –
残念ながら、ドメイン名だけを出力します。 http://imgur.com/JfG63Sb –