2016-12-14 10 views
0

grep、sedまたはawkのようなシェルコマンドを使用して、下のスクリプトタグの内容をどのように抽出できますか?あなたの説明に基づいてsed、awkまたはgrepを使用してデータを抽出する

<script> 
     document.getElementById("p1").innerHTML = "API Dev :: UP"; 
     document.getElementById("p2").innerHTML = "API QA :: UP"; 
     document.getElementById("p3").innerHTML = "API Regression :: UP"; 
     document.getElementById("p4").innerHTML = "API Pre-Prod :: UP"; 
    </script> 

-Thanks

+1

?あなたはあなたの希望する出力の例を教えてください。 – AndyW

+0

スクリプトタグの間でコンテンツを抽出しようとしています –

+0

その文字列を取得することはあなたの目標ですか?私が尋ねる理由は、あなたがどれくらい具体的になりたいかに基づいています。スクリプトブロック内に何かを得ることが目標だった場合は、ページ上のスクリプトが選択されます。あなたがスクリーンスクレイピングをしている場合、他の著者のスクリプトが抽出されていると主張しなければならない可能性が最も高いでしょう。 –

答えて

0

sed '/script/d' sample.csv

がラインに一致するように/script/を使用して文字列scriptdは、それらの行を削除することですが含まれています。

また、grep "document.getElementById" sample.csvを使用してください。パターン(複数可)を一致させるためにはgrepを使用し 出力:

document.getElementById("p1").innerHTML = "API Dev :: UP"; 
    document.getElementById("p2").innerHTML = "API QA :: UP"; 
    document.getElementById("p3").innerHTML = "API Regression :: UP"; 
    document.getElementById("p4").innerHTML = "API Pre-Prod :: UP"; 
+0

'grep" document.getElementById "sample.csv"は私のシナリオで動作します。私の実際のhtmlファイルのボディ。 – sunil

+0

@sunil 'sed -n '/document.getElementById/p' sample.csv'は動作します:) – haifzhan

0

いくつかの他の選択肢

$ grep -Ev '</?script>' file 

たり、抽出したい具体的にどのような情報

$ gawk -v RS='</?script>' '!(NR%2)' file 
関連する問題