内の情報を抽出するためにはgrepと正規表現を使用しますそれは何も言わなかった。私の間違いは何ですか?前もって感謝します!どのように私は、タグ内の情報を抽出しようとする特定のタグ
答えて
使用して、次の作品:
grep -Po "<div class=\"rpt_price rpt_price_1\">\K(.*)(?=</div>$)"
-P
と-o
オプションはunix stackexchangeで、ここで説明されています。 \K
もunix stackexchangeで非常によく説明されています。
\K(.*)
を使用すると、一致するテキストと次のテキストのみが出力されます。 (?=...$)
とすると、残りのテキストは除外されます。
試験:
echo "<div class=\"rpt_price rpt_price_1\">THE TEXT</div>" | grep -Po "<div class=\"rpt_price rpt_price_1\">\K(.*)(?=</div>$)"
出力:
THE TEXT
別の可能性は、直接perl
を使用することで、説明をhere on superuserある:
perl -ne 'print $1 if /\<div class="rpt_price rpt_price_1">(.*?)\<\/div>/s'
テスト:
echo "<div class=\"rpt_price rpt_price_1\">THE TEXT</div>" | perl -ne 'print $1 if /\<div class="rpt_price rpt_price_1">(.*?)\<\/div>/s'
出力:、
THE TEXT
私はパラメータ '-Po'を試しましたが、' grep:私はiOS環境(端末)にあるので、-pオプションのサポートは--disable-perl-regexpバイナリにコンパイルされていません。 –
@ GregorIsack:私の拡張答えを見るなら 'perl'にアクセスできますか? –
私のデバイスに 'perl'をインストールしたところ、完全に動作します!しかし、perlパッケージは私のデバイスの限られたストレージ容量を消費しています。より良い答えがない場合は、これを答えとしてマークします。お手伝いありがとう! –
</div>
の最後の/
をエスケープしていません。
正しい正規表現は次のようする必要があります。正規表現については
^<div class=\"rpt_price rpt_price_1\">.*<\/div>$
、thisは、1つを作成しているとき、あなたの結果がどうなるかをテストするのに最適なツールです。
まだ正規表現はありません。あなたの訂正が動作します!私は 'curl'と思われ始めました –
正規表現がうまくいけば、それはあなたが探しているものと一致します。カールをチェックさせてください。どのようなウェブサイトをターゲットにしていますか? – dirtydanee
この正規表現は機能しますが、部分だけを捨てることはありません: 'テキスト'しかし全体の表現。 –
- 1. 特定の情報を抽出する
- 2. どのように特定のウェブサイトから社会情報を抽出するのですか?
- 3. アドレス情報にはどのようなHTMLタグがありますか?
- 4. 特定のタグを持つUIImageViewからより多くの情報を得る
- 5. この情報をどのように抽出するのですか?
- 6. 私はPythonとBeautifulSoupで特定のtdタグ内のコンテンツにアクセスしようとしています。表
- 7. 私は、次のしている、どのようにJavascriptのに配列情報を抽出し、
- 8. どのようにXMLタグ
- 9. は、どのように私はのUITableViewのセルに_ParentContentViewサブビュー内のタグを作成していた各タグ
- 10. どのように情報
- 11. アンカータグ内のすべてのimgタグを抽出するにはどうすればよいですか?
- 12. 複数のHTMLタグの内部からテキストを抽出するにはどうすればよいですか?
- 13. 特定のJSONハッシュ情報をRailsビューに抽出します
- 14. はどのように複数のタグ
- 15. 私はSPANタグ内の特定のリンクをクリックしようとしていますどのようにダイナミックIDで
- 16. <a>タグにrelの内容をどのように抽出しますか?
- 17. 特定のXMLタグを抽出するPythonの値
- 18. liタグ内のリンクとテキストを抽出するには?
- 19. asp.netのクッキーで特定の情報を抽出する方法
- 20. 特定のHTMLタグ内の数字をどのように一致させることができますか?
- 21. iframeタグとcanonicalタグをどのように扱うべきですか?
- 22. Regexで特定のHTMLタグ内の純粋なテキストを抽出する
- 23. C#XML)特定のタグ内の値を取得するにはどうすればよいですか?
- 24. Xidelはタグ内のデータを抽出します - 生の出力
- 25. タグ内およびタグ外のテキストをハイライト表示するにはどうすればよいですか?
- 26. テーブル内の特定の情報をPythonでスクラップするにはどうすればよいですか?
- 27. テキストから特定の情報を抽出する
- 28. 特定の文字列から情報を抽出する
- 29. Sinatra datama特定のエントリーから情報を抽出する
- 30. 特定のxml情報を抽出する方法
のgrepと正規表現は、HTMLを解析するために使用するために完全に間違っているツールです...と正規表現は、あなたのケースのために十分に良好であれば'grep -oP'が必要です。それで' sed'や 'awk'を使ってください... grepは主にテキスト操作をしないためのものです – Sundeep