2017-09-27 3 views
-4

マーキュリーパーサーを使用してウェブページの語数を取得しようとしています。上記の内容で正規表現コロンと二重引用符の前の数字と一致する式

<div><p>Content of the webpage goes here</p> </div>"","next_page_url":null,"excerpt":"Get started learning all about SEO from the industry's most trusted source, Search Engine Land. Review basics of search engine optimization, ranking factors & more.","word_count":522,"direction":"ltr","total_pages":1,"rendered_pages":1 

、私は私がどのような正規表現の式Iを使用することができます知ってみましょう"word_count":

が先行する数と一致する必要があります。

私は、(?<=word_count" :).*?(?=[100-10000])を試しています。ただそれを正しくすることはできません。試合word_count":を見つけ、それを除外して、その使用して正規表現\d+

注後、私にすべての桁を与える肯定後読み(?<=を使用して

(?<=word_count":)(\d+) 

説明:

+1

何を試しましたか?あなたはどんな問題を抱えていますか?あなたのコードを教えてください。あなたがコードを持っていない場合は、おそらくあなたの質問のための適切な場所ではないスタックオーバーフローです。 –

答えて

1

はこれを試します私の試合では、":の間には、あなたの試合と正確に一致するスペースがありませんng。あなたの文字列には、":の間のスペースがあり、一致しません。

+0

うまく働いた。ありがとう! –

+3

@PaulSchoffこのソリューションがうまく機能していれば、解決策としてマークしてください。 –

関連する問題