2017-06-19 6 views
-1

URLからコンテンツを取得するGoogleスクリプトがあります。私は、例えば、私がつかむために必要なコンテンツを見つけるために正規表現を使用しています:Google Scriptの正規表現 - 取得したHTML

var htmlSubCategory = UrlFetchApp.fetch(url).getContentText();  
var regexpFindingAllLinks = /<div class="small-12 medium-5 large-4 columns"><a href="\/(.*?)\//g 
var linksProducts = regexpFindingAllLinks.exec(htmlSubCategory); 

私はいくつかの項目のタイトルを見つけるための他の正規表現を足すの問題を抱えています。ソースコードは次のようになります。

<p class="heading"><span class="highlight-ico"></span><a href="/url-1/" title="some title for URL 1">Title I need to grab</a></p> 
<p class="heading"><span class="highlight-ico"></span><a href="/url-2/" title="some title for URL 2">Title I need to grab</a></p> 

私は基本的に

<p class="heading"><span class="highlight-ico"></span><a href="(can be any content)" title="(can be any content)">(grab this content)</a></p> 

を探します第二に、私は見てのみ参照番号を、つかむだろう正規表現がしたい正規表現を持っている必要がありますX12345678(Xはレターで、8桁の数字)

私はこれらのスクリプトに慣れていないので、どんな助けもありがとうございます。あなたはそれを他の方法で行うことができない場合

+0

ああ、私の悪い、コメントは削除されました:p –

+1

質問投稿は1つだけの質問を持つ必要があります。 –

答えて

0

あなたshouldn't use regex to parse HTMLが、しかし、これを使用します(参照番号に一致)あなたの2番目の質問について

/<p class="heading"><span class="highlight-ico"><\/span><a href="[^"]*" title="[^"]*">((?:(?!<\/a>).)*)<\/a><\/p>/ 

を、これを使用する:

/X\d{8}/ 
関連する問題