GoogleのアプリケーションスクリプトはHTTPレスポンスのコンテンツテキストを取得します。抜粋は次のとおりです。タイトルとiframeを抽出するJavascriptの正規表現
<p style="text-align: left;"><span style="background-color: rgb(242, 195, 20);"><span style="color: rgb(192, 80, 77);">Disclaimer:</span></span><span style="background-color: rgb(255, 255, 255);">Please note,</span><a href="http://www.g00gl3.com"><span style="background-color: rgb(255, 255, 255);">http://www.g00gl3.com</span></a><span style="background-color: rgb(255, 255, 255);"> or </span><a href="http://www.g00gl3.com"><span style="background-color: rgb(255, 255, 255);">www.G00gl3.com</span></a><span style="background-color: rgb(255, 255, 255);"> is only video embedding websites. All of the videos found here come from 3rd party video hosting sites. We do not host any of the videos. Please contact to appropriate video hosting site for any video removal.</span></p>
<div style="text-align: center;"><strong><span style="background-color: rgb(255, 255, 255);">Dailymotion <br><br></span></strong></div>
<div style="text-align: center;"><iframe src="http://www.dailymotion.com/embed/video/foo1234567890bar? syndication=202279" width="640" height="360" frameborder="0"></iframe></div>
<div style="text-align: center;"><strong><span style="background-color: rgb(255, 255, 255);">Alternate Video <br><br></span></strong></div>
<div style="text-align: center;"><iframe src="http://hqq.tv/player/embed_player.php?vid=1234567890&autoplay=no" width="720" height="450" frameborder="0"></iframe></div>
この抜粋から、タイトル(DailymotionまたはAlternate Video)とiframeを抽出する必要があります。
iframeのみが既に完了しています。今、期待
/<iframe(.*)\/iframe>/g
は、誰もが上記のみフェッチするために正規表現を書くのを助けることができる
Dailymotion <br><br></span></strong></div>
<div style="text-align: center;"><iframe src="http://www.dailymotion.com/embed/video/foo1234567890bar? syndication=202279" width="640" height="360" frameborder="0"></iframe>
と
Alternate Video <br><br></span></strong></div>
<div style="text-align: center;"><iframe src="http://hqq.tv/player/embed_player.php?vid=1234567890&autoplay=no" width="720" height="450" frameborder="0"></iframe>
です。
多分、正規表現の代わりにDOMパーサーを使うことができます。 RegexはネストされたXMLをうまく扱いません。 –
返信のために@TimBiegeleisenに感謝します。 Google Apps ScriptにDOMパーサーがあるかどうかを確認する必要があります。 – Hsehdar