2010-12-25 8 views
1

iframeに別のページを読み込んでいるページがあります。呼び出されているページは私のサイトから呼び出されたものを動的に処理するので、実際に直接呼び出すことはできません。同じページを呼び出して同じ動的コードを2回実行するのは非効率です。読み込みが完了したら、あなた自身のウェブページをこすりますか? (PHPを使用)

私がしたいのは、自分のページがロードされ、それを掻き立てて、特定の独特のものを解析し、解析された結果を処理することです。私は構文解析の結果を解析して処理する方法を知っていますが、自己スクレイピングの仕方ははっきりしていません。

誰もが何か提案がありますか?

TIA

答えて

1

使用AJAXあなたが欲しいしかし、それを解析し、スクリプトにページ出力を送信します。私はあなたが "掻き集める"ことによって何を意味するのか本当に分かりません。本当にタグを追加する必要があります。

+0

ちょうどこの問題に戻って、アイデアのおかげで、私はそれを試してみましょう。 =) –

1

あなたの出力を非効率的に(特にレンダリングされたページの解析と比較して)掻くというアイデアは、本当に私には当てはまりません。ページがレンダリングされると、あなたの問題はあなたの出力を取得している場合

それでも、あなたはoutput buffering control functionsを使用することができます。

ob_start(); 
render_your_page(); 
$rendered_page = ob_get_contents(); 
ob_end_flush(); // Sends page, turns off output buffering 
scrape($rendered_page); 

編集:私は、私が正しくあなたの質問を理解したいと考えています。クリスマスの午前5時20分です。私はベッドの準備が整いました:)

+0

明確にするために、私が自分のコンテンツを掻き集めるという奇妙なやり方をしなければならないのは、例えば、自分のWebページをiframeに読み込み、iframeに別のWebサイトを読み込んでいるためですいくつかのJSが実行された場所を呼び出し、その結果をiFrameに返します。私がしなければならないのは、iFrameから返された情報を掻き集め、その部分を保存することです。 –

関連する問題