stream_context_createを使用すると、file_get_contents
を呼び出すときに送信されるヘッダーを指定できます。
私が提案しているのは、ブラウザを開いてサイトにログインすることです。 Firebug(またはあなたのお気に入りのCookieビューア)を開き、クッキーをつかんであなたの要求に応じて送ってください。
編集:ここではPHP.netからの例です:
<?php
// Create a stream
$opts = array(
'http'=>array(
'method'=>"GET",
'header'=>"Accept-language: en\r\n" .
"Cookie: foo=bar\r\n"
)
);
$context = stream_context_create($opts);
// Open the file using the HTTP headers set above
$file = file_get_contents('http://www.example.com/', false, $context);
?>
編集(2):これは、あなたの質問の範囲外ですが、その後のウェブサイトをこすりする方法を不思議に思っているならば、あなたが見ることができますメソッドDOMDocument::loadHTMLに変換します。これにより、必要な機能(つまり、XPath query、getElementsByTagName、getElementsById)が得られます。
単純なものを削りたい場合は、preg_match_allでRegExを使用することもできます。
それは違法です。適切なフォーマットで料金表をお送りください。 – zerkms
違法ではありません。まったくソースと、コンテンツ制作者からの使用条件、t + c、または明示的な許可を含めて、あなたが与えたstatuatoryパーミッションに依存します。画面のスクレープは、製品の更新を自動化する方法になります。とにかくありがとう。 – gunwin
あなたは私たちにサイトへのURLを与えることができますので、スクリーンスクレイピングを許可するTOSを見ることができますか? – zerkms