私はsimple_html_dom.php
を使用して、ウェブページからhrefのすべての値を取得します。 これは私のコードです:simple_html_dom.phpを使って 'a'タグからの実際のリンクを取得するには?
<?php
include_once('simple_html_dom.php');
$url=$_GET['url']; //this is the target website address (for example, http://127.0.0.1/mysite/default.php?url=https://www.google.com)
if($url){
$html = file_get_html($url);
foreach($html->find('a') as $e) {
echo $e->href . '<br>';
}
}
?>
しかし...問題が出力されます。このような出力は、,/domains
など、または//en.wikipedia.org
,//ro.wikipedia.org
などです。
これらの出力を標準URLに変換する方法(例:http://www.example.com/about
またはhttps://www.example.com/page
など)?
これは、直接 'HTML'テキストを解析します。したがって、 '/ page'と書かれていれば' https:// www.example.com/page'を得ることができません。ドメインまたはプロトコルを手動で追加する必要があります。 URLのどの部分が欠落しているかを確認するには、 'parse_url'関数を使用してください。 –
どうすればいいですか? –
の答えをご覧ください。 –