2016-11-28 8 views
-1

私はsimplehtmldomを使用していますが、リンクをすべて取得しようとしていますウェブサイトから。これは私のスクリプトです:私は取得しています何URLに%3Fを取得する

include('simplehtmldom/simple_html_dom.php'); 

// get DOM from URL or file 
$html = file_get_html('http://example.com/urls/'); 

// find all a tags 
foreach($html->find('a') as $e) 
    echo $e->href . "\n"; 

のURLの完全なリストであるが、それらのいくつかは、文字列があるsould %の3Fで終わります。何かのように:

http://example.com/urls/%3F 

の代わりに:

http://example.com/urls/foo 

私はいくつかの研究を行ってきた、修正がそれにアクセスすることはできませんTI BU Apacheサーバ上で行われる必要があるようですそれを修正するために何かできることはありますか?

+0

%3FはURLのエンコードされたバージョンです**?** ...これはApacheで* "修正" *する必要があるとは思わないです。 – CD001

答えて

1

ただ、このように着信URLをデコード:

echo urldecode($e->href)."\n"; 

それは文字列のデコードURLを与えます。

+0

保存しました。ありがとう! – sysfiend