2012-05-06 6 views
1

私は自分のウェブサイトにスクリプトを作成していますが、これを最小限のコーディングでうまく動作させる方法を少し混乱させています。ウェブサイトでPHPを使用したリンクを確認しています

基本的には、domain.comのURLを入力することができ、ドメインを指すリンクをホームページで検索し、rel = "nofollow"が割り当てられているかどうかを確認するか、リンクがない場合はtrueを返し、リンクがない場合はfalseを返します。rel = "nofollow"のリンクを返します。

どのように私はこれについて行くか、どこから始めると思いますか?

私はスパイダーを作成する方法を探ってきましたが、作成しようとしている基本的なスクリプトのためにはるかに多くの情報と複雑さがあります。

答えて

1

あなたが求めるものは、思ったほど単純ではありません。これを正しく行うには、DOMDocumentなどのDOMパーサーを使用する必要があります。

http://www.php.net/manual/en/class.domdocument.php

あなたはあなたを介してスキャンしたいWebページを解析するために、そのloadHTML()メソッドを使用することができます。そこからさまざまな機能を使用して、探している特定のリンクを探し、その属性を確認してURLが正しいことを確認して、rel="nofollow"がそこにあることを確認できます。

最後に、URLの文字列検索よりもはるかに簡単です。ブラインド検索の道を辿ると、不正確な結果につながり、あなたが気づいているよりもはるかに面倒なことになります。

0

http://simplehtmldom.sourceforge.net/.

// Create DOM from URL or file 
$html = file_get_html('http://www.google.com/'); 
// Find all links 
foreach($html->find('a') as $element) 
     echo $element->href . '<br>'; 
を見てみましょう
関連する問題