2011-06-30 14 views
0

これは私のコードです。ページを取得して、リンクを見つけてinnertext(<a >innertext</a>)を印刷するだけです。しかし、何らかの理由で単純なhtml domはここでたくさんのリンクをスキップしています。具体的には、そのページの最初のdiv(<div id="getconfused">)からのすべてのリンクが欠落しています。 なぜですか?問題を解決するために何ができますか?単純なHTML DOMが正しく

答えて

0

体内のdivですか?そうでなければページは有効ですか? おそらく、その部分でhtmlが壊れているため、divがスキップされる可能性があります。

+0

はい本体内 –

+0

HTMLは有効ですか?たぶん、バリデーターを使ってそれをチェックすることができます。リンクがブラウザに表示されていても、HTMLが有効であるとは限りません。 simple_html_domがエラーを解析できない可能性がある間に、エラーがブラウザによって暗黙的に訂正される可能性があります。 – GolezTrol

+0

nopes、27エラー。私は今htmltidyしようとしています.. –

関連する問題