htmlをDOMツリーに解析し、<a>
タグ内にないすべてのテキストを検索したいので、私はそれを見つけ出し、 "PHP Simple HTML DOM Parser "を参照してください。それは、HTML DOMをDOMツリーに解析するのに役立つようです。私は<a>
タグの中にないテキストを見つけたいですが、私は<a>
タグの中にある要素しか見つけることができません。 * ps:まだCSS3セレクターをサポートしていません。ありがとうございました。 これについての経験は1つですか?ありがとうございました。PHP Simple HTML DOM Parserを使用してハイパーリンクされていないテキストを見つける方法
答えて
私は質問を誤解していないことを望みますが、
<a>
タグ内のテキストをPHPで見つけるために組み込みのDOM関数を使用することはできませんか?その場合
$doc = new DOMDocument();
$doc->loadHTMLFile("http://blahblah.com/blah.html");
$elem_list = $doc->getElementsByTagName("a");
foreach($elem_list as $elem)
echo $elem->textContent;
私は(正規表現で、たとえば)すべて<a>
タグとその内容を削除して、お好みのDOMパーサに結果のHTMLをロードします。
更新:さらに良いことに、すぐにHTMLを解析し、すべてのタグを通じて<a>
タグ、またはループを削除し、ちょうど<a>
タグをスキップする組み込み関数を使用します。 HTMLを使った正規表現は避けるべきです。
nono、私はタグの中にないテキストが必要です。 – Tattat
ああ、ありがとう。質問の文章は少し誤解を招き、修正しようとしました(編集内容をピアレビューする必要があります)。 – newenglander
私はこのクラスを何回も使用しました。 phpのhtml/domを解析する優れたソリューションです。
$html = new simple_html_dom();
// Load your html as string
$html->load('........ HTML ..........');
$a = $html->find('a');
$text='';
for($i=0;$i<count($a);$i++)
$text.=$a[$i]->innertext;
タグ内のすべてのテキストを含む可変$テキスト。 それがあなたを助けてくれることを願っています。
- 1. Simple HTML DOM Parserを使用してJavascriptからコンテンツを検索
- 2. PHPでのXpathの使い方Simple HTML DOM Parser
- 3. PHP - シンプルなHTML Dom Parser
- 4. Simple HTML DOM PHPを使用してページをクロールする方法は?
- 5. "Simple HTML DOM"を使用して2つのスパン間のテキストを取得する
- 6. HTMLで保存した後に空白を残すSimple Dom Parser
- 7. PHPを使用しているときに選択から要素を削除する方法Simple HTML Domライブラリ
- 8. simple-html-dom-parserで$ elementの単一項目を返します。
- 9. 使用されていないキュウリのステップを見つける方法
- 10. ネットワークで使用されていないIPアドレスを見つける方法は?
- 11. PHPを使用してパブリックフォルダを見つける方法は?
- 12. 添付されたハイパーリンクを使用して作業項目を見つける
- 13. SSL証明書を見つける方法はサーバーにインストールされていますか? (PHPを使用して)
- 14. JQuery - タグで囲まれていないテキストを見つける
- 15. PHP HTML DOMパーサ
- 16. VBAを使用してDOM内のIDを見つける
- 17. HTMLを使ってIPアドレスを見つける方法は?
- 18. HTMLタグで囲まれていないDOM内のテキストにアクセスする方法
- 19. ウェブサイトで使用されている認証を見つける方法
- 20. Javaクラスで使用されているメモリを見つける方法は?
- 21. どのFitNesseバージョンが使用されているかを見つける方法
- 22. PHP SIMPLE DOM PDO select
- 23. Simple HTML Domを使ってimgからsrc属性を変更するPHPライブラリ
- 24. PHPを使用して外部URLを掻く方法簡単なhtml DOMパーサー
- 25. containsを使用しないでXPathを見つける方法
- 26. 私は<a href="http://simplehtmldom.sourceforge.net/manual.htm" rel="nofollow">PHP Simple HTML DOM Parser</a>を使用していますが、以下のソースを使ってHTMLページ内のセクションがあるシンプルなHTML DOMパーサ
- 27. 結合モデルを使用したレールhabtm - リンクされていないレコードを見つける方法?
- 28. JavaScriptを使用してハイパーリンクのテキストを取得する方法
- 29. フォーカスされているNSTextfieldを見つける方法
- 30. スタックされているスレッドを見つける方法
代わりに[DOM](http://php.net/manual/en/book.dom.php)を実際に使用する[SimpleHtmlDom](http://simplehtmldom.sourceforge.net/)のサードパーティの代替案をお勧めします。文字列の解析:[phpQuery](http://code.google.com/p/phpquery/)、[Zend_Dom](http://framework.zend.com/manual/en/zend.dom.html)、[QueryPath ](http://querypath.org/)および[FluentDom](http://www.fluentdom.org)。また、[ベストメソッドまたはHTMLを解析する]を参照してください(http://stackoverflow.com/questions/3577641/best-methods-to-parse-html/3577662#3577662) – Gordon