0
Webサイトのソースコードから取得したHTMLがあります。私のページからウェブサイトにポストメソッドを使ってデータを送信し、その応答はソースコードです。私はソースにテキストが必要です。DOMで整形されていないHTMLを処理する
文書の形式が正しくありません。だから、私はDOMを使用することはできません、私はDOMとタグとデータを分離することはできません。 タグとデータをどのように分けることができますか?どのようにして唯一のデータを得ることができますか?
私はPHPを使用しています。
ありがとうございました。
可能重複(http://stackoverflow.com/questions/2168610/which-html-parser -is-best) –
こちらも参照http://stackoverflow.com/questions/238036/java-html-parsing –
後で私はPHPを使用しています。 – Maozturk