2016-04-04 13 views
1

<p>タグを含むウェブサイトを解析する必要があります。それらのタグを取得し、それらをcsvファイル(同じ列)に配置したいと考えています。HTMLウェブページを解析して<br>タグを削除するにはどうすればよいですか?

テストの後、私は段落を見ているが、同じ列にありません、それは<p>タグの例にあるようので<br>のだ:

HTML:

<div class="text"> 
    <p> hello <br> friends </p> 
    <p> parsing is cool <br> using <br> simpleHTMLdom </p> 
</div> 

私はHTMLを解析する場合下の2つは<p>ですが、同じcsvの「列」にはありません。

マイコード:

if($html_book_page->find('.text')){ 

    foreach($html_book_page->find('div[class=text] p') as $bookPreview){ 
     array_push($book, $bookPreview->plaintext); 

     }      
    } 

$帳は、すべてのテキストを含む配列であると私は好きCSVに$帳を置く:取得する

fputcsv($open_csv, array_values($book), ',', ' '); 

任意の方法:CSVの (ヘッダ:TEXT )and inside: "HelloHow friendsの解析はsimpleHTMLdomを使ってクールです"? 「解析がクールである」...「を使用して」..瞬間を私は持っている「こんにちは」と別の列に、私は「友人」たので....「simpleHTMLdom」

はあなたのすべて

答えて

1

なぜありがとうございましたあなたのCSV挿入の前にjQuery.remove()をしないでください?

$('.text p').find('br').remove() 

あなたは永久にページから<br>を削除したくない場合、あなたはあなたのためのループにこのような何かを行うことができます:

foreach($html_book_page - > find('div[class=text] p') as $bookPreview) { 
    $bookPreview.innerHTML.replace("<br>", ""); 
    array_push($book, $bookPreview - > plaintext); 
} 
このような何か
関連する問題