Rubyの学習を始めました。非常にクールな言語、それはたくさん好きです。Hpricot、ドキュメントからすべてのテキストを取得
私は非常に便利なHpricot HTMLパーサーを使用しています。
私が探しているのは、HTMLタグを除いて、ページのすべてのテキストを取得することです。
例:
「これは私もしたい私がつかむしたいものです。
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
<html>
<head>
<title>Data Protection Checks</title>
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
</head>
<body>
<div>
This is what I want to grab.
</div>
<p>
I also want to grab this text
</p>
</body>
</html>
私は基本的に私はそうのような文字列で終わるテキストのみをつかむしたいのですこのテキストを手に入れてください "
これを行うにはどのような方法が最適でしょうか?
乾杯
EEF
@Eef、あなたはそれぞれ{テキスト配列 '(DOC/"スクリプト")を収集する前にjavascriptのコードを削除する必要があるかもしれません| JS |。 js.inner_html = ''} '。 – Andrei