2017-05-07 8 views
2

ちょっと私は結晶のいくつかのHTML解析ライブラリを探しています。ルビのためのnokogiriに似た何か。私は正常に動作する正規表現を持っていますが、html + regex == badであるため、html解析ライブラリを好むでしょう。ありがとう。HTML解析ライブラリはありますか?

+0

イマイチ鋸山結晶互換性がありますか? – marmeladze

+0

ませRubyライブラリを使用すると、Javaのを使用することはできません同じように「水晶の互換性」ではない@marmeladze JavaScriptのライブラリは全く別の言語です。 – RX14

+0

https://github.com/veelenga/awesome-crystal#htmlxml-parsing –

答えて

4

Crystal標準ライブラリの標準的な方法はXML.parse_htmlです。これは、あなたにかなり良いインターフェイスを持ってXML::Nodeを与えるでしょう。

にが必要な場合は、Crystagiriを使用することができます。それ以外の場合は、stdlibの提供より多くのメリットはありません。

2

私はちょうど約myhtml,modestおよびCrystagiriを見つけた。それらはすべてHTML解析ライブラリです。

+0

答えにplsのリンクを追加 –

0

私はCrystagiriの作成者です。これは驚くべきNokogiri Rubyの宝石のようなクリスタルのためのHTMLパーサライブラリを(である私はCrystagiriが鋸山としてあまりないことふりをしませんが、あなたはCSSセレクタを使用するために使用できる基本的な例ベロー

:。。

require "crystagiri" 

doc = Crystagiri::HTML.from_url "http://example.com/" 
puts doc.css("li > strong.title") { |tag| puts tag.node} 
# => <strong class="title"> .. </strong> 
# => <strong class="title"> .. </strong> 
(私のテストにaccroding)クリスタル・ラングへ

おかげで、Crystagiriは3時間より早くNokogiriよりもある。

関連する問題