2012-10-05 10 views
7

ハスケルでUnicode XMLを処理する正式な解決策は何ですか? 私は、HXTがテキストのために簡単なString表現(Unicode文字のリスト!!!)を使用していることに気付きました。解析時にあなたは2つの表現の間で選択するにはどうすればよいXMLのUnicodeに対するHaskellの姿勢は何ですか?

http://hackage.haskell.org/packages/archive/hxt/9.3.1.0/doc/html/Text-XML-HXT-DOM-TypeDefs.html#t:XNode

Constructors 
XText String ordinary text (leaf) 
XBlob Blob   text represented more space efficient as bytestring (leaf) 

?ユーザーが文字のリストを使用するように強制することは、特にXML文書に多くのテキストコンテンツがある場合は特に魅力的な機能ではありません。

また、私はGoogleにhttp://hackage.haskell.org/package/hxt-unicodeを見つけましたが、どのように解析するのかわかりません。 Unicodeのサポートは、これまで明示的に使用されていました。http://hackage.haskell.org/packages/archive/hxt/8.5.2/doc/html/Text-XML-HXT-DOM-Unicode.html このモジュールは明確な理由なしに最新バージョン(執筆時点では9.3.1.0)で削除されています。その背後にある動機は何でしたか?

誰かがHXTの使い方を教えてもらえますか?この点で、wikiページは真剣に欠けています。ありがとうございました。

+0

「オスコードのUnicode XMLを処理する正式な解決策」を発表するのはどのオフィスですか?私がお勧めするわけではないHXTについて、ソースの上にサンプルファイルがあります:https://github.com/UweSchmidt/hxt。 – applicative

答えて

3

xml-conduitパッケージは、テキストデータを格納するためにTextデータ型を使用します。これは、過去数年間の標準的なテキストデータ表現になっています。 xml-conduitはよく管理されたパッケージであり、私はオープンソースと商用コードの膨大な量を個人的に使ってきました。

関連する問題