2012-02-22 16 views
0

私はPerlを使ってDTDからすべてのコンテンツを抜き出すことを検討していますが、どの方法が最善の方法かはわかりません。私はXMLを扱うためのモジュールがあることは知っていますが、SGMLを使ったこのタイプの作業があるかどうか、またはこの作業のための正規表現を作成する必要があるかどうかはわかりません。Perlを使ってSGML DTDからテキストコンテンツを抽出するには?

私は非常に単純なパターンマッチングを除いて、正規表現の経験があまりないと同時にSGMLとPerlを初めて使いました。

+2

サンプル入力と期待される出力を提供してください。 – mob

+0

[faq]と[ask]を読んで、ここで質問を正しく行う方法を学んでください。 –

+2

ここに質問があり、それは "xmlを正規表現で解析すべきか"です。しかし、それは当然のことであるので、あなたはこの非常にサイト上のすでに5,678回答えられてはいけません。 – sweaver2112

答えて

2

あなたはここに2つのオプションがあります:

  • は私が(!リモート)過去に使用している古いperlSGML分布を使用します。このビーイングは、

  • は、少なくとものDebian/Ubuntuの(パッケージがopenspと呼ばれている)と、最も可能性の高い他のプラットフォームで使用でき、openSPの一部である、osxを使用してXMLにあなたのSGMLに変換、それはまだ現代のperlの上で実行する必要がありますのperlその後、XML ::のlibxml、またはXMLのようなXMLツールを使用::小枝

はSGMLのツールよりも多くのXMLツール、これらの日がありますが、DTDのは、XMLがやや単純なので、もちろん、あなたはいくつかの情報を失うことSGMLよりも

関連する問題