2
私はいくつかのマークアップされたデータのためのパーサーを書いています、そして、私は、最終結果の開始タグと終了タグのようなものを破棄して、データだけを残しておくようにしたいと思います。解析された文字列の一部を破棄するようにpyparsingに指示するにはどうすればよいですか?
これを行うことはできますか、または値を適切に指定して手動で取り出すだけでよいですか?
私はいくつかのマークアップされたデータのためのパーサーを書いています、そして、私は、最終結果の開始タグと終了タグのようなものを破棄して、データだけを残しておくようにしたいと思います。解析された文字列の一部を破棄するようにpyparsingに指示するにはどうすればよいですか?
これを行うことはできますか、または値を適切に指定して手動で取り出すだけでよいですか?
"抑制"はおそらくあなたが望むものです。 dont_care = Suppress(Word(alphas))
のようにSuppressクラスを明示的に使用するか、任意の式のsuppress()を呼び出すことができます(dont_care = Word(alphas).suppress()
)。これにより、一致するトークンが解析された出力に表示されなくなります。
マークアップタグがXMLのように見える場合は、 'makeHTMLTags'と' makeXMLTags'もチェックしてください。これらのヘルパーは文字列の周りに '<>'を追加するだけでなく、埋め込み属性、大文字と小文字の違い、迷いのある空白があります。 – PaulMcG