2016-09-11 20 views
3

docutilsを使用して、RST(reStructuredText)ファイルをHTMLに変換しました。 小規模な開発されたJSアプリケーション(HTML5 contenteditable属性を持つ基本的なiframe)を使用すると、技術者以外の人が簡単に生成されたHTMLページを編集できます。目標は、元のRSTファイルにHTMLで行われた変更を適用することです。HTMLからRSTへの変換

original_RST - > outputed_HTML変換のグラウンドトゥルースでアルゴリズムを訓練する方法があるかどうか疑問に思っています。後でoutputed_HTML +マイナーな修正をRSTに戻すことができますか?それはどんなアルゴリズムですか?どちらの方法で掘削を始めるべきですか?

代わりにRSTの、私も(RST XML-ASTへ:http://docutils.sourceforge.net/tools/quicktest.py)文書入力としてのdocutilsの内部XML AST表現を使用することができ、問題を単純化するために、後で、xml2rst + XSLTプロジェクト(http://www.merten-home.de/FreeSoftware/xml2rst/

を修正

任意の提案は、あなたが別のものに1つのマークアップ形式からファイルを変換する必要がある場合は

答えて

1

Pandoc

を試して歓迎され、pandocはあなたのスイスアーミーナイフです。

関連する問題