2016-10-10 14 views
0

(潜在的に複雑な)LaTeX文書をとり、mathmodeでレンダリングされるLaTeXソースを取り出したいと思っています。私がしていると考えることができますオプション、equationためラテックス文書から数学を抽出する方法

  • をGrep、$$など
  • 使用pandocようなコンバータとは、単純な形式
  • 使用から表現を抽出LaTeXのためextractパッケージを使用しますレンダラーからの中間DOM(plasTeXがこれに適していると思われる)

残念ながらgrepはハッキーで、マクロでは動作しません。 extractはうまくいくようですが、使用するのは面倒です。 pandocplasTeXの両方が、複雑な「実世界」の文書に問題があります。

私はこれを行うための簡単な/より堅牢な方法を見落としていますか?

答えて

1

pandocは複雑なレイアウトを表すことはできませんが、それは数学をサポートしており、pandoc LaTeXリーダーは数学環境を非常に信頼性高く検出します。だから私はpandoc filterを書いて、Math elements以外のすべてを削除することを提案したいと思います。また、Pythonでフィルタを作成しますが、の線に沿ってHaskellの何かにすることができます

pandoc --filter dropNonMath.hs -f latex -t latex input.tex 

#!/usr/bin/env runhaskell 
-- dropNonMath.hs 
import Text.Pandoc.JSON 

main = toJSONFilter dropNonMath 
    where dropNonMath (Math x y) = Math x y 
     dropNonMath _ = [] 

、その後でそれを実行します

関連する問題