2012-01-18 6 views
0

LaTeXをHTMLコードに変換するCプログラムを書き始めました。私の意見では、正規表現を使用するのが最も良い方法ですが、PCREでこの単純な考え方を使うことはできません。\term{abc}[pre]abc[/pre]\termは私のLatexコマンドです)と置き換えてください。LaTeXの正規表現がエスケープされた}(中かっこ)が必要

  1. どのようにエスケープ処理するのです中括弧(\}\term中:今、ここでキャッチですか?
  2. {}のようなペアを処理するにはどうすればよいですか?
  3. 正規表現を貪欲にして、多くの\termコマンドのうちの最初のものを消費するようにするにはどうすればよいですか?

よく分かりますか。誰かが助けることを願っていますか?

PS:、どのような場合には、私は同様の質問への答えを見落としている場合はごめんなさい...

+3

これは本当に3つの別々の質問です。あなたがこれを打ち破れば、より良い反応を得るでしょう。 –

答えて

2

参照くださいperlfaq6(1)「私はバランスの取れたテキストに一致するPerlの正規表現を使用することはできますか? "つまり、ラテックスの複雑さは、(x)htmlよりも似ているように見えるので、RegEx match open tags except XHTML self-contained tagsという言葉に耳を傾けたいと思うかもしれません。

+0

私はその答えが言及されることを知っていた。私はCthuluを嗅ぐことができた。 –

+0

一言、本当に "本当の" LaTeXパーサーを書いて、代わりにPCReで作業できるようにしたいと思っていました。私の腸の感覚が最初に正しいと思われる... – smiter

0

私はあなたが必要とするものを正確にはわかりませんが、htlatex(TeX4HTの一部)、pandoc、またはその他のオプションのいずれかを検討することもできます。 TeXは解析するのが難しいことが知られています。

関連する問題