2009-05-06 1 views
14

\ section {...}や\ newpageのようなラテックスタグを使わずにプレーンテキストを受信したいいくつかの.texファイルがあります。
これを達成する方法について誰も知りませんか? 私も.pdfファイルを持っていますが、そこからコードをコピーすると、いくつかの単語が連結してしまい、本当に悪いことになります。
ご存じのツールがありますか?texからテキストを抽出してラテックスタグを取り除きます

答えて

19

detex(1)

OpenDetexの最新バージョンをOpenDetex GitHub pageを参照してください。私の元のDeTeXのより現代的で派生したバージョンです。

私の遺産DeTeX home pageは、hereです。

従来のdetex-2.8.tarソースをそのまま使用したい場合は、hereとすることができます。

+0

であると言います! –

+4

ASCIIテックスファイルでのみ動作します。 ASCII以外の文字でxelatexとUTF-8でエンコードされたtexファイルを使用している場合、detexはASCII以外の文字に対してjunkを出力します。 – Lucas

+1

オープンソースで、いつでも修正できます。 –

6

opendetex WindowsおよびLinux

はこちらから
http://opendetex.googlecode.com/files/opendetex-2.8.1.tar.bz2
http://code.google.com/p/opendetex/downloads/list

使用プログラムopendetexをダウンロードの両方で提供されています: http://code.google.com/p/opendetex/wiki/Usage

はあなたの選択の任意のディレクトリに解凍。 ダウンロードディレクトリに解凍してください。

任意の名前のディレクトリを作成します(オプションですが、作成するとうまくいきます)。ディレクトリ名が "my_paper"であるとします。あなたの論文を "my_paper"ディレクトリに入れてください。あなたの紙名がパスを通してproject.tex

移動

cd ~/Downloads/opendetex 

コマンドを実行します

detex -n my_paper/project.tex > out.txt 

どういたしまして一般的な形式

detex -n full_path_to_tex_file.tex > output_text_file.txt 
関連する問題