texからテキストを抽出してラテックスタグを取り除きます

\ section {...}や\ newpageのようなラテックスタグを使わずにプレーンテキストを受信したいいくつかの.texファイルがあります。
これを達成する方法について誰も知りませんか？私も.pdfファイルを持っていますが、そこからコードをコピーすると、いくつかの単語が連結してしまい、本当に悪いことになります。
ご存じのツールがありますか？texからテキストを抽出してラテックスタグを取り除きます

出典

2009-05-06 cb0

detex(1)：

OpenDetexの最新バージョンをOpenDetex GitHub pageを参照してください。私の元のDeTeXのより現代的で派生したバージョンです。

私の遺産DeTeX home pageは、hereです。

従来のdetex-2.8.tarソースをそのまま使用したい場合は、hereとすることができます。

出典

2009-05-06 13:37:14

であると言います！ –

ASCIIテックスファイルでのみ動作します。 ASCII以外の文字でxelatexとUTF-8でエンコードされたtexファイルを使用している場合、detexはASCII以外の文字に対してjunkを出力します。 – Lucas

オープンソースで、いつでも修正できます。 –

opendetex WindowsおよびLinux

はこちらから
http://opendetex.googlecode.com/files/opendetex-2.8.1.tar.bz2
http://code.google.com/p/opendetex/downloads/list

使用プログラムopendetexをダウンロードの両方で提供されています： http://code.google.com/p/opendetex/wiki/Usage

はあなたの選択の任意のディレクトリに解凍。ダウンロードディレクトリに解凍してください。

任意の名前のディレクトリを作成します（オプションですが、作成するとうまくいきます）。ディレクトリ名が "my_paper"であるとします。あなたの論文を "my_paper"ディレクトリに入れてください。あなたの紙名がパスを通してproject.tex

移動

cd ~/Downloads/opendetex

コマンドを実行します

detex -n my_paper/project.tex > out.txt

どういたしまして一般的な形式

detex -n full_path_to_tex_file.tex > output_text_file.txt

出典

2013-01-14 13:50:19

texからテキストを抽出してラテックスタグを取り除きます

答えて

関連する問題