2012-01-16 57 views
5

pdfのギリシャ文字を検索する方法がわかりません。これどうやってするの?理想的には、私はpdfビューアソフトウェアパッケージ内でこれを行うことができます。PDF文書内のギリシャ文字を検索する

私が見たことから、ギリシャ語の文字は、pdf仕様に含まれている標準のUnicode文字の外にあります。

+0

文字が[\ u0391- \ u03A9、\ u03B1- \ u03C9]と一致するかどうか調べることができないのはなぜですか? –

+0

xpdfからpdftotextコマンドを使用すると、ギリシャ語の文字がラテン文字として出力されます。私は、pdftotextがギリシャのアルファベットを含んでいないutf-8で出力するからだと思う[リンク](http://superuser.com/questions/220363/cleaning-up-pdftotext-font-issues)pdf2textの出力設定私はギリシャ文字を含むだろうか? – Chogg

+0

しかし、私はこれらの文字をpdf-XChangeビューアなどのプログラムで検索するのが望ましいです。私は検索ボックスに入力する文字を入力するだけなので、Unicodeエンコーディングを構成する文字(たとえば\ u0391)ではなく、Unicodeエンコーディングを検索する必要があるという事実を示す方法はわかりません私が何を意味するかを見てください。 – Chogg

答えて

2

私は間違っていたことを解決しました。かなり基本的でした。

ギリシャ文字を検索するには、文字マップを使用するか、ギリシャ文字のキーボード(αβγなど)に切り替えるだけです。

これは、一般的にギリシャ文字を検出します。多くのPDFはギリシャ文字を正しく認識せず、その代わりに他の形の文字に近似しています。これは、おそらくPDFの作成方法に依存します。

関連する問題