2017-03-18 12 views
0

私はウクライナのテキスト(キリル文字)でPDF文書を持っています。しかし、コピーして入力フィールドに貼り付けると、次に何かが得られます。未知のPDFエンコーディング

ȿɄɈɇɈɆȱɄɈ-ɋɌȺɌɂɋɌɂɑɇɂɃ ȺɇȺɅȱɁ ȼɂȻȱɊɄɈȼɈȽɈ 

テキストの検出や変換は私を助けませんでした。

通常のウクライナのテキストをコピーする方法とは何ですか?

+0

これはAdobe Acrobatなどのツールですか? – Dai

+0

@Dai多くのアプリやWebブラウザで開こうとしました。結果は同じです。それはいいように見えますが、私はそれをコピーすることはできません。 –

答えて

1

埋め込みフォントサブセットで、toUnicodeマッピングなしでPDFが作成されている可能性があります。基本的に、PDFのコンテンツで使用される文字のコードはPDFに埋め込まれたグリフにマップされますが、これらのコードから通常のUnicodeコードへのマッピングはありません。元の内容を抽出する唯一の方法は、何らかの形のOCRを使用することです。

関連する問題