未知のPDFエンコーディング

私はウクライナのテキスト（キリル文字）でPDF文書を持っています。しかし、コピーして入力フィールドに貼り付けると、次に何かが得られます。未知のPDFエンコーディング

ȿɄɈɇɈɆȱɄɈ-ɋɌȺɌɂɋɌɂɑɇɂɃ ȺɇȺɅȱɁ ȼɂȻȱɊɄɈȼɈȽɈ

テキストの検出や変換は私を助けませんでした。

通常のウクライナのテキストをコピーする方法とは何ですか？

出典

2017-03-18 Ted Romanus

これはAdobe Acrobatなどのツールですか？ – Dai

@Dai多くのアプリやWebブラウザで開こうとしました。結果は同じです。それはいいように見えますが、私はそれをコピーすることはできません。 –

埋め込みフォントサブセットで、toUnicodeマッピングなしでPDFが作成されている可能性があります。基本的に、PDFのコンテンツで使用される文字のコードはPDFに埋め込まれたグリフにマップされますが、これらのコードから通常のUnicodeコードへのマッピングはありません。元の内容を抽出する唯一の方法は、何らかの形のOCRを使用することです。

出典

2017-03-19 11:09:40 lecstor

未知のPDFエンコーディング

答えて

関連する問題