これは間違ったOCRのケースです。私は、PDFから隠されたテキストを削除する必要があり、私はそれを行う方法を考え出すのが苦労している。iTextSharpでPDF内のオブジェクトを削除して保存します
隠されたテキストは、/ QuickPDFsomethingという名前の領域にあり、/ XObject辞書はページの/ Resourcesディクショナリにあります。
私はこれら二つのことを試してみましたし、どちらも私は明らかに間違って何かをやっている仕事をしていません。
オプション1- Kill obj - PDFはAcrobatで開かれず、「このページにはエラーがあります。 Acrobatではページが正しく表示されないことがありますが、正常に表示されます。 'Critical parser failure:XObject resource missing'というピットストップが発生します。
PdfReader.KillIndirect(obj);
oPdfFile.GetPdfReader().RemoveUnusedObjects();
var stamper = new PdfStamper(oPdfFile.GetPdfReader(), new FileStream(@"C:\temp.pdf", FileMode.Create));
stamper.Close();
オプション2 - CleanupProcessorは、 - A「グラフィックスオブジェクトは、インデックス付きピクセルフォーマットを有する画像から作成できません」に関する例外をスロー。
var stamper = new PdfStamper(oPdfFile.GetPdfReader(), new FileStream(@"C:\temp.pdf", FileMode.Create));
var cleanupLocations = new List<PdfCleanUpLocation>();
var pageRect = oPdfFile.GetPdfReader().GetCropBox(1);
cleanupLocations.Add(new PdfCleanUpLocation(1, pageRect));
PdfCleanUpProcessor cleaner = new PdfCleanUpProcessor(cleanupLocations, stamper);
cleaner.CleanUp();
stamper.Close();
I(この画像で41 0 R)/ QuickPDFオブジェクトを削除ならびに/ QuickPDF Doを用いてそれを呼び出すコンテンツストリームからそれを削除したいです
残念ながら私はPDFを提供できません。
これを行う方法に関するヒントを教えてください。
これは別の方法です。 http://stackoverflow.com/a/39353196/943231 – Darren