2017-07-07 12 views
0

私はプロジェクトに取り組んでいます。フォルダから複数のpdfファイルを読み込み、ボタンをクリックするとその内容を表示する必要があります。 私は一度に複数のファイルを読むのに苦しんでいます。どのように私は複数のPDFファイルを読むことができますか?誰か助けてくれますか?asp.netのフォルダから複数のpdfファイルを読むには?

protected void btnShowContent_Click(object sender, EventArgs e) 
      { 
       //if (fileUpload.HasFile) 
       //{ 

        foreach (string file in Directory.GetFiles(@"E:\\Rida\","*.pdf")) 
        { 
        string str = ""; 
        str = str + ", " + file.ToString(); 
        PdfReader reader = new PdfReader(file); 
         string strPDFFile = file.ToString().Trim(); 
         StringBuilder strPdfContent = new StringBuilder(); 
        string pdfText = strPdfContent.ToString(); 
         string contents = File.ReadAllText(strPDFFile); 

         for (int i = 1; i <= reader.NumberOfPages; i++) 
         { 
          ITextExtractionStrategy objExtractStrategy = new SimpleTextExtractionStrategy(); 
          string strLineText = PdfTextExtractor.GetTextFromPage(reader, i, objExtractStrategy); 
          strLineText = Encoding.UTF8.GetString(ASCIIEncoding.Convert(Encoding.Default, Encoding.UTF8, Encoding.Default.GetBytes(strLineText))); 
          strPdfContent.Append(strLineText); 
          strPdfContent.Append(contents); 

          strPdfContent.Append("<br/>"); 
         } 
        reader.Close(); 
        lblPdfContent.Text = strPdfContent.ToString(); 
        }    
      } 

この行は、私のpdfファイルの内容を特殊文字に変換します。この変換を避けるにはどうすればよいですか?

string contents = File.ReadAllText(strPDFFile); 
+0

は、なぜあなたはライン ''文字列の内容= File.ReadAllText()を必要とします; ''すべてで? '' strPdfContent''には既にコンテンツがありますか? –

+0

'File.ReadAllText'は何をすると思いますか? PDFファイルのテキストコンテンツは表示されません。 PDFは、解釈する必要がある特別な形式です。 –

+0

ほとんど2つの行が何らかの理由なく入力されたようですが、それらは間違っていて何もしません... "' string pdfText = strPdfContent.ToString();文字列contents = File.ReadAllText(strPDFFile); '' –

答えて

0

限り私は、.NET環境でのPDFの解析および操作について知っているように、あなたはiTextSharpを使用することができ、それはあなたが、CREATE ADAPT、INSPECTおよびPDFの文書を維持することができますPDFライブラリです。 ライブラリを使用すると、問題の解決に役立ちます!

https://sourceforge.net/projects/itextsharp/

http://jadn.co.uk/w/ReadPdfUsingCsharp.htm

+0

私はこのライブラリを使用していますが、私が直面している問題は、コードを実行してフォルダから最初のファイルを読み込み、次のファイルをいくつかの特殊文字に変換するときです。 –

+0

iTextSharpを使用して1つのテキストファイルを読み込むことができました。一度に複数のファイルを読むためには、テキストファイルで作業する必要があります。 この記事を読むと、PDFが特別なフォーマットであり、作業するのが少し難しいので、参考になるかもしれません! https://stackoverflow.com/questions/83152/reading-pdf-documents-in-net –

関連する問題