2016-10-03 1 views
0

を使用してHOCRファイルを生成C#のは、私は動的に私のコードの環境変数にtessdataの場所を追加して実行する必要があり、現在たTesseractラッパー<a href="https://github.com/charlesw/tesseract" rel="nofollow noreferrer">here</a></p> <p>を使用してHOCRを生成することができますどのようにcharleswのたTesseract

System.Diagnostics.Process pProcess = new System.Diagnostics.Process(); 
      pProcess.StartInfo.FileName = System.IO.Path.GetDirectoryName(Environment.GetCommandLineArgs()[0]) + @"\tesseract-3.05.00dev-win32-vc19\tesseract.exe"; 
          string inputImg = @"00067.jpg"; 
      string hocrLocation = @"00067"; 
      string argsPdf = "\"" + inputImg + "\"" + " " + "\"" + hocrLocation + "\"" + " hocr "; 
      Console.WriteLine(argsPdf); 
      pProcess.StartInfo.Arguments = argsPdf; 
      pProcess.StartInfo.CreateNoWindow = false; 
      pProcess.StartInfo.UseShellExecute = false; 
      pProcess.StartInfo.RedirectStandardOutput = true; 
      pProcess.Start(); 
      string strOutput = pProcess.StandardOutput.ReadToEnd(); 
      Console.WriteLine("OUtput: " + strOutput); 
      pProcess.WaitForExit(); 

私はtesseractラッパーを見つけました。どのように私はラッパーを使用してhocrファイルを生成することができますか?私はそれを行う方法の例を見つけることができません。

これは現在のコードです(この例では)ですが、どのようにhocrファイルを出力するのですか?

var testImagePath = "./phototest.tif"; 
      if (args.Length > 0) 
      { 
       testImagePath = args[0]; 
      } 

      try 
      { 
       using (var engine = new TesseractEngine(@"./tessdata", "eng", EngineMode.Default)) 
       { 
        using (var img = Pix.LoadFromFile(testImagePath)) 
        { 
         using (var page = engine.Process(img)) 
         { 

         } 
        } 
       } 
      } 
      catch (Exception e) 
      { 
       Trace.TraceError(e.ToString()); 
       Console.WriteLine("Unexpected Error: " + e.Message); 
       Console.WriteLine("Details: "); 
       Console.WriteLine(e.ToString()); 
      } 

答えて

0

string hocrText = page.GetHOCRText(pageNum - 1);

関連する問題

 関連する問題