2017-05-04 8 views
0

私たちがアップロードした画像のテキストを読むには助けが必要です。私はTesseract PHP OCRを使用しています。画像からテキストを読み込むphp api wahtever we uplaod

しかし、それを使用する考えを得ていない。私はここに私のファイルを添付しています。

Tesseractファイルはこちらから:https://github.com/thiagoalessio/tesseract-ocr-for-php/tree/master/src と私のPHPは添付の画像を書いています。 enter image description here

+0

tesseract ocrをインストールしましたか? –

+0

[よくある質問](http://stackoverflow.com/help/how-to-ask)と[完璧な質問](http://codeblog.jonskeet.uk/2010/08/29 /あなたの質問を改善し、答えを得るチャンスを作るために、[最小、完全で実証可能な例(MVCE)]を作成する方法(http://stackoverflow.com/help/mcve) –

+0

ウェブホストにtesseractをインストールしましたか? PHPエラーが出ていますか? – M31

答えて

-1
+0

このリンクは質問に答えるかもしれませんが、ここでは答えの重要な部分を含めて、参照/ダウンロードのリンクを提供する方がよいでしょう。リンクされたページが変更された場合、リンクのみの回答は無効になります。 –

+0

この回答は元の質問とは関係がありません。OPは、画像内に隠されたテキストではなく、表示されているテキストを抽出したいからです。 – Bonzo

0

このlibaryを使用することができ、私はあなたがtesseract-必要Ubuntuの16.04

$inputPDF = 'path/to /your/file'; 
$fileToOCR = "ocr.tiff"; 
exec("convert -density 300 $inputPDF -depth 8 -strip -background white -alpha off $fileToOCR"); 
$outputOCR = "ocr"; 
exec("tesseract $fileToOCR -l deu+eng $outputOCR hocr"); 

ノート上のpdfファイルのためのOCRを行うために使用する小さなスクリプトですocrとimagemagickがインストールされましたsudo apt-get install tesseract-ocr imagemagick

また、使用する言語パックが必要です012

は良好な結果

exec("tesseract ... ");がDEU + 1 ENGテキストとHOCRから言語(テキストが見つかった追加に関する情報を持つXML)が出力フォーマットである実際のOCRを行うためのファイルを準備

が(それは無料です)あなたはこのAPIを使用することができ、それは

0

を役に立てば幸い:

<?php 
$url = 'http://server.com/image.png'; 
$data = json_decode(file_get_contents('http://api.rest7.com/v1/ocr.php?url=' . $url . '&format=txt')); 

if (@$data->success !== 1) 
{ 
    die('Failed'); 
} 
$txt = file_get_contents($data->file); 
file_put_contents('text.txt', $txt); 

$urlをURLに置き換えて画像ファイルに置き換え、出力はtext.txtと保存されます。

関連する問題