2017-05-28 23 views
-1

画像の字幕だけを検出するためのカスタマイズされたアイデアが必要です。処理された画像から文字を正確に抽出することができるような画像処理のいくつかのステップ。画像の字幕を検出する

答えて

1

なぜ画像の下をカットして、これにtesseractを適用しないのですか? Linux上でbashを実行すると、以下のようにbashスクリプトに入れて、すべてのイメージ(xargsなど)に適用します。

# filenames 
input="$1" 
extension=$(echo $(echo "$input"|sed 's/.*\.//g')) 
nomfich=$(basename $input .$extension) 
interm="$nomfich.tiff" 
# convert to tiff and crop 
convert -gravity South -crop 100%x15%+0+0 -density 300 $input $interm 
# ocr 
tesseract $interm $nomfich