-1
画像の字幕だけを検出するためのカスタマイズされたアイデアが必要です。処理された画像から文字を正確に抽出することができるような画像処理のいくつかのステップ。画像の字幕を検出する
画像の字幕だけを検出するためのカスタマイズされたアイデアが必要です。処理された画像から文字を正確に抽出することができるような画像処理のいくつかのステップ。画像の字幕を検出する
なぜ画像の下をカットして、これにtesseractを適用しないのですか? Linux上でbashを実行すると、以下のようにbashスクリプトに入れて、すべてのイメージ(xargsなど)に適用します。
# filenames
input="$1"
extension=$(echo $(echo "$input"|sed 's/.*\.//g'))
nomfich=$(basename $input .$extension)
interm="$nomfich.tiff"
# convert to tiff and crop
convert -gravity South -crop 100%x15%+0+0 -density 300 $input $interm
# ocr
tesseract $interm $nomfich