0
フォルダ内のすべての画像を読み込み、画像からテキストを抽出しようとしています。私は2番目のforループのエラーメッセージを受け取り続ける。例えば、Tesseractを使用した画像からテキストへの変換
AttributeError: 'numpy.ndarray' object has no attribute 'read'
私がリストIMGにアクセスすることはできませんようです。何か案が?
# import OpenCV, Numpy, Python image library, Tesseract OCR
import os
import cv2
import numpy
from PIL import Image
import pytesseract
import glob
#set tesseract path
pytesseract.pytesseract.tesseract_cmd = 'C:/Program Files (x86)/Tesseract-OCR/tesseract.exe'
#read all image with .jpg format in a specifying folder
img = []
for i in glob.glob("C:\\Users\\daizhang\\Desktop\\Deloitte Development\\Python\\Reports\\Image\\*.jpg"):
n= cv2.imread(i,0) #convert image to grayscale
print(i)
img.append(n)
for j in img:
im = Image.open(j)
text = pytesseract.image_to_string (j, lang='eng')
with open("C:\\Users\\daizhang\\Desktop\\Deloitte Development\\Python\Reports\\Image\\test.txt", "w") as f:
f.write(text.encode('utf8'))
'Image.open'は、ファイルを開いてそこからPIL Imageオブジェクトを作成するためのものです。 Numpy配列の生のイメージデータをPIL Imageオブジェクトに変換するには 'Image.fromarray(raw_image)'を使います。 –