2017-03-28 11 views
1

複数ページのPDF文書をリスト構造の一連の画像オブジェクトに変換したいのですが、ディスクに画像を保存せずに(私はそれらをPIL画像で処理したいと思っています)Pythonで行います。これまでのところ私は最初のファイルに画像を書き込むために、この操作を行うことができます。複数ページPDFをPythonの画像オブジェクトのリストに変換するには?

from wand.image import Image 

with Image(filename='source.pdf') as img: 

    with img.convert('png') as converted: 
     converted.save(filename='pyout/page.png') 

をしかし、どのように、私は直接PIL.Imageオブジェクトのリストの中に上記のimgオブジェクトを回すことができますか?

答えて

0

のPython 3.4:

import PIL 
from wand.image import Image 
import os 
import io 

if __name__ == "__main__": 
    filepath = "fill this in" 
    assert os.path.exists(filepath) 
    with Image(filename=filepath, resolution=200) as img: 
     page_images = [] 
     for page_wand_image_seq in img.sequence: 
      page_wand_image = Image(page_wand_image_seq) 
      page_jpeg_bytes = page_wand_image.make_blob(format="jpeg") 
      page_jpeg_data = io.BytesIO(page_jpeg_bytes) 
      page_image = PIL.Image.open(page_jpeg_data) 
      page_images.append(page_image) 
関連する問題