3

スクリプトを実行して、スクリプトが自動的にPDFをGoogleドキュメント形式に変換するところを管理しました。私たちが取り組んでいるような問題は、PDFにも画像があることです。 PDFをGoogle Docに変換すると、Google Docには画像がなく、テキストのみが含まれます。私はこれが起こっている理由はOCRによると信じています。 PDF上の画像をGoogle Docsに変換するスクリプトを自動化することは可能でしょうか?PDFをGoogleドキュメントに変換する

は、ここで問題となっているスクリプトです:

GmailToDrive('0BxwJdbZfrRZQUmhldGQ0b3FDTjA', '"Test Email"'); 

function GmailToDrive(folderID, gmailSubject){ 
    var threads = GmailApp.search('subject: ' + gmailSubject + ' -label: Imported'); // performs Gmail query for email threads 

    for (var i in threads){ 
    var messages = threads[i].getMessages(); // finds all messages of threads returned by the query 

    for(var j in messages){ 
    var attachments = messages[j].getAttachments(); // finds all attachments of found messages 
    var timestamp = messages[j].getDate(); // receives timestamp of each found message 
    var date = Utilities.formatDate(timestamp, "MST", "yyyy-MM-dd"); // rearranges the returned timestamp 

    for(var k in attachments){ 
     var fileType = attachments[k].getContentType(); 
     Logger.log(fileType); 
     if (fileType = 'application/pdf') {  // if the application is a pdf then it will convert to a google doc. 
     var fileBlob = attachments[k].copyBlob().setContentType('application/pdf'); 
     var resource = { 
      title: fileBlob.getName(), 
      mimeType: fileBlob.getContentType() 
     }; 
     var options = { 
      ocr: true 
     }; 
     var docFile = Drive.Files.insert(resource, fileBlob, options); 
     } 
     } 
    } 
    } 
} 

答えて

1

ocrオプションは、画像やPDF文書のうち、文字を読むことを意図しています。アップロードされた結果の画像は含まれません。

代わりにconvertオプションをご覧ください。

API documentationは右側のテストを提供し、各パラメータを素早くチェックすることができます。

+0

私は 'ocr'オプションをコメントアウトし、' convert'オプションをtrueに設定しました。変換すると、まだGoogle Docのテキストが取得されていますが、画像はまだどこにも見つかりません。 – CoreyG

関連する問題