3
スクリプトを実行して、スクリプトが自動的にPDFをGoogleドキュメント形式に変換するところを管理しました。私たちが取り組んでいるような問題は、PDFにも画像があることです。 PDFをGoogle Docに変換すると、Google Docには画像がなく、テキストのみが含まれます。私はこれが起こっている理由はOCRによると信じています。 PDF上の画像をGoogle Docsに変換するスクリプトを自動化することは可能でしょうか?PDFをGoogleドキュメントに変換する
は、ここで問題となっているスクリプトです:
GmailToDrive('0BxwJdbZfrRZQUmhldGQ0b3FDTjA', '"Test Email"');
function GmailToDrive(folderID, gmailSubject){
var threads = GmailApp.search('subject: ' + gmailSubject + ' -label: Imported'); // performs Gmail query for email threads
for (var i in threads){
var messages = threads[i].getMessages(); // finds all messages of threads returned by the query
for(var j in messages){
var attachments = messages[j].getAttachments(); // finds all attachments of found messages
var timestamp = messages[j].getDate(); // receives timestamp of each found message
var date = Utilities.formatDate(timestamp, "MST", "yyyy-MM-dd"); // rearranges the returned timestamp
for(var k in attachments){
var fileType = attachments[k].getContentType();
Logger.log(fileType);
if (fileType = 'application/pdf') { // if the application is a pdf then it will convert to a google doc.
var fileBlob = attachments[k].copyBlob().setContentType('application/pdf');
var resource = {
title: fileBlob.getName(),
mimeType: fileBlob.getContentType()
};
var options = {
ocr: true
};
var docFile = Drive.Files.insert(resource, fileBlob, options);
}
}
}
}
}
私は 'ocr'オプションをコメントアウトし、' convert'オプションをtrueに設定しました。変換すると、まだGoogle Docのテキストが取得されていますが、画像はまだどこにも見つかりません。 – CoreyG