2016-07-11 6 views
0

この記事で説明するように、BLOB索引付けと全文検索でAzureを設定しました:Indexing Documents in Azure Blob Storage with Azure Searchコンテンツタイプが見つからないためインデクサーがblobを処理できませんでしたが、ブロブにコンテンツタイプがあります

私のpdfののいくつかは、しかし、インデクサで失敗:

[ 
    { 
     "key": null, 
     "errorMessage": "Error processing blob 'https://my-storage.blob.core.windows.net/my-container/mydocument.pdf' with content type '': 422" 
    } 
] 

私はそのコンテンツタイプが設定されたことを確認するためにブロブのプロパティをダブルチェック:

{ 
    "container": "my-container", 
    "name": "mydocument.pdf", 
    "metadata": {}, 
    "lastModified": "Fri, 08 Jul 2016 19:43:15 GMT", 
    "etag": "0xXXXXXXXXXXXXXXX", 
    "blobType": "BlockBlob", 
    "contentLength": "3863790", 
    "requestId": "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx", 
    "contentSettings": { 
     "contentType": "application/pdf", 
     "contentMD5": "xxxxxxxxxxxxxxxxxxxxxx==" 
    }, 
    "lease": { 
     "status": "unlocked", 
     "state": "available" 
    } 
} 

を、この特定のpdfにはセキュリティ上の制限(印刷なし)があるので、影響を受けるかもしれないと思っていました。私はいくつかのpdfファイルを作成してテストしましたが、制限の有無にかかわらずうまくいきました。

+0

問題のあるPDFを私たちと共有して問題が終了しているかどうかを確認することは可能でしょうか?もしそうなら、通常のMicrosoftドメインのeugeneshでpingしてください。ありがとう! –

答えて

0

セキュリティ制限、ファイルが破損しているなどの理由で、Azure Searchで処理できないドキュメントが存在することがあります。そのようなファイルの処理方法を制御するいくつかのノブがあります。詳細は、this answerを参照してください。

関連する問題