私は、呼び出し元がPDF、JPG、PNGまたはBMPファイルをアップロードできるメソッドを提供するSOAP-WebServiceを提供しています。 正しい処理のために、私はDataHandlerからMIME-Typeを取得する必要があります。 は、私は、ApacheティカでMIMEタイプを取得しようとしました:DataHandlerからMIME-typeを検出する
Tika tika = new Tika();
InputStream stream = dataHandler.getInputStream();
String mimeType = tika.detect(stream);
今私の問題:ティカは正しいMIMEタイプを検出したが、アップロードJPGのみのいくつかのケースでは、それはplain/text
の代わりを検出
ほとんどの時間をimage/jpeg
。これをどうすれば解決できますか?
ありがとうございます!
どのバージョンのApapche Tikaをお使いですか?アップグレードするとどうなりますか?ああ、ファイル名は手に入れましたか?ファイル名が与えられたときにTikaがよりよく推測できる – Gagravarr
私は現在のバージョン1.13を持っています。残念ながら私はファイル名がありません。理由はMIME-Typeが必要な理由の1つです;-) – VenoxX
有効なjpegファイルはテキストとして検出されるべきではありません。最近の夜間ビルドで同じ問題が発生したとすると、新しいTikaバグを開いて問題を示すファイルをアップロードできますか? – Gagravarr