Webページをダウンロードして本文を処理するプログラムがあります。特にヘッダーやHTMLコンテンツに情報が追加されていない場合は、自動的に検出し、応答の文字列やHTML本体の文字エンコーディングを評価するJavaの方法はありますか?Javaレスポンスボディの自動検出を自動検出します。
0
A
答えて
1
Mozillaのエンコード検出ライブラリのJavaポートであるjuniversalchardetをご覧ください。
エンコードがUTF-8かどうかを確認するサンプルプログラムです。私は示唆している代替の答えとして
protected static boolean validUTF8(byte[] input) {
UniversalDetector detector = new UniversalDetector(null);
detector.handleData(input, 0, input.length);
detector.dataEnd();
if ("UTF-8".equals(detector.getDetectedCharset())) {
return true;
}
return false;
}
0
: URLConnection.guessContentTypeFromStream(InputStream is)
しかしストリームは、マーキングと guessContentTypeFromName(String fname)
(はい、私はそれが愚かな音を知っているが、それは非常に効率的である)をサポートしている必要があります。
もちろん、まずHttpURLConnection本体のストリームをこのように取得する必要があります。InputStream is = response.getInputStream();
関連する問題
- 1. プッシャークラスター自動検出
- 2. USB自動検出
- 3. Javaでのメモリリークの自動検出
- 4. DBインスタンスの自動検出
- 5. PHP - 自動検出(生)urlencode
- 6. 自動検出budrateシリアルstm32
- 7. マシンを自動検出するコード
- 8. Windows自動アップデートを検出する
- 9. AndroidでSMSを自動検出する
- 10. 自動検出プロキシ - JavaFXの - WebViewの
- 11. C/C++でのOSの自動検出
- 12. MatlabのArduino COMポートの自動検出
- 13. ジーンラブでgitlabブランチを自動検出
- 14. 自動化 - 対話型サービスの検出
- 15. CodeMirror - 言語の自動検出
- 16. Dynamic ListView Android(最後の自動検出)
- 17. 500sと404sの自動検出?
- 18. IntelliJ IDEAの自動エラー検出
- 19. Team Foundation Serverの自動検出
- 20. Install4j自動更新バージョン検出
- 21. Xcode git自動メール検出エラー
- 22. C++のバージョンは、exeのバージョンを自動検出しますか?
- 23. ダイナミック検索ボックスを自動作成し、Javascriptで自動提出する
- 24. シリアルポートの設定を自動的に検出しますか?
- 25. Djangoは自動的にエンドユーザのタイムゾーンを検出しますか?
- 26. イメージやテキストの検出を自動化しますか?
- 27. How-ToはWCFサービスを自動検出しますか?
- 28. highlight.jsは言語を自動検出しません
- 29. Qtは自動でアンドロイドキットを検出していません
- 30. ループバック:データベース構造の自動検出とテーブル間の関係の自動生成