ウェブでの文字エンコーディングの検索方法ウェブページでの文字エンコーディング
答えて
私はこれがまさにあなたが必要としていると信じています。コードと説明の両方を持っています。次のようにhttp://nadeausoftware.com/node/73
速い概要は次のとおりです。
は- コンストラクタ
public WebFile(String urlString)
は、URLConnection
を開き、文字エンコーディングを含むヘッダ、読み込み:はWebFileクラスを作成します。エンコーディングが存在しない場合は、Webページ自体からエンコーディングを読み取る必要があります。 Character Encoding Detection Algorithm
private Object readStream(int length, java.io.InputStream stream)
private Object readStream(int length, java.io.InputStream stream)
ストリームからページデータを読み込み、return new String(bytes, charset)
という文字エンコーディングを使用してString
を返します。またはストリームを読み込んで作成したバイト配列を返します。エンコーディングが存在しないか、エンコーディング例外が存在する場合- あなたは、ページコンテンツのためのゲッターとセッター(例えばreadStreamは一度だけ、エンコーディングを返し呼び出す)
開きます(URL.openConnection()を使用して)URLへの接続を持って、ADN getContentType()によって返されたコンテンツタイプを解析メソッド(文字セットを含める必要があります)。このヘッダーに含まれていない場合は、HTMLコンテンツを解析して、タグを探す必要があります。
<meta http-equiv="Content-Type" content="text/html; charset=ISO-8859-1" />
私は「する必要があります」を「必要がある」に変更します。 –
'<?xml version =" 1.0 "encoding =" ISO-8859-1 "?>'のようなXML宣言も見てください。 (存在する場合は、文書の冒頭にあるはずです。) –
- 1. タイ文字の文字エンコーディング
- 2. エンコーディングの文字
- 3. Javaでの文字のエンコーディング
- 4. データベースへのエンコーディングは良好ですが、ウェブページ上の奇妙な文字
- 5. Eclipse文字エンコーディング
- 6. Python文字エンコーディング?
- 7. System.out文字エンコーディング
- 8. 文字エンコーディングは
- 9. URLエンコーディング "+"文字
- 10. ハスケル文字エンコーディング
- 11. Python文字エンコーディング
- 12. MariaDB文字エンコーディング
- 13. msysgitでの文字エンコーディング
- 14. .NETでの文字エンコーディング
- 15. VBAエディタでの文字エンコーディング
- 16. テンプレートツールキットの文字エンコーディング
- 17. XMLの文字エンコーディング
- 18. 春の文字エンコーディング
- 19. ISO8583の文字エンコーディング
- 20. libcの文字エンコーディング?
- 21. GCC 4.7ソース文字のエンコーディングと実行文字列リテラルのエンコーディング?
- 22. urllib.quoteでPythonエンコーディング文字
- 23. HTML文字列エンコーディング
- 24. 文字列エンコーディングhtml
- 25. Java - エンコーディング文字列
- 26. Aptana 3.1.1 - 文字エンコーディング
- 27. Openshift JBoss文字エンコーディング
- 28. JavaFxギリシャ文字エンコーディング
- 29. SQLスクリプト文字エンコーディング
- 30. PHP文字列エンコーディング
*外部リソースへのリンクは適切ではありません。リンクが無効になり、無用になる可能性があります。あなたの答えには、少なくとも*要約が必要です。 –
@ Joachim Sauer:そのページの完全な説明を書き直したくないですが、無効なリンクシナリオについては考えていませんでした。修正しました。 –