2012-04-19 4 views
0

テキストファイルとWebページの文字エンコードの決定については、多くの議論がありました。Async UrlFetchを使用したApp EngineでのWebページのコードコードの抽出

ウェブページの場合、入力としてURLを受け取り、正しくエンコードされた文字列を返すライブラリを使用するのが最も簡単な方法です。ライブラリはドキュメントを取得しているので、HTTPヘッダーを使用してエンコーディングを判断することができます。

  1. http://htmlcleaner.sourceforge.net/download
  2. How do you Programmatically Download a Webpage in Java
  3. character encoding in a web page using java
  4. http://docs.oracle.com/javase/6/docs/technotes/guides/intl/encoding.doc.html

我々はUrlFetchのを使用してドキュメント、特に非同期API、いただきました!最良の方法は、ライブラリーを取得したい場合は?エンコードを決定する。

async urlfetchを統合する(または統合するのが簡単にできる)ライブラリはありますか? URLFetch

答えて

0

あなたはそれがcharsetがあなたの文字セットエンコーディングですtext/html; charset=UTF-8のようなものであるべきでWebページのために、Content-Typeためlist of headers.外観を得るために、getHeaders()を使用することができますHTTPResponseを取得します。

関連する問題