2011-07-22 9 views
2

GoogleAppleなどのウェブサイトを解析しようとすると、すべてが正常に機能します。 しかし、私は中国のWebサイトを解析しようとすると、このテキストは "???"のように見えます。HtmlCleanerは "???"を返します。英語以外のウェブサイトの解析時

この問題の原因とその解決方法を教えてください。

+1

あなたはどこですか?テキストに?コンソールに印刷していますか?それをファイルに保存していますか?ソースコードのいくつかを表示できますか? – aldrin

答えて

2

文字エンコーディングの問題。コンテンツに何かを行う前に、コンテンツに基づいてエンコーディングを設定する必要があります。

+1

あなたの回答を改善することをお勧めします(誰かが「質の低い投稿」と書いた)、つまり、エンコードがHTMLのどこにあるのか、エンコードを設定する方法を説明してください。 –

関連する問題