2012-04-23 11 views
0

私はcURLでページをダウンロードし、 "PHP Simple HTML DOM Parser"でhtmlを解析しました。 問題は、要素の外側のhtmlが表示され、スペイン語の文字が正しくないことです。例えば :スペイン語の文字が正しくありません

オリジナルテキスト

ラプジャPORラcompraデロスderechosデpublicaciónHA SIDOラ飾るmás reñidaデル枚Año。

表示されたテキスト

ラ祭式ポルラcompraデ・ロスderechosデpublicaciónヘクタールSIDOラmás REA±IDAデルAA±O。

何が変更されるのでしょうか?

答えて

2

が、私はそれが出力のように複数の文字を表示されていますので、これが発生していることをかなり確信していることをお勧めマルチバイトのUTF8文字をシングルバイト文字セット(おそらくISO-8859-1)で表示しようとしているからです。

少し前に書いたthis blog postをご覧ください。これは潜在的な問題領域のすべてを通じて話す必要があります。

+0

レスポンスヘッダーを設定すると感謝しました。ありがとう – John

0

ダウンロードしたページのエンコーディングを確認してから、(iconvなどで)エンコーディングに変換してください。

PHP: Convert curl_exec output to UTF8

1

不正な文字エンコーディングを参照してください - エンコードは全体で一貫していることを確認してください、私はUTF-8

+0

正解ですが、cURLで確実にする方法が記述されていないので、私には何も良いことはありません – John

関連する問題