1
PHPでCURLを使用したweb-page-titleを異なるCHARSETのWebサイトから取得する方法は?
あなたは私にいくつかの助けを与えることができる......私は、UTF-8でタイトルを保存したいのですが、ページには、GBK、ISO、Unicodeとして多くの異なる文字セット、思い付く?
感謝。
PHPでCURLを使用したweb-page-titleを異なるCHARSETのWebサイトから取得する方法は?
あなたは私にいくつかの助けを与えることができる......私は、UTF-8でタイトルを保存したいのですが、ページには、GBK、ISO、Unicodeとして多くの異なる文字セット、思い付く?
感謝。
文字エンコーディングを特定または検出し、必要に応じてデータをUTF-8に変換します。
HTMLの場合(すなわち、テキスト/ HTML)がありthree ways to specify the character encoding:
- の "Content-Type" フィールドでHTTP "のcharset" パラメータ。
META
"http-equiv"が "Content-Type"に設定され、値が "charset"に設定されている宣言。charset
属性は、外部リソースを指定する要素に設定されます。
これらのどちらも存在している場合は、一部のコンテンツスニッフィングを行うか、いくつかのデフォルトの文字エンコーディング(例えばISO 8859-1)に切り替えることがあります。
識別された/検出された文字エンコーディングがUTF-8でない場合、iconv
またはmb_convert_encoding
でUTF-8にデータを変換できます。