私はデータをデータベースにプルするフィードを持っています。データはXML形式で提供されます。ただし、データには「不正な」文字が含まれています。たとえば、次のようにXMLフィードデータに無効な文字があります
A GREAT NEIGHBOURHOOD – WITH A
または
large “country style†eat-in
または
Garage 14’x32’, large
または
OR…….ENDLESS POSSIBILITIES!!
私の質問は最初に、私はこれらの文字のエンコーディングを識別しないか、と次に、エンコーディングをマットに変更する方法私のデータベースが期待しているUTF8形式ですか?
編集:明らかにするために、このプロセスに関係するデータベースはありません(プロセスのこの時点では、とにかく)。データは後でDBに挿入されますが、現時点ではPHPスクリプトを使用してデータを読み込み、var_dump
を使用して画面に出力しています。
EDIT 2:データは、それはいくつかの点でXMLソースまたはデータと思わPHP PHRETSライブラリ
正確な問題は何として手動で
フレームワークを使用したデータベースを作成しますか?フィードは '<?xml version =" 1.0 "encoding =" utf-8 "?>'またはHTTPヘッダーで独自のエンコーディングを宣言していませんか? –
@ÁlvaroGonzález--いいえ、エンコーディングは宣言されていません。UTF8と仮定していますが、一部のフィードプロバイダは実際にこの権利を取得していません。 – user101289
しかし、これらの文字は実際のUTF-8のように見え、ISO-8859-1と誤解されています。 –