2011-01-21 8 views
3
私は、文字列の入力からすべての句読点を削除するには、この正規表現を使用

PHP: `â`または`†`を削除する正規表現ですか?

$pg_url = preg_replace("/\W+/", " ", $pg_url); 

しかし

など、私はそれらを削除することはできません記号や特殊文字のいくつかの種類があり、

これを私のdb注射に渡すと、âまたはâ€

どのようにこれらの変なものを取り除くことができますか?

ありがとうございました。

+2

データベースの文字セットのような音は何よりも問題です... – BoltClock

+0

あなたは間違いなく文字エンコーディングの問題があります。アプリケーションのすべての部分が同じ文字エンコーディングを使用していることを確認し、問題は解決してください。 – Jeremy

+0

この「不思議なもの」は、人々が傲慢にエンコードしなかったテキストで、7ビットの英語のテキストが一緒になっています。あなたの文字エンコーディングを真っ直ぐにして、それらは乱されません。 – delnan

答えて

1

これらの文字はUnicode、具体的にはUTF-8でエンコードされています。

iconv familyの関数を使用して、他のエンコーディング(たとえばプレーンASCIIなど)に変換することを検討してください。

+0

ありがとうございました。 – laukok

関連する問題