2011-12-15 17 views
5

基本的に、2つの文字列がデータベース内で同じものとして評価される場合は、アプリケーションレベルでその文字列をチェックすることもできます。たとえば、誰かが検索フィールドに「bjork」と入力した場合、PHPがMySQLと同じように文字列「Björk」に一致するようにします。PHPの文字列比較におけるMySQLのutf8_general_ciの照合方法

私はPHPがMySQLの照合オプションに直接当てはまるとは思わないが、最も簡単なことは、文字列を変換する簡単な関数を書くことで、strtolower()を使って一様に小文字にし、strstr ()を使用して、マルチバイト文字を対応するASCII文字に置き換えます。

これは正確な仮定ですか?いろいろなMySQLの照合が(特に私の現在のニーズである、utf8_general_ciのように)文字列に準拠するためのstrstr()の2番目のパラメータとして使用するのに便利な配列を誰かが持っていますか?あるいは、MySQLのさまざまな照合がさまざまな文字をどのように扱っているかの正確な文書をどこで見つけることができますか? (私は、いくつかの照合ではSをSと扱い、Sはその他のSsとして扱いますが、すべての文字評価については説明していません)。

+0

MySQLのクエリを実行し、MySQLサーバ上の比較を実行するので、それに渡された文字列を使用する照合MySQLを伝えることが可能です。非常に速くないかもしれませんが、正確な動作を作成します。 – hakre

+0

私はそれが最も重要であると付け加えるべきです。 – Thor

答えて

0

PHPの照合クラスを見ましたか? http://www.php.net/manual/en/class.collator.php

+0

それは面白いです。私はそれが存在するのか分からなかった。悲しいかな、どの設定がMySQLと同じように動作するかはドキュメントからわかりませんでした。また、私は文字列を適合させることにもっと興味があると思います。例えば、文字列を配列キーと比較する能力を与えるでしょう。 – Thor

3

これは私が使ってきたものですが、MySQLとの完全な整合性をテストしていません。

function collation_conform($string,$collation='utf8_general_ci') 
{ 

    if($collation === 'utf8_general_ci') 
    { 
     if(!is_string($string)) 
      return $string; 

     $string = strtr($string, array(
      'Š'=>'S', 'š'=>'s', 'Ð'=>'D', 'Ž'=>'Z', 'ž'=>'z', 'À'=>'A', 'Á'=>'A', 'Â'=>'A', 'Ã'=>'A', 'Ä'=>'A', 
      'Å'=>'A', 'Æ'=>'A', 'Ç'=>'C', 'È'=>'E', 'É'=>'E', 'Ê'=>'E', 'Ë'=>'E', 'Ì'=>'I', 'Í'=>'I', 'Î'=>'I', 
      'Ï'=>'I', 'Ñ'=>'N', 'Ò'=>'O', 'Ó'=>'O', 'Ô'=>'O', 'Õ'=>'O', 'Ö'=>'O', 'Ø'=>'O', 'Ù'=>'U', 'Ú'=>'U', 
      'Û'=>'U', 'Ü'=>'U', 'Ý'=>'Y', 'Þ'=>'B', 'ß'=>'Ss','à'=>'a', 'á'=>'a', 'â'=>'a', 'ã'=>'a', 'ä'=>'a', 
      'å'=>'a', 'æ'=>'a', 'ç'=>'c', 'è'=>'e', 'é'=>'e', 'ê'=>'e', 'ë'=>'e', 'ì'=>'i', 'í'=>'i', 'î'=>'i', 
      'ï'=>'i', 'ð'=>'o', 'ñ'=>'n', 'ò'=>'o', 'ó'=>'o', 'ô'=>'o', 'õ'=>'o', 'ö'=>'o', 'ø'=>'o', 'ù'=>'u', 
      'ú'=>'u', 'û'=>'u', 'ý'=>'y', 'ý'=>'y', 'þ'=>'b', 'ÿ'=>'y', 'ƒ'=>'f')); 

     return strtolower($string); 
    } 
    else die('Unsupported Collation (collation_conform() collation_helper.php)'); 
} 
-1

次のコードを試してください。

$s1 = 'Björk'; 
$s2 = 'bjork'; 

var_dump(
    is_same_string($s1, $s2) 
); 

function is_same_string($str, $str2, $locale = 'en_US') 
{ 
    $coll = collator_create($locale); 
    collator_set_strength($coll, Collator::PRIMARY); 
    return 0 === collator_compare($coll, $str, $str2); 
} 
+0

「MySQLのutf8_general_ciの照合をエミュレートする方法」でした。あなたは '$ locale = 'en_US''で答えました。あなたはこれら2つが等しいと確信していますか? utf8_general_ciでは 'a' = 'ą'しかし 'L'!= 'Ł' ... – Kalmar