私は整形したいファイル(.txt)を持っています。行は次のようになり=>regexpを使ったpreg_matchが最後の文字を失っています
Name on Company
Street 7 CITY phone: 1234 - 56 78 91 Webpage: www.webpage.se
http://www.webpage.se
Name on Restaurant
Street 11 CITY CITY phone: 7023 - 51 83 83 Webpage:
http://
私は(大文字である)街にマッチしたい時に私がいる問題は、私の正規表現です。あなたはそれがスウェーデンの都市の私は、このようにZÅÄÖで働いているのである見ることができるようにこれまでのところ、私はこの=>
preg_match('/\b[A-ZÅÄÖ]{2,}[ \t][A-ZÅÄÖ]+|[A-ZÅÄÖ]{2,}\b/', $info, $city);
woth出てきますよ。しかし、都市名の最後の文字が「ÅÄÖ」の場合、この正規表現は使用できません。
誰もが問題を見ていますか?事前に
おかげ
あなたはマルチバイト文字を使用している場合は、正規表現文字列を使用してPHPファイルのテキスト、および(あなたのtxtファイルから) '$のinfo'のVARすべてがUTF8であることを確認してください、と常にオン' u'フラグを使用します正規表現。これは、preg_matchがバイトではなくUnicode文字を理解する唯一の方法です。 –