preg_match("/\w+/", $s, $matches);
私は上記のPHPコードを持っています。私はそれを文字列の単語にマッチさせるために使います。 1つのケースを除いて、素晴らしい作品です。「 w」の一致でいくつかの奇妙な文字と一致する
例:{'Bös','Tüb'}
最初の例では動作しますが、第二にはないと一致している必要があり
'This is a word'
は{'This','is','a','word'}
'Bös Tüb'
と一致しなければなりません。代わりに{'B','s','T','b'}
が返され、ö
とü
が単語文字として表示されません。
質問öüと、通常名に使用されている他の文字にマッチする方法
(彼らは奇妙なことができ、これはドイツ語とトルコ語の名前についてですか)?手動でそれらをすべて追加する必要がありますか(/[a-zA-Z and all others as unicode]/
)?私はofcourseの言及を忘れてしまったよう
EDIT
、単語間で\n
、\r
と' '
文字がたくさんあります。これがRegexを使用している理由です。
検索ユニコードPCRE – dynamic