2011-08-04 14 views

答えて

7

あなたの漢字は何ですか?おそらく、/\p{Script=Hani}/を探しているかもしれませんが、ネット全体をキャストしたい場合、次の正規表現パターンは中国語の書き起こしにマッチします。必要に応じて制限する。

use 5.014; 
/
    (?: \p{Block=CJK_Compatibility} 
    | \p{Block=CJK_Compatibility_Forms} 
    | \p{Block=CJK_Compatibility_Ideographs} 
    | \p{Block=CJK_Compatibility_Ideographs_Supplement} 
    | \p{Block=CJK_Radicals_Supplement} 
    | \p{Block=CJK_Strokes} 
    | \p{Block=CJK_Symbols_And_Punctuation} 
    | \p{Block=CJK_Unified_Ideographs} 
    | \p{Block=CJK_Unified_Ideographs_Extension_A} 
    | \p{Block=CJK_Unified_Ideographs_Extension_B} 
    | \p{Block=CJK_Unified_Ideographs_Extension_C} 
    ) 
/x; 

はい、.は1つの文字に一致します。 split DWYMのための空のパターン:。

use utf8; 
split //, '冰淇淋' 
# returns ('冰', '淇', '淋') 
+0

どう冰場合について淇。しかし、私はちょうど全体の単語のすべてのドットではない最後のドットを分割したいですか? – deepWebMie

+0

この手法のPerlDocページ:http://perldoc.perl.org/perluniprops.html#Properties-accessible-through-%5Cp%7B%7D-and-%5CP%7B%7D – jhclark

関連する問題