中国語の文字とgrepのマッチング方法は？

[\u4e00-\u9fff]がvimの中国語文字と一致することが確認されています。中国語の文字とgrepのマッチング方法は？

:%g/[\u4e00-\u9fff]/d

上記のコマンドは、漢字を含むすべての行を削除することができます。

ls /tmp/test 
ktop 1_001.png.bak 
fonts.dir.bak 
New 
Screenshot from 2016-09-12 16:50:29.png.bak 
你好

これで、名前が中国語のファイルを抽出します。

ls /tmp/test |grep -P '[\x4e\x00-\x9f\xff]'

このコマンドでは、名前が中国語のファイルを取得できません。
修正方法？

ls/tmp/test | grep -v '[a-z]'がそれを手に入れることができますが、それは私が望むものです。

出典

2016-12-25 it_is_a_literature

/テストこの 'lsのは/ tmpをお試しください| grep -P "[一 - 龥]" '。 –

漢（中国）の文字を持っているだけの行（ファイル名）を一致させるには、あなたが[\p{Han}]使用することができます。

ls /tmp/test | grep -P '[\p{Han}]'

\p{Han}はthe Unicode-script category properties usable in any PCRE-supporting engineの一つです：

\p{Common} \p{Arabic} \p{Armenian} \p{Bengali} \p{Bopomofo} 
\p{Braille} \p{Buhid} \p{Canadian_Aboriginal} \p{Cherokee} 
\p{Cyrillic} \p{Devanagari} \p{Ethiopic} \p{Georgian} \p{Greek} 
\p{Gujarati} \p{Gurmukhi} \p{Han} \p{Hangul} \p{Hanunoo} \p{Hebrew} 
\p{Hiragana} \p{Inherited} \p{Kannada} \p{Katakana} \p{Khmer} \p{Lao} 
\p{Latin} \p{Limbu} \p{Malayalam} \p{Mongolian} \p{Myanmar} \p{Ogham} 
\p{Oriya} \p{Runic} \p{Sinhala} \p{Syriac} \p{Tagalog} \p{Tagbanwa} 
\p{TaiLe} \p{Tamil} \p{Telugu} \p{Thaana} \p{Thai} \p{Tibetan}

出典

2016-12-25 02:20:53 sideshowbarker

中国語の文字とgrepのマッチング方法は？

答えて

関連する問題