Perlを使って漢字を検出する方法はありますか?そして、漢字を記号ドットで分割する方法はありますか? '完璧?perlを使用して中国語の文字を検出しますか?
2
A
答えて
7
あなたの漢字は何ですか?おそらく、/\p{Script=Hani}/
を探しているかもしれませんが、ネット全体をキャストしたい場合、次の正規表現パターンは中国語の書き起こしにマッチします。必要に応じて制限する。
use 5.014;
/
(?: \p{Block=CJK_Compatibility}
| \p{Block=CJK_Compatibility_Forms}
| \p{Block=CJK_Compatibility_Ideographs}
| \p{Block=CJK_Compatibility_Ideographs_Supplement}
| \p{Block=CJK_Radicals_Supplement}
| \p{Block=CJK_Strokes}
| \p{Block=CJK_Symbols_And_Punctuation}
| \p{Block=CJK_Unified_Ideographs}
| \p{Block=CJK_Unified_Ideographs_Extension_A}
| \p{Block=CJK_Unified_Ideographs_Extension_B}
| \p{Block=CJK_Unified_Ideographs_Extension_C}
)
/x;
はい、.
は1つの文字に一致します。 split DWYMのための空のパターン:。
use utf8;
split //, '冰淇淋'
# returns ('冰', '淇', '淋')
+0
どう冰場合について淇。しかし、私はちょうど全体の単語のすべてのドットではない最後のドットを分割したいですか? – deepWebMie
+0
この手法のPerlDocページ:http://perldoc.perl.org/perluniprops.html#Properties-accessible-through-%5Cp%7B%7D-and-%5CP%7B%7D – jhclark
関連する問題
- 1. Perlを使用して中国語文字を検出する方法は?
- 2. 中国語と日本語の文字をファイル名として使用
- 3. Tesseract OCRを使用した中国語文字認識
- 4. preg_matchを使用してHTMLで中国語のテキストを検索
- 5. 中国語の文字PHPMailer
- 6. iconvを使用して繁体字中国語を簡体字中国語に変換する
- 7. なぜPythonが中国語文字で書き出していますか?
- 8. 韓国語の単語/文字をフィルタリングしていますか?
- 9. BeautifulSoup中国語文字エンコーディングエラー
- 10. poiを中国語の文字で使用しているjavaの.xlsxファイル
- 11. ファイル名の中国語/日本語文字の検出方法は?
- 12. Javascript - Googleドキュメントのような中国語文字入力を検出する
- 13. 中国語の文字が1行で文字化けしています
- 14. cでiTextSharpを使って中国語の文字を読む#
- 15. 16進文字列を中国語にデコードします。
- 16. Flashの動的テキスト用の文字列の中国語文字
- 17. ExactTarget電子メールが一貫して韓国語または中国語の文字を表示しない
- 18. RawPrinterHelperを使用したPOS領収書の中国語文字の印刷
- 19. WKWebViewアップロードファイルに、中国語の文字コードが文字化けして文字化けしています。
- 20. のphp-htmlの中国語の文字
- 21. 中国語/日本語の文字を使用してhtmlテキストを調整する
- 22. UTF8の中国語の文字は?
- 23. Mechanizeを使用してウェブサイトから中国語文字を取得すると、何も返されません。
- 24. iPhone - 文字ではなくコードポイントとしての中国語テキスト
- 25. Powershell中国語の文字エンコーディングエラー
- 26. perlを使用して文字列中の未知の部分文字列を検索する
- 27. Obj-C、iTunes検索クエリーストリングで中国語(簡体字)をエンコードしますか?
- 28. GIT:Unicodeの文字(。例えば韓国語/中国語)が含まれていたファイル名を処理しない
- 29. 特定の文字のみを含む文章の中国語テキストコーパスの検索
- 30. 中国語または日本語の文字列の比較
http://stackoverflow.com/questions/1951613/how-to-match-chinese-character-using-perls-regex – link664