私はJavaアプリケーションを作成しています。しかし、この点に固執しています。Javaで漢字のみを分割するには
查詢促進民間參與公共建設法(210BOT法).
は、私は上記の「BOT」として、ラテン語や数字を除いて、これらの中国の文字を分割したい:
は基本的に私はまた、いくつかの可能なラテン文字や数字と漢字の文字列を持っている、と言うことができます。[ 查, 詢, 促, 進, 民, 間, 參, 與, 公, 共, 建, 設, 法, (, 210, BOT, 法, ), ., ]
どのように私は(Java用)この問題を解決することができます:だから、最後に私は、リストのこの種を持っているのだろうか?
、私は正規表現の文字クラスを信じています。上記のユニコード範囲にまたがって動作するでしょう。 –
数字/文字/ハイフン/ whateverlatinのグループを傍受したい場合は、実際にはありません。スタックベースのパーサは、この種のジョブに適したツールです。 – BalusC
これは日本語と韓国語でも機能しますか? –