2012-01-12 13 views

答えて

3

java.text.Collator中国語Localeです。

+2

ありがとうございました。中国語ピンインでは 'Locale.SIMPLIFIED_CHINESE'が、ロケートでは' Locale.TRADITIONAL_CHINESE'の順になっています。 – bydsky

+0

私はピンインや脳卒中が何であるか分かりませんが、助けてくれるとうれしいです。 –

2

コードを自分でロールしたい場合は、Unicode ConsortiumのUnihanデータベースのRadical-Stroke Countsフィールドを使用します。テクニカルレポート38のセクションにリンクし、これらのフィールドについて説明します。

表意文字のストローク数は、表示されている文字、すなわちグリフの構造(または形態)に基づいていることに注意してください。グリフの形態は、フォントのスタイル(特に繁体字中国語、簡体字中国語、または日本語の慣習に従うかどうか)の関数です。しかし、Javaの文字コードは通常、Unicode標準に基づいています。Unicode標準は、これらのすべての慣習からの文字を単一の文字コードで統一します。

したがって、あなたのテキストがどのような慣例を使用しているかを示すために外部情報が必要です。これはUnihanデータベースのどのフィールドを使用するかを指示します。あなたの中国語の文字列がすべて簡略化されていること、またはすべての伝統的な中国語が分かっているなら、あなたは十分な情報を持っています。

また、Unihanデータベースのデータを扱うChinese Character Web APIもチェックしてください。

関連する問題