2017-03-21 6 views
-1

私は異なる言語で単語を検索するプロジェクトに取り組んでいます。私は簡単に言語のロケールを得ることができますが、私は他の言語で単語を検索する方法を知らない。したがって、テキストは中国語になり、検索される単語は英語になります。たとえば、私たちはを持っています。grapheme_stripos私はJavaで同様の機能を探しています。私は、javaで書類検索を行うものは見つけられませんでした。だから1つの方法は、文字列を分解し、バイト配列に格納し、それを介して検索するが、目的を解決するPHPのgrapheme_striposのような何かが良いでしょうか?Javaでのグレーブ検索

+0

は「質問はお勧めしますか、彼らは独断回答やスパムを誘致する傾向があるとして、オフトピックのスタックオーバーフローのためにある書籍、ツール、ソフトウェアライブラリ、チュートリアルや他のオフサイトのリソースを見つけるために私たちを尋ねる。その代わり、問題と何を記述するこれまでこれを解決するために行われてきた。 – pvg

+0

私は代替案について言及しましたが、より良い解決策を探しています。これは基本的に理論的な質問であり、コンセプト/アイデアを尋ねることは間違っているようです。あなたがよく見ると、私はライブラリ/チュートリアル/ツールを求めていないし、コードを求めているわけでもない。私はちょうど正しい方向にポイントを探しています:)ありがとう – Rohan

+0

それは基本的にあなたがあなた自身を行うことができるあなたのためのグーグルに人々に依頼しています。標準ツールが提供するものを見ましたか?どちらを試しましたか(https://mvnrepository.com/artifact/com.ibm.icu/icu4j?)、欠落していたものなど – pvg

答えて

0

PHPは、UTF-8を使用するため、グラフェンを検索することは簡単ではありません。 JavaはUCS-2を使用しています。ほとんどの文字(BMPのすべてのシャッター)は1つでCharacterです。しかし、一部のCJKはBMPを外しています。 java.lang.Stringのコードポイント関連の機能で

ルック。ほとんどの場合、indexOfregionMatchesは正しいことをします。

また、専用のフルテキスト検索ソリューションを見てみましょう。