0
私はUnicodeストリームを読んでいるので、文字列全体を正規表現に渡す必要はありません。言語間で単語を壊すのに使うことができる単純な(信頼できる)文字はありますか?C#でUnicodeストリームの単語境界を特定するにはどうすればよいですか?
私のバイト配列は、おそらくUTF-16またはUTF-8
私はUnicodeストリームを読んでいるので、文字列全体を正規表現に渡す必要はありません。言語間で単語を壊すのに使うことができる単純な(信頼できる)文字はありますか?C#でUnicodeストリームの単語境界を特定するにはどうすればよいですか?
私のバイト配列は、おそらくUTF-16またはUTF-8
は、Javaを使用している場合、あなたはBreakIteratorを使用することができますに基づくものになるだろう。