Příliš žluťoučký kůň úpěl ďábelské ódy.
などの文字列をPrilis zlutoucky kun upel dabelske ody.
に変換するにはどうすればよいですか?文字列から発音区別記号(ウムラウト)を削除するにはどうすればよいですか?
ソース文字列はUnicodeなので、原理的には正規化/分解を使用してウムラウトを分離することが可能でなければなりません。
残念ながら、私はPharo(おそらく亜鉛はどこかに隠されていましたか?)で、ウムラウトまたは分解をストリッピングするライブラリを見ませんでした。
パフォーマンスは、本当に問題ではありませんDiacriticalsパッケージを試すことができます変換テーブルを使用しますが、それはかなりエラーが発生しやすいです)。しかし、あなたが提案しているのは 'libicu'のためのUFFIライブラリを書くことです? –
はい、かなり。残念ながら、私たちが書いたプラグインは、Squeakの4 VMのためであり、私はそれが新しいVMのにポータブルだどれだけよく分かりません。 –