フランス語のロケールで文字を使ってsortコマンドの動作を説明できますか?フランス語ロケールでsortコマンドが "œ"と "oe"を区別しないのはなぜですか?
$ file file.txt
file.txt: UTF-8 Unicode text, with CRLF line terminators
$ wc -l file.txt
4 file.txt
$ cat file.txt
cœz
coez
coe
cœ
$ sort file.txt
coe
cœ
cœz
coez
$ sort -d file.txt
cœ
coe
coez
cœz
$ env | grep -P "(LC|FR)"
LANG=fr_FR.UTF-8
文字は単に辞書のソート(sort -d
)の場合には無視されるのに対し、「œ」が、通常のソートの場合はランダムなようだ「OE」よりも小さいか大きいという事実。
照合とは関係がありますが、ここでいくつかの洞察をしたいと思います。
フランス語のロケールを使用していますか? '$ LC_ALL'の値は何ですか? – unwind
私は窓の下でcygwinを使用しています。 LC_ALLは空です。フランスのロケールであるという事実は私の推測です。どうすれば確認できますか? –
" - "が "oe"と完全に等しい場合、結果はソートの不安定性によって説明することができます。 '-s'オプションが与えられたときに得られる結果を見てください。 –