2
uniq
(GNU coreutils 8.5)は、一ダッシュと一ダッシュを区別していないようです:uniqにemとen-dashesを区別させる方法を教えてください。
$ echo -e "a-b \ na-b" |ユニーク-c
2 a–b
この区別を強制する方法はありますか?私は運がないとLC_COLLATEのさまざまな設定を試みました。
uniq
(GNU coreutils 8.5)は、一ダッシュと一ダッシュを区別していないようです:uniqにemとen-dashesを区別させる方法を教えてください。
$ echo -e "a-b \ na-b" |ユニーク-c
2 a–b
この区別を強制する方法はありますか?私は運がないとLC_COLLATEのさまざまな設定を試みました。
は私が見る私
echo -e "a–b\na—b" | LC_COLLATE=C uniq -c
1 a–b
1 a—b
のために働きました。私は 'LC_COLLATE = en_GB.utf8'のさまざまな順列を試していましたが、それは' utf8'が動作することを前提としていました。 'LC_COLLATE = C'は期待される結果を生成します。乾杯! –