0
私は、テキストファイルに大きな単語リストを表示しています(1行に1単語)。いくつかの単語にはアクセント付き文字(発音区別符号)があります。アクセント文字を含む行だけを表示するにはどうすればよいですか?grepを使ってアクセント付きの単語(発音区別記号)をすべて見つけますか?
私は、テキストファイルに大きな単語リストを表示しています(1行に1単語)。いくつかの単語にはアクセント付き文字(発音区別符号)があります。アクセント文字を含む行だけを表示するにはどうすればよいですか?grepを使ってアクセント付きの単語(発音区別記号)をすべて見つけますか?
私には解決策があります。このエラーを返す
cat text-file | iconv -f utf8 -t ascii//TRANSLIT > noaccents-file
diff text-file noaccents-file | grep '<'
:使用方法:まず、元のファイル内の行のための "差分" をやる "のiconv" を使用してアクセントを取り除きgrepする[-abcDEFGHhIiJLlmnOoqRSsUVvwxZ] [-A NUM] [-B NUM] [ -C [num]] \t [-eパターン] [-fファイル] [ - バイナリファイル=値] [--color = when] \t [--context [= num]] [--directories =アクション] [ - ラベル] [ - ラインバッファリング] \t [パターン] [ファイル...] –
[this](https://stackoverflow.com/questions/20690499/concrete -javascript-regex-for-accented-characters-diacritics)を使用すると、Unicodeの文字 '[\ u00C0- \ u017F]' – Mako212