0
ターミナルを使用してストップワード(「stopwords.txt」というリストから)を数えずに文章のテキスト「text.txt」の単語頻度をカウントします。単語egrepを使用したストップワードを使用しない頻度
cat text.txt | tr -sc 'A-Za-z' '\n' | tr 'A-Z' 'a-z' | egrep -vwFf stopwords.txt | sort | uniq -c
なぜこれが機能しないのですか、どのような正しいスクリプトが必要ですか?
注:アウトプットは低周波から高周波数にソートする必要があります。あなたは一つのプロセスではなく、少ない効率的なパイプでこれを行うためにawk
を使用して検討するかもしれない
サンプル入力出力ファイル – 123
私のコンピュータでは、 'egrep -vwFf'がエラーを返します:' grep:conflicting matchers specified'。 'F'フラグを単に削除するだけで、これは私のために修正されます。 – Aserre
@Aserreは良い点です –