grepをstopwords-fileとともに使用して、別のファイルから共通の英語単語を除外したいと考えています。ファイル "somefile"には1行に1語が含まれています。grepを使用してストップワードファイルから単語を除外する
cat somefile | grep -v -f stopwords
このアプローチの問題点は次のとおりです。それは、ストップワードのワードがsomefileという中で発生するかどうかをチェックしますが、私は反対のことをしたい、somefileというのワードがストップワードで発生した場合、すなわち、確認してください。
これを行う方法?
例
somefileという内容は次のとおりです。
hello
o
orange
ストップワードには以下が含まれています。
o
私はsomefileというのだけで単語の "o" をフィルタリングしたい、ではありませんこんにちは、オレンジ。あなたがストップワードファイル/ tmp /言葉を持っていると仮定すると
grep -v -w -f stopwords somefile
'' cat'コマンドを避ける 'grep -v -w -f stopwords somefile' – Matthias
クリーンアップの提案に基づいて答えを変更しました@Matthias –