2017-10-27 7 views
1

プロローグ: できるだけ速く脳波インタープリタを実装する課題があります。この通訳を可能な限り速くするために、私たちのインタプリタにネイティブな[ - < +]のような脳波の指示をしたい。より多くの指示でこれを行いたいので、我々はどの命令を実装すべきか疑問に思った。最も頻繁に発生する文字列を1つのファイルで見つけよう

2つの別々のファイルの比較に関する多くの情報が見つかりましたが、ファイル内に文字列が再発するのを見つける方法はありますか?たとえば:

ファイル:

Hi, this is my text 
also, it is an example of my question 

戻り値:あなたはこれを実行することができますWindowsまたはLinuxのいずれかのプログラムの

2 x ' is ' 
2 x ' my ' 
2 x ', ' 

を知っていますか?

awk 'BEGIN { FS="[,. ;!?]" } { for (i=1; i<=NF;i++) { A[$i]++ } } END { for (a in A) { print A[a], a } }' | sort -k1 -n -r 

あなたはFS変数に区切り文字をカスタマイズすることができます。sh、coreutilsの/ソートやawkのを使用して

+0

文字列にスペースを入れたいですか?デリミタは何ですか? – jurez

+0

はい、デリミタを含まないようにスペースを含めたい – Maarten

+0

スペースはどの単語に移動する必要がありますか?左、右、両方? – jurez

答えて

関連する問題