2016-11-15 8 views
1

私はテキストファイルのリストを持っているが、フォローの例をしている:私は、各単語が書かれているどのように多くカウントするNOTEPAD ++どのようにテキストファイルのリストの各単語を数えますか?

ALEX 
MIKE 
JOSHUA 
AMBER 
ALEX 
ROBERT 
CHRIS 
ALEX 
JOSHUA 
MICHAEL 
ROOGER 
ALEX 
AMBER 

例:メモ帳でそれを行う方法

alex (4) 
MIKE (1) 
JOSHUA (2) 
AMBER (2) 
etc.. 

++?

+0

私はNotepad ++がそれを行うことができるのか分かりません。最初のステップは、 'Edit-> Line Operations-> Lexicographically Ascending Lineicographically Ascending'です。しかし、私はあなたがそれらをどのように数えることができるのかは分かりません。 – Aaron

+0

そのためにPythonスクリプトを書く必要があります。私が知る限り、このような特徴はありません。 –

+0

PHPで 'file()'と 'array_count_values()'が利用できる場合は、これを行うことができます。私は正規表現を介して決して知っている。デモ:https://eval.in/678064 '$ a'は' file() 'によって構築されます。 – chris85

答えて

1

インバイワードワード頻度カウンタはありません。利用可能なRegExp演算では、カウント変数の挿入は許可されません。

スマートハイライトのビルドでは、実際の行のすべてのオカレンスが表示されます。同じことが、検索ダイアログのカウント機能のためになります(単語のすべてのインスタンスに一致し、カウントが表示され、次に繰り返されます)。短いリストのために、このような一歩が働くかもしれません。

新しいプラグインまたはいくつかの外部プログラムを作成している場合を除き、Webサービスを使用するのは簡単な解決策(Word Frequency CounterまたはWordCounter)です。

Unix/Linuxでは、sort file.txt | uniq -c | sort -nrのような結果が得られます。

+1

これは商用環境やデータがすべて敏感な場合(例えば[PII](https: /en.wikipedia.org/wiki/Personally_identifiable_information))、リストされているような公開Webサイトにデータを貼り付けることは、そのデータがどこに行くのかについては目に見えず、ほとんど確実に悩まされます。 – ardavey

+1

@ardavey Jup、それは言うまでもない。 –

+0

あなたは驚くでしょう! – ardavey

関連する問題