2016-10-30 6 views
0

私はcounting words in a LaTeX documentの方法の数があることを知っています。LaTeX文書の単語の統計

私が後にしているのは、LaTeXドキュメントで簡単な統計を実行する方法です。これは、すべての単語をグループ化し、その長さを数える代わりに、各単語のインスタンスの数を別々に数えたいと思います。

出力は次のようになります。

1. (15% - 456) that 
++++++++++++++++++++++++++++++++++++++++++++ 
2. (10% - 308) the 
++++++++++++++++++++++++++++++ 
3. (8% - 213) is 
+++++++++++++++++++++ 
4. (4% - 102) of 
+++++++++ 
5. (2% - 55) and 
++++ 

をそこに任意のツールという詐欺があり、これを行う似たようなのですか?

答えて

0

私は必要なものを実行するためのパッケージ/スクリプトを見つけることができなかったので、自分でビルドしました。

これは小さな(初歩的な)Pythonスクリプトですが、それは仕事をします。出力は次のようになります。

Number of unique words: 1945 
Total number of words: 16660 

    0. 1210  (7.26%) - the 
    1. 461  (2.77%) - in 
    2. 431  (2.59%) - of 
    3. 317  (1.90%) - a 
    4. 313  (1.88%) - and 
    5. 304  (1.82%) - for 
    6. 304  (1.82%) - to 
    7. 241  (1.45%) - is 
    8. 176  (1.06%) - words 
    9. 165  (0.99%) - by 
Sum percentage: 23.5% 

Word lengths distribution: 
1 ++ (317) 
2 ++++++++++++++++++++ (2602) 
3 ++++++++++++++++++++++++++++++ (3947) 
4 ++++++++++++++++++ (2342) 
5 +++++++++++++ (1752) 
6 ++++++++++ (1348) 
7 +++++++++ (1154) 
8 ++++++++ (1071) 
9 ++++++ (787) 
10 ++++ (586) 
11 +++ (383) 
12 + (129) 
13 + (123) 
14 + (36) 
15 + (83) 

これはGitHubのレポにアップロードさ:LaTexWordStats

関連する問題