2016-12-16 3 views
0

私はブログのコメントを掻き集め、それが感情的で情報的であるかどうかを判断しようとしています。文字列がテキストファイルに属していることを確認しようとしています

最も頻繁に使用される名詞(上位10個)が見つかりました。

このプロセスの後、2つのtxtファイルを作成しました。

最初のファイルには感情的な名詞が含まれています。 2番目のファイルには情報名詞が含まれています。

最後に、ブログに感情的な名詞があるのか​​、より多くの情報的な名詞があるのか​​を知りたい。最後のプロセスではどのコードを作成する必要がありますか?

+0

ファイルがどれくらい大きいですか?ファイルが小さく、簡単に処理できる場合は、2つのファイルを辞書としてインポートして、Pythonでカウンタを使用してループ用に書き込むことができます。これまでどんなカウンターが高いのですか?ブログには何が入っていますか –

+0

私は大まかなコードを表示できますか?してください.TT – zzzwww

+0

**あなたは何も試していません**まだですか? SOは無料のコーディングサービスではありません。 –

答えて

0
# This is the file where you have your top 10 nouns 
fc = open("words.txt") 
list_blog = [] 
for line in fc: 
    list_blog.append(line.strip()) 

f1 = open("file1.txt") # This is your first file of emotional nouns 
d1 = {} 
c = 0 
for line in fc: 
    c+=1 
    d1[line] = str(c) 

f2 = open("file2.txt") # This is your seconf file of informational nouns 
d2 = {} 
c = 0 
for line in fc: 
    c+=1 
    d2[line] = str(c) 

count1 = 0 
count2 = 0 
count3 = 0 

for i in list_blog: 
    if i in d1: 
     count1+=1 
    elif i in d2: 
     count2+=1 
    else: 
     count3+=1 

print(count1,count2,count3) 

はそれを書くためのより良い方法があるかもしれませんが、私はちょうどすぐにそれを書いていない、最も効率的なコードので