文書用語行列を作成するには、テキストファイルresult.txt
を入力します。Pythonで文書用語頻度行列を作成する方法
Counter({'STTP': 6, 'AVENUES': 4, 'ENGINEERING': 4, 'MINING': 4, 'THE': 4, 'SCOE': 4, 'HERE': 4, 'DATA': 4, 'TOOLS': 4, 'PROGRAMMING': 3, 'TEMPERATURE': 3})
をしかし、この方法で結果を得た:私はこのようにした単語の発生をカウントしようとしています。ここ
"degree,the,mituski,programming,national,it,high,sakal,engineering,paper,college,signed
1,4,2,3,1,2,1,1,4,1,1,1"
は、私が使用するコードです:
tdm = textmining.TermDocumentMatrix()
files = glob.glob("result.txt")
for f in files:
content = open(f).read()
content = content.replace('\n', ' \n')
tdm.add_doc(content)
tdm.write_csv('matrix1.csv', cutoff=1)
:
だからあなたの質問のように
dict
を取得するため、あなたはで行くことができます。 – stamaimer