私は初心者の方で、それ以外の場合は単純な "ループ"問題に戸惑うことがあります。私はx個のファイル(約500個の.txtファイル)でローカルディレクトリを持っています。 RAKE for Pythonを使って各固有のファイルから対応するキーワードを抽出したいと思います。私はRAKEのドキュメントを見直しました。ただし、チュートリアルの推奨コードでは、単一のドキュメントのキーワードを取得できます。誰かが私のローカルディレクトリに格納されているX個のファイルをループする方法を私に説明してもらえますか?ここでは、チュートリアルのコードとそれは本当にうまく単一のドキュメントのためのコードです。Python_RAKEでのキーワード抽出
$git clone https://github.com/zelandiya/RAKE-tutorial
import rake
import operator
rake_object = rake.Rake("SmartStoplist.txt", 5, 3, 4)
sample_file = open("data/docs/fao_test/w2167e.txt", 'r')
text = sample_file.read()
keywords = rake_object.run(text)
print "Keywords:", keywords
ことのリンクですチュートリアル:https://www.airpair.com/nlp/keyword-extraction-tutorial – Panoid
どのキーワードがどのドキュメントから来たのかを確認するのに気をつけますか? –
はい、ドキュメントとキーワードの両方を識別できるように、キーワードのリストとして表示されます。 – Panoid