Pythonのpattern.webモジュールを使用して、いくつかの基本的なWebマイニングタスクを実行しています。最初の15個のキーワードのみを抽出し、各キーワードにカンマ","
を追加しようとしています。だから、私の結果のファイルがどのようなキーワードのリストが含まれます。今すぐDOMの文書解析:条件に基づいてカンマの追加と削除
scallops, scallop shells, sea scallops, scallop shell, how to cook scallops, scallop shells for sale, frozen scallops, fresh scallops, dry scallops, cooking scallops, baptism shell, scallop recipe, large scallop shells, diver scallops, bay scallops,
が、私はカンマをしたくない","
/最後の15日キーワードの後"bay scallops,"
が、私は以下の私のコードを変更するために少しの助けを必要とするので、 15回目の反復でコードはコンマを追加しません。ループを繰り返す単純なループの場合は、iteritems()
を使用してキーと値を抽出し、if条件を追加することができますが、ここではどのように行うのかわかりません。
from pattern.web import URL, DOM, plaintext, extension
folder = '../some_folder'
dom = DOM(content)
print "traversing ... "
for e in dom('td.spgb-f')[:15]:
for a in e('span.sptc-e'):
File = open(os.path.join(folder, "meta_keywords.html"), mode="a")
print ('adding %s' %(plaintext(a.content)))
File.write(plaintext(a.content) + ", ")
File.close()
私が投稿する前にあなたの答えが表示されませんでした。私のものは本質的に同じです。 :) –