私はsubprocess.Popen経由でwgetを呼び出す関数を持っています。この関数の目的は、wgetとspiderにリンクリストのWebサイトを生成させることです。Python - プロセスが完了したときにwgetを確認します。
wgetプロセスが完了したことを知り、Python関数の残りの部分を実行し続けることは可能ですか?
def get_urls(url, uname, pword, output):
subprocess.Popen (['wget', '-nd', '-r', '--user=', uname, '--password=', pword,
'--no-parent','--spider',url, '--output-file= ',output], stdout=subprocess.PIPE)
#some method telling wget has finished writing to the output file, so continue
foo = bar() #rest of function etc.
またサイトをスパイダリング(およびログイン資格情報を渡し)のpython経由ではなく、システムコールを作るのより良い方法はありますか?
おかげ
おかげurllibはより有効に活用することがあります。私はurlib2を使ってスパイダーを書くことになった – ctdeveloper