一部のURLを解析してサイトにアクセスし、さらにデータをスクラップしたいと考えています。作業を掻き集めるためのURLの解析
基本的に私の現在のコードは次のとおりです。
http://intelligencesquaredus.org/debates/past-debates/start=9
http://intelligencesquaredus.org/debates/past-debates/start=18
http://intelligencesquaredus.org/debates/past-debates/start=27
結果が、私はリンクがすべてのヘルプ
http://intelligencesquaredus.org/debates/past-debates?start=9
になりたい生み出す
i = 9
while(i < 118):
dict = {'start': i}
url1 = urllib.urlencode(dict)
url2 = urlparse.urljoin('http://intelligencesquaredus.org/debates/past-debates ', url1)
print url2
i = i + 9
いただければ幸いです。事前
あなたが正確に何をしたいですか?あなたはwhileループを持っているので、多くのリンクで結果が得られます。 –
多くのリンクの結果は正常です、それは振る舞いを意図しています。私は正しいフォーマットが必要です。再度確認してください。 –
あなたは '/'の代わりに '?'を使いますか? –