私は現在、利用可能な言語の学名を使って鳥の説明ページを取得しようとしています。たとえば、学問名 "Ibycter americanus"を "https://en.wikipedia.org/wiki/"の終点として使用すると、ブラウザは私をthe english wikipedia pageにリダイレクトします。サブドメイン「fr」を使用してフランス語で取得する場合は、to the french pageにリダイレクトされます。ウィキペディアの最終的なURLを取得する方法はありますか?
これはすべてのブラウザで完璧に動作しますが、私はPythonコードの最後のURLを取得できませんよ:
req = urllib2.Request("https://en.wikipedia.org/wiki/" + "Ibycter americanus")
res = urllib2.urlopen(req)
finalurl = res.geturl()
print(finalurl)
それが示しようfinalurlは常に「https://en.wikipedia.org/wiki/Ibycter_americanus」、およびない「https://en.wikipedia.org/wiki/Red-throated_caracara」でありますブラウザに表示されます。何か案は?
私は実際にはURLが* https://en.wikipedia.org/wiki/Ibycter_americanusだと思うし、それはJavascriptでロケーションバーに書き直されている。 – user2357112
javascriptを実行して書き直す方法はありますか? –
@ user2357112はい。それはおそらくそれが何であるかです。 [Wikipediaのページ](https://en.wikipedia.org/wiki/Red-throated_caracara) - _ "([Ibycter americanus](https://en.wikipedia.org/wからリダイレクトされたもの) /index.php?title=Ibycter_americanus&redirect=no))"_。 –