私はプログラム的にMusicBrainzのウェブサイトからの編集履歴ページを取得しようとしています。 (musicbrainzngs
はMB Webサービスのライブラリであり、編集履歴にはWebサービスからアクセスできません)。このために、私はユーザ名とパスワードを使用してMBウェブサイトにログインする必要があります。Pythonを使ってMusicBrainzから編集履歴ページをプログラムで取得する方法は?
mechanize
モジュールを使用してみましたが、ログインページの2番目のフォーム(最初は検索フォーム)を使用して、ユーザー名とパスワードを送信します。応答から、私は正常にサイトにログインしているようです。ただし、編集履歴ページへの追加の要求により、例外が発生します。
mechanize._response.httperror_seek_wrapper: HTTP Error 403: request disallowed by robots.txt
私は例外とその理由を理解しています。私はサイトを乱用しないように全責任を負います(結局のところ、ユーザー名にタグがついています)。手動でページを開いたり、HTMLを保存したり、保存されたHTMLにスクリプトを実行したりしないでください。 403エラーを克服することはできますか?
ご回答いただきありがとうございます。これはそれです。 – tzot