私はphennyの簡単なモジュール、Pythonの単純なIRCボットフレームワークを作成しようとしています。モジュールはhttp://www.isup.me/websitetheuserrequestedに移動して、Webサイトがアップまたはダウンしていることを確認します。他の組み込みモジュールもそれを使用しているので、正規表現を使用することができると仮定しました。この単純なスクリプトを作成しようとしましたが、正しくはなかったと思います。Pythonで正規表現を使用してページ内のテキストを検索するにはどうすればよいですか?
import re, urllib
import web
isupuri = 'http://www.isup.me/%s'
check = re.compile(r'(?ims)<span class="body">.*?</span>')
def isup(phenny, input):
global isupuri
global cleanup
bytes = web.get(isupuri)
quote = check.findall(bytes)
result = re.sub(r'<[^>]*?>', '', str(quote[0]))
phenny.say(result)
isup.commands = ['isup']
isup.priority = 'low'
isup.example = '.isup google.com'
これは、必要なWebパッケージ(私が思う)をインポートし、ページ内で検索する文字列とテキストを定義します。私は本当に私がこれらの4つのラインで何をしたのかわからない、ちょうどもう1つのフェニックスモジュールからコードをリッピングした。ここで
は、いくつかのWebページからのランダムな引用をつかむ引用符モジュールの一例ですが、私はちょっと使用しようとしたそのベースとして:http://pastebin.com/vs5ypHZy
誰もが私が間違っているのか知っていますか?何か明確にする必要がある場合、私はあなたに言うことができます、私はこれを十分に説明したとは思わない。
Traceback (most recent call last):
File "C:\phenny\bot.py", line 189, in call
try: func(phenny, input)
File "C:\phenny\modules\isup.py", line 18, in isup
result = re.sub(r'<[^>]*?>', '', str(quote[0]))
IndexError: list index out of range
正確にはあなたのためには機能しません。プログラムは実行されませんか?結果は間違っていますか? –
また、なぜisup.meが必要ですか?サイトが稼動しているかどうかを確認するためにHTTP HEADリクエストをしてみませんか? –
コマンドを実行したときに表示されるエラーを追加しました。私はそれが何であるか分かりませんが、HTTP HEADを使うことはできませんでした。 – Alex