私がしようとしているのは、可変文字列としてウェブサイトのhtml応答を取得し、ドット(。)、数字(0-9)、コロン(: )。私はre.subとこの権利を得るように見えない。出来ますか ?urllibからのフィルタre re
import urllib.request
import re
ans = True
while ans:
print("""
- Menu Selection -
1. Automatic
2. Automatic w/Checker
3. Manual
4. Add to list
5. Exit
""")
ans = input('Select Option : ')
if ans =="1":
try :
with urllib.request.urlopen('http://www.mywebsite.net') as response:
html = response.read()
html = str(html)
html = re.sub(r'([a-z][A-Z])', '', html)
f = open('text.txt','a')
f.write(html)
f.close()
print('Data(1) saved.')
ans = True
except :
print('Error on first fetch.')
これは、HTMLコード全体を出力し、いずれの文字も除外しません。 すべてのヘルプは高く評価され:)
あなたがフィルターに何かをしようとした、あなたのプログラムを実行できるように貼り付けコードをご検討ください文字を出す? – glls
は、コードの全体に入りました。私は、HTML = re.sub(R '([-z]は[A-Z])'、 ''、HTML)で試みられているが、これはまだ動作しません。 – dexray