HTMLページから生のテキストを取得するタスクがあります。 HTMLの解析の後、たくさんの '\ n'記号を含む文字列を受け取ります。それを空に置き換えようとすると、replace関数が機能しません。python3のreplace()が長い文字列では機能しない
from bs4 import BeautifulSoup
import urllib
with urllib.request.urlopen('http://shakespeare.mit.edu/lear/full.html') as response:
lear_bytes = response.read()
lear_html = str(lear_bytes)
soup = BeautifulSoup(lear_html, 'html.parser')
lear_txt_dirty = soup.get_text()
lear_txt_clean = str.replace(lear_txt_dirty, '\n', '')
print(lear_txt_clean)
[mcve]を作成できますか? –
@ Jean-FrançoisFabreインデントエラーを修正した後、このコードが実行され、問題を示すかどうか...それは本当に問題ではありません! – tdelaney
@tdelaney Pythonのreplace関数は機能しますか?私はすっごく安心しています。 –