私は最近サッカーレーティングシステムの分析に取り組んでおり、scoreboard.comからデータソースを入手しています。ウェブページから壊れた英語のテキストを修正するにはどうすればよいですか?
私はいくつかのサンプルデータを解析した後、データが判読不可能であることを認識しました。英語のテキストが壊れているようです。
次のPythonコードとサンプル結果を参照してください。あなたのお手伝いを楽しみにしています。
ありがとうございました。
import requests
import lxml.html
import cssselect
from bs4 import BeautifulSoup
url = requests.get('https://www.scoreboard.com/soccer/england/premier-league-2016-2017/results/')
urlshow = url.text
print(urlshow)
-
プレミアLeague¬ZEE÷dYlOSQOD¬ZB÷198¬ZY÷England¬ZC÷fZHsKRg9¬ZD÷t¬ZE÷8Ai8InSt¬
- 結果のサンプル