0
HTMLページから正確なテキストを取得しようとしていますが、出力テキストが予想されるテキストと異なります。BeautifulSoupから正確なテキストが得られません
HTMLページ上のテキスト
Салнас 14
beautifulSoup
ĐĄĐ°ĐťĐ˝Đ°Ń 14
によって
テキストショーは私のコードは
page = BeautifulSoup(url.read(),'html.parser')
page.find(id='tdo_11').text
です
HTMLはdiv要素
<td class="ads_opt" id="tdo_11" nowrap=""><b>Салнас 14</b></td>
ためのコードを調べ、私はこれを引き起こすもの理解していませんよ? 別のパーサーを使用する必要がありますか?
テキストエンコーディングを変更しようとしましたか? – Krishh
あなたはページがどの文字エンコーディングを使用しているかを知る必要があります。 UTF8。 –
私にはエンコードの問題のようです。ページで使用する文字エンコードを使用してテキストをエンコードしようとしましたか? – SRC