2017-10-15 16 views
2

この文字列をPythonでどのようにデコードするのですか?PythonでHTML文字列をデコードする

title = 'Fast & Furious 6' 

取得する:

Fast & Furious 6 

ありがとうございました!

+0

これはXMLではなくHTMLでエンコードされています。 – Dijkgraaf

答えて

1

このコードでは、ascii rappresentationからcharシンボルが得られます。

title = 'Fast & Furious 6' 
title = title[:-1] 
substring=[x.strip() for x in title.split(';')] 
titleFinal = '' 

for ch in substring: 
    newstr = ch.replace("&#", "") 
    titleFinal+=chr(int(newstr)) 

print(titleFinal) 
+0

うまくいきました:)ありがとうございました! –

+0

パーフェクト、歓迎です;)@CharlieSpecter – Daniele

0

ちょうど使用ビルトインhtmlモジュール:あなたの文字列として

import html 
decoded_title = html.unescape(title)) 

HTMLセーフシーケンス(数値文字参照)から構成されています。

関連する問題