したがって、BeautifulSoupを使用しています。それは私にいくつかのHTMLノードのテキストを取得しますが、これらのノードは、例えば、文字列PythonでエスケープされたUnicodeシーケンスをUTF-8に変換する
、これを持っているHTML要素にエスケープシーケンスに変換される一部のUnicode文字を、持っている: : は50 €
は似BeautifulSoupによって取得されますsoup.find("h2").text
はこの文字列として50\u20ac
です。これはPythonコンソールでのみ読み取ることができます。 しかし、それはJSONファイルに書き込まれると判読できなくなります。 注:このコードを使用してjsonに保存します。 with open('file.json', 'w') as fp: json.dump(fileToSave, fp)
これらのUnicode文字をUTF-8に変換するにはどうしたらよいですか?
は、あなたが試してみました: F =オープン( 'somefileという'、 'WB')、その後 f.writeを( 'your text') –
** JSON **に保存されたことはどういう意味ですか?あなたはJSONをいくつかの他の関数に返すか、それをファイルに書いていますか? – chad
@chad JSONファイルに書き込まれます。 –