2017-12-26 37 views
1

私はpandasを使ってExcelファイルからいくつかのデータを読んでいました。パイソン辞書を作ってjsonファイルに入れました。パンダのDataFrameでUnicode文字を変換またはデコードするには?

問題は、私はJSONファイル自体にUnicode文字を取得していますということです。私はUnicodeの「\のu00a0」をしたいし、代わりにそれのデコードされた文字表現を望んでいない上に示されているように

"C V M College of Fine Arts,\u00a0 Vallabh Vidyanagar" 

私のjsonファイル。

パンダ自体からExcelファイルを読み込んでいる間に、この変換(フィルタリングなど)を行う方法はありますか?またはjson.dump()を使用してjsonファイルに書き込むときにこれを行う方法がありますか?

+0

文字は "改行なしスペース" であること。 [wiki](https://en.wikipedia.org/wiki/Non-breaking_space)。 – abybaddi009

答えて

1

使用json.dumps(..., ensure_ascii=False)

foo = "C V M College of Fine Arts,\u00a0 Vallabh Vidyanagar" 

import json 
print(json.dumps({'foo':foo}, ensure_ascii=False)) 

リターン:

{"foo": "C V M College of Fine Arts, Vallabh Vidyanagar"} 
関連する問題