2016-11-18 23 views
-1

私は、MySQLデータベースのいくつかのクエリをJSONファイルにエクスポートしてフィルタリングしようとしています。 'code'私はそれを修正することはできませんエクスポートするために使用しています。文字列にエンコーディングの問題があるJSONファイル(アクセント文字は u00xxなど)

テキストセクションは、例えば、\u00x値のために交換されているスペイン語の文字(主にアクセント)を除いてよさそうだ:

[{..., "lang_tweet": "es", "text_tweet": "Recuerdo un d\u00eda de, *llamada a la 1:45*, \"Micho... Que me muero.!!\",...},...] 

だから私の質問は、とにかくがあれば、私は、このJSONを取ることができ、直接でありますファイルを処理し、エラーを修正しますか?方法があれば、どうすればいいのですか?私は昨日からこのエラーがあり、すぐにそれを修正する必要があるので、どんな助けでも感謝します。 @decezeはJSONが正しいことを、言ったように https://github.com/Vichoko/real-time-twit/blob/master/auto_labeling/json/tweets_sismos/test2.json

+1

ここで間違っている*何も絶対にありません* – deceze

+0

おかげで私はmeamwhile、その参照に見ていきます@deceze。私はそれらの文字列が間違っていると私に言いましょう。私はそれらを取って、彼らと一緒に分類を訓練する必要があるので、私はアクセント文字が必要です。私はその '\ u00x'文字を管理するのに慣れていません –

+0

JSONパーサーを使用して、選択したプログラミング言語でJSONをデコードするだけです。 – deceze

答えて

0

は私が修正したいJSON完全なファイルを見てみましょう。私はPythonで行う場合:

with open("file.json", "r") as readfile: 
    data = json.load(readfile) 

print(data[0][u'text_tweet']) 

それはcorreclyスペイン語の文字を印刷します

> Recuerdo un día de, *llamada a la 1:45*, "Micho... Que me muero.!!" 
関連する問題