2017-08-25 16 views
0

感情の分析に取り組んでいます。twythonでtwitterデータを取得し、json形式のtxtファイルに保存した後、CSV形式で書き込む必要があります。私はここで、「INCLUS \ XC3 \ xa3o」に これを行うことができますが、特殊な文字が書かれていない、例えば「Inclusão」が書き込まれているコードです:PythonでUTF8エンコーディングを使用したJSONからCSVへ

import json 
from csv import writer 

with open('data.txt') as data_file:  
    data = json.load(data_file) 

tweets = data['statuses'] 

#variables 
times = [tweet['created_at'] for tweet in tweets] 
users = [tweet['user']['name'] for tweet in tweets] 
texts = [tweet['text'] for tweet in tweets] 

#output file 
out = open('tweets_file.csv', 'w') 
print(out, 'created,user,text') 
rows = zip(times,users,texts) 
csv = writer(out) 
for row in rows: 
    values = [value.encode('utf8') for value in row] 
    csv.writerow(values) 
out.close() 
+0

'out = open( 'tweets_file.csv'、 'w'、encoding = 'latin-1') ' –

+0

は動作しません –

答えて

0

私はすでにあなたに感謝し、問題の連中を解決!問題は、私のテキストがすでにエンコードされており、私はこれをやり直そうとしていたことです。

関連する問題