2017-07-30 19 views
0

私はつぶやきを読み込み、これらのつぶやきをファイルに書き込もうとしています。しかし、これらのツイートをファイルに書き込もうとすると、UnicodeEncodeErrorsを取得しています。これらのutf-8以外の文字を削除して残りの部分を書き出す方法はありますか?Pythonの文字列からutf以外の8文字を削除します

たとえば、問題のツイートは次のように見えます。

カメラ?

これは私が使用していたコードです:

with open("Tweets.txt",'w') as f: 
    for user_tws in twitter.get_user_timeline(screen_name='camera', 
              count = 200): 
     try: 
      f.write(user_tws["text"] + '\n') 
     except UnicodeEncodeError: 
      print("skipped: " + user_tws["text"]) 
      mod_tw = user_tws["text"] 
      mod_tw=mod_tw.encode('utf-8','replace').decode('utf-8') 
      print(mod_tw) 
      f.write(mod_tw) 

をエラーはこれです:

UnicodeEncodeError: 'charmap' codec can't encode character '\U0001f3a5' in position 56: character maps to

答えて

0

あなたがUTF8エンコードされたファイルを書いていない、オープンな機能

にencodingパラメータを追加
with open("Tweets.txt",'w', encoding='utf8') as f: 
    ... 

お楽しみください

関連する問題