2017-02-04 5 views
0

Python3のバイトから変換された文字列から16進数を削除する必要があります。バイトをスティングに変換し、twitterデータの16進数を削除する

バイトからストリングに変換することはできますが、16進数をエンコードしたり、自動的に削除することはできません。 ASCIIでエンコードしようとしましたが、動作しません。

私のテキストデータは、辞書のリスト内のキー "tweet_text"の下の値です。ここ は私のコードです:ここでは

for d in sheet_data: 
     just_text = d['tweet_text'] 
     print('This is "just_text" type: ', type(just_text)) 
     just_text_strings = str(just_text) 
     print('This is "just_text_strings" type: ', type(just_text_strings)) 
     just_text_clean = just_text_strings.encode('ascii', errors='ignore') 

は私の出力です:

This is "just_text" type: <class 'bytes'> 
This is "just_text_strings" type: <class 'str'> 
b'b"[/Very seldom~ will someone enter your life] and you won\'t have to question\\xc3\\xa2\\xe2\\x82\\xac\\xc2\\xa6 "' 

私はこの問題を解決するために何かアドバイスやアイデアに感謝....これは

に役立つ場合には、Twitterのデータであり、

答えて

0

問題は文字列エンコーディングではなく、ターミナルエンコーディングタイプです。私はWindowsターミナルでこのコマンドを実行しました:

chcp 65001 

ターミナルでこれをタイプしました。この出力を得ました:

Active code page: 65001 

文字が表示されていました。

文字を削除できませんでしたが、少なくとも文字列と16進数の前に 'b'は表示されませんでした。

関連する問題