2016-08-13 1 views
2

私はパンダの機能read_sasを使用してSASの.sas7bdat形式からデータを読み取るしようとしている:read_sasを使用した後、pandasオブジェクトタイプのb'Textからテキストを取得する方法は?

import pandas as pd 
df = pd.read_sas('D:/input/houses.sas7bdat', format = 'sas7bdat') 
df.head() 

そして私はDFのデータフレーム内の2つのデータ・タイプがある - のfloat64およびオブジェクトを。などのfloat64データ型に完全に満足なので、私は自由にそれをintに変換することができ、文字列I 問題は、私はこのように包まれたDFのデータフレームで見ることができるオブジェクト・データ型、である:

b'Text' 

などこの:

b'12345' 

代わりの

Text 

または

12345 

私はそれをそれぞれ文字列またはintに変換することも、 "通常の"オブジェクトデータ型に変換することもできません。また、私はスライスや技術を使用してb ''をeleminateすることはできません。だから私は、オブジェクトのデータ型の列を使用することはできません。 どうすればb ''を取り除くことができますか教えてください。

+0

ここでは、Pythonで同様の問題への参照を持っている:[Python文字列にバイトを変換](のhttp://のstackoverflowを。 com/questions/606191/convert-bytes-to-a-python-string)を参照してください。 – fl0r3k

+0

ありがとう、これは本当に役に立ちます! – doktr

答えて

2

このencoding="utf-8"

を追加し、次のように行は次のようになります。

df = pd.read_sas('D:/input/houses.sas7bdat', format = 'sas7bdat', encoding="utf-8") 
+0

私はすでにそれを知っていたが、感謝! – doktr

関連する問題