2017-03-03 4 views
1

私はこのように見ている文字列objectあります未処理の文字列をPythonでDataFrameに追加するには?

Numărul de camere 
3 camere 
Suprafaţa totală 
77 m² 
Suprafaţa bucătăriei 
11 m² 
Tipul clădirii 
Dat în exploatare 
Etaj 
3 
Locul de amplasare în casă 
In mijlocul casei 
Grup sanitar 
separat 
Balcon/lojă 
2 
Parcare 
acoperită 
Încălzire autonomă 
✔ 

これは、ウェブサイトから解析されたデータです。

df = pd.DataFrame(columns=['ID','Numarul de camere','Suprafata totala', 
         'Suprafata bucatariei','Tipul cladirii','Etaj', 
         'Amplasarea in bloc', 'Grup sanitar', 'Balcon/loja', 
         'Parcare', 'Incalzire autonoma']) 

文字列のそれぞれの第二列が特徴的であると私は私のDataFrameで彼の場所にそれを追加したい:私はDataFrameにデータを追加したいです。これを行う方法?

答えて

1
text = """Numărul de camere 
3 camere 
Suprafaţa totală 
77 m² 
Suprafaţa bucătăriei 
11 m² 
Tipul clădirii 
Dat în exploatare 
Etaj 
3 
Locul de amplasare în casă 
In mijlocul casei 
Grup sanitar 
separat 
Balcon/lojă 
2 
Parcare 
acoperită 
Încălzire autonomă 
✔ """ 

#split the string 
s = text.split('\n') 

import pandas as pd 

d = {k:v for k, v in zip(s[0::2],s[1::2])} 
df = pd.DataFrame([d]) 

print df.head() 

# if you want to preserve the order of the columns 
df = pd.DataFrame.from_items([('Values', s[1::2])], orient='index',columns=s[0::2]) 

print df.head() 
+0

これはスマートです! – MaxU

+0

@juluribk欠落しているキーが1つある場合、そのキーの値をNaNとして設定する方法は?例えば: 'Numărulデ部屋 Suprafaţa私は欠損値を置き換えたいm²' 77をtotală' NP DFとしてはNaN – Sinchetru

+0

輸入numpyの持つ3 camere' [ 'Numărulデ部屋'] = np.NaN – plasmon360

関連する問題