1
import pandas as pd
import numpy as np
titanic= pd.read_csv("C:\\Users\\Shailesh.Rana\\Downloads\\train.csv")
title=[] #to extract titles out of names
for i in range(len(titanic)):
title.append(titanic.loc[:,"Name"].iloc[i].split(" ")[1]) #index 1 is title
titanic.iloc[(np.array(title)=="Master.")&(np.array(titanic.Age.isnull()))].loc[:,"Age"]=3.5
#values with master title and NAN as age
最後の行は、元のデータセットに変更を加えません。実際に、この行を再び実行すると、4つのNaN値を持つシリーズが表示されます。データフレームが更新されないPandas
ありがとう!しかし、なぜ私のコードは動作しませんでしたか?それはエラーを示さなかった。 – shailesh
私はそれをテストして、問題は 'loc' - 'iloc'フィルタを使って' iloc'を使っていますが、そうではありません。だから私の答えを好むだけの 'loc'とソリューションが必要です。私の答えが役に立ったら、[accept](http://meta.stackexchange.com/a/5235/295067)を忘れないでください。答えの横にあるチェックマーク( '✓')をクリックしてグレー表示にします記入してください。ありがとう。 – jezrael
ありがとうございます。これは非常に役に立ちました。あなたは本当にあなたのPythonを知っています。 – shailesh