でパンダのデータフレームの文字列要素を交換私はパンダのデータフレームがあります。私が持っているデータがはるかに大きい現実に整数
import pandas
cols=['x_axis','y_axis','data']
row1=['Cheese','farms',4]
row2=['wales','Cheese',3]
data=pandas.DataFrame([row1,row2],columns=cols)
print data
:
x_axis y_axis data
0 Cheese farms 4
1 wales Cheese 3
次のコードで生成することができますx
とy axis
はヒートマップのラベルです。これらのラベルはしばしばかなり大きいので、それらを列挙してインデックスに置き換えたいとします(x
とy axes
の両方にある、つまりcheese
が1
の場合は,y axis
)。私はまた、新しいインデックスを元の値にマップする凡例を書くことができる必要があります。
所望の出力は次のようになります。
x_axis y_axis data
0 1 2 4
1 3 1 3
その後伝説は次のようになります。
cheese=1
farms=2
wales=3
誰が私に、プログラムでこれを行う方法のいくつかの提案を与えることができますか?
あなたのマッピングが完全に明らかではないかもしれません。追加の行row3 = ['Bread'、 'wales'、3]など、重複がある場合はどうなりますか? – tfv
こんにちはtfvなので、 'パン'は常に4(たとえば)、ウェールズは常に5 - カラムに関係なく – CiaranWelsh