私はsklearn LabelEncoderを使用しています。私は1次元配列のためにそれを使用する方法を知っている、しかし、のような私のユースケースは、次のとおりです。私は効果的に分類子になど各テキストラベルu'a'
、u'b'
を割り当てる私のコストである。このようなdictsの複数のアレイを(持っている辞書にラベルエンコーダを使用する
辞書内)、全:
{'open_model':
[
{u'a': 47502.125, u'c': 45.3, u'd': 2.3, u'e': 0.45},
{u'b': 121, u'a': 1580.5625, u'c': 12, u'e': 62,u'd':0.343},
{u'e': 12321, u'b': 4, u'a': 0.1112}
],
'closed_model':
[
{u'a': 1231.22, u'c': 43.1},
{u'b': 342.2, u'a': 121.1, u'c': 343},
{u'b': 14.2, u'a': 53.2}
]
}
Iは、例えば、数値ラベルにこれを符号化し、再度それらの全てをデコードするのでできるようにする必要があります。私が生成するために有効に使用
[
{1: 47502.125, 3: 45.3, 4: 2.3, 5: 0.45},
{2: 121, 1: 1580.5625, 3: 12, 5: 62, 4: 0.343},
{5: 12321, 2: 4, 1: 0.1112}
]
eの最良のラベルの予測そのACH行は、:辞書の配列に、私は同じLabelEncoder
機能を取得できますか
[u'e',u'd', u'a'] perhaps in this case.
しかしfit_transform
に:
[5, 4, 1] perhaps in this case.
私は何をする必要があることは背中にこれをデコードすることができることですどこのdictキーが私のラベルですか?
dictsの配列内のdictは異なる長さですが、私はすべての潜在的なラベル、つまりopen_modelラベルset([u'a',u'b',u'c',u'd',u'e'])
とclosed_modelラベルのリストを持っています:set([u'a',u'b',u'c'])
。
、この溶液を理解しています。しかし、修正された質問を参照してください(既存のものはあまりにも小さすぎます)。 –
あなたのメソッドは動作しますが、インプレースを変更すると 'KeyError'が発生します。私のキーは' u '/ location/statistical_region/size_of_armed_forces''の代わりに 'u'a''のようなものです。 –
ソートされました! 'pop 'の私のprintステートメントは値をポップして削除していたので、再割り当てすると消えてしまったということを意味していました。 –