1
私は約100以上の異なる文字列を含む私のデータセットを符号化したラベルを持っています。sklearnでマッピングされたラベルエンコーディングのリストを取得していますか?
したがって、元の文字列の横にラベルのリストを表示する方法はありますか。例のように
:
apple --> 3
orange --> 4
pear --> 1
私は約100以上の異なる文字列を含む私のデータセットを符号化したラベルを持っています。sklearnでマッピングされたラベルエンコーディングのリストを取得していますか?
したがって、元の文字列の横にラベルのリストを表示する方法はありますか。例のように
:
apple --> 3
orange --> 4
pear --> 1
sklearn.preprocessing.LabelEncoder
のドキュメントから:
classes_: array of shape (n_class,) Holds the label for each class.
これからdict
を構築することは些細なことする必要があります。
一般的に、Sklearnステージは、このタイプの情報をアンダースコア(たとえば、classes_
の場合)で終了するメンバーに保持します。
例
from sklearn import preprocessing
>>> preprocessing.LabelEncoder().fit(['apply', 'banana']).classes_
array(['apply', 'banana'],
dtype='|S6')
だから、これは符号化のために使用されるコードの場合:やっ 'labeled_df = String_df.apply(。LabelEncoder()fit_transform)' しかし、 'プリント(labeled_df.classes_) 'は' AttributeError: 'DataFrame'オブジェクトに 'classes_''属性がないというエラーを返します。私は間違ったことをしましたか? – Dawny33
@ Dawny33 –
例を追加しました。あなたの例は本当に間違っています。変換出力ではなく、 'class_'の* stage *を照会する必要があります。あなたのケースでは、一時ステージオブジェクト( 'LabelEncoder()')を使用しているため、照会するオブジェクトがありません。 –