1
私はpandasシリーズを使用しています。これを1つのホットエンコーディングに変換しようとしています。私はdescribe
メソッドを使用して、一連のユニークなカテゴリの数を確認しています。出力は次のとおりです。Pandas get_dummiesは同じ機能の複数の列を生成します
input['pattern'].describe(include='all')
count 9725
unique 7
top 1
freq 4580
Name: pattern, dtype: object
私がしようとしている:
x = pd.get_dummies(input['pattern'])
x.describe(include= 'all')
を、私は完全にゼロです12クラスと18のクラスを取得します。どのようにしてget_dummies
は入力で一度も出現しなかったクラスを作りましたか?
私はあなたのデータを見ることができないので、あなたの問題点は何もわかりません。それについて何かできますか? –
私のデータは、['0'、 '0'、 '5'、 '6'、....]のようなオブジェクト形式の数字に過ぎません。それはもともと18のクラスを持っていましたが、すべての高級クラスはクラス '6'に変更され、describeメソッドはそれを確認しました。すべての上位生成クラスはすべてゼロです。 –
申し訳ありません、私はまだ理解していない、あなたの説明はあまり役に立たない。すべてのget dummiesは、あなたの列をエンコーディングのデータフレームに変換します。あなたが持っているユニークな機能の数は、列の数を数えます。出力上で 'describe'を呼び出すことは意味がありません。なぜなら、それはちょうど0と1であるからです。 –