現在、私はタイタニックのデータセットに取り組んでいます。それは4-5の非数値列で構成されています。 sklearn.LabelEncoderクラスを適用して、これらの非数値列のエンコードされた値を取得します。私は間違いなく、このメソッドを1つずつ各列に適用できます。しかし、このようなコラムが20-30本以上あると、仕事は面倒になるでしょう。私はそのような非数値列の名前を知っているので、簡単な方法でこれを行うための洗練された方法はありますか?パンダの複数の列にラベルをエンコードする
答えて
ちょうど
obj_cols = df.select_dtypes(include=[object])
for i in obj_cols:
df[i+'label'] = le.fit_transform(df[i])
単一のlabelencoderオブジェクトの使用' le'は列車とテストデータ。 –
ラベルエンコーディングを実行する前に列車データとテストデータを組み合わせることを常にお勧めします。ラベル・エンコーダを別々に実行すると、常にテスト・データに新しいカテゴリがある可能性があります –
"test"のポイントは新しいものをシミュレートするため、何かのために "train and test data ... before"あなたがプロダクションで取得したデータであり、そのようなデータがどのようなものになるかは事前に分かりません –
- 1. Sklearnラベル複数の列をエンコードするpandas dataframe
- 2. 複数の列を再サンプルするパンダ
- 3. 複数の列のパンダget_level_values
- 4. パンダ:複数の列のフィルタ
- 5. パンダのmaxの列ラベル
- 6. パンダのデータフレームの列にある各タイプのラベルの数
- 7. パンダ複数列の平均
- 8. パンダのDataFrame - シリーズの列を複数の列に分割する
- 9. パンダのデータフレーム列のリストを複数の列に分割する
- 10. 列に複数の行名をパンダ
- 11. パンダ、DataFrame:1つの列を複数の列に分割する
- 12. パンダの複数の列から複数の列を計算する方法
- 13. パンダ複数の列に同じ名前
- 14. パンダに別の列を作成する複数のIF文
- 15. 複数の列を持つパンダ・フィルナ
- 16. パンダで複数の列範囲をスライス
- 17. パンダのデータフレームにラベル付きの列を作成する
- 18. パンダの重複グループにラベルを付けるには?
- 19. パンダ複数列Groupbyプロット
- 20. グループ複数列 - パンダDATAFRAME
- 21. パンダの複数列のランク付け
- 22. 複数のIDのパンダと同じ列
- 23. パンダ:複数の列内の値でフィルタリング
- 24. 複数の列をパンダの別の列で割る
- 25. 複数のデータフレームのパンダの複数の列の最大値
- 26. 列ラベルに基づいてパンダのデータフレームを整形する
- 27. 複数のイメージを配列のアンドロイドスタジオでエンコードする方法
- 28. パンダ集計関数で複数の列を作成する
- 29. パンダの行のサブセットの複数の列を変更するDataFrame
- 30. 複数の列でグループとパンダ
が希望でしたオブジェクトの種類を選択した後にループを実行 'fillna' https://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.fillna.html –
いいえ!私はsklearn.LabelEncoderという用語自体を質問しました – HrishikeshKulkarni
名前とラベルエンコーダーでforループを使用するのはなぜですか? –