データ表の文字列型の列値を整数値でエンコードする方法を教えてください。たとえば、色(R、G、Bの可能な文字列値)とスキル(可能な文字列値C++、Java、SQL、Python)の2つの機能変数があります。与えられたデータテーブルが有する2 columns-エンコーディングPythonまたはSklearnの整数値による文字列値の列変数
Iはsklearn機能/方法は、R = 0、G = 1、B = 2とCとのような2つの列の上に変換れるかを知りたいColor' -> R G B B G R B G G R G ;
Skills' -> Java , C++, SQL, Java, Python, Python, SQL, C++, Java, SQL, Java.
++ = 0、ジャワ= 1、SQL = 2、Python = 3:
Color: 0, 1, 2, 2, 1, 0, 2, 1, 1, 0, 1
Skills: 1, 0, 2, 1, 3, 3, 2, 0, 1, 2, 1
どうすればいいですか?
?与えられたコードを表示してください。 – unutbu
データを保持するためにnp.arrayまたはdataframeを使用できます。ただし、さまざまなサンプル(行)のフィーチャー変数(列)データを格納できるのであれば、任意のタイプのオブジェクトを自由に使用できます。 – Chandra
それはもっと具体的にリストかもしれません.... – Chandra