私はいくつかのテキスト列(可能性が限られている)とcsv形式の数値列で構成されるデータセットを持っています。自動的にテキスト列を数値に変換する方法はありますか(たとえば、Aは0、Bは1になるなど)、データセットをnp.array
に変換しますか?python - sklearnのnumpy配列にデータを変換する
これは後でscikit-learn
で使用されるため、すべての処理の最後にnp.array
にする必要があります。
EDIT:あなたは、各テキスト列にsklearn.preprocessing.labelEncoder()
を適用することができます
ENABLED;ENABLED;10;MANUAL;ENABLED;ENABLED;1800000;OFF;0.175;5.0;0.13;OFF;NEITHER;ENABLED;-65;2417;"wifi01";65;-75;DISCONNECTED;NO;NO;2621454;432477;3759;2.2436838539123705E-6;
はあなたが私たちのファイル(または「テキスト列」)の例(抜粋)を与えることができるように、我々はできますあなたがやっていることをよく理解していますか? 'numpy'の' genfromtext'は良い場所です。おそらく 'pandas.read_csv' ... – mgilson
説明に追加されました。各テキスト列には、3つまたは4つの可能な値があります。 – Minoru