2017-10-10 8 views
3

私は、数値列「金額」を持つパンダデータフレームを持っています。金額は0から20000まで変化します。範囲を定義するカテゴリ変数に変更したいと思います。だから、カテゴリ変数は次のようになります。数値データをカテゴリデータに変更 - パンダ

  1. 私はどのように把握することができません
  2. 1000年から2000年の間$というように。..まで19000から20000 $

$ 0から1000の間列を変更します。

months["value"] = np.where(months['amount']>=450, 'yes', 'no') 

しかし、2つ以上の値を持つカテゴリ変数の場合はどうすればいいですか?

答えて

4

あなたはcutを使用することができます。

df = pd.DataFrame({'B':[4000,5000,4000,9000,5,11040]}) 

df['D'] = pd.cut(df['B'], range(0, 21000, 1000)) 
print (df) 
     B    D 
0 4000 (3000, 4000] 
1 5000 (4000, 5000] 
2 4000 (3000, 4000] 
3 9000 (8000, 9000] 
4  5  (0, 1000] 
5 11040 (11000, 12000] 
関連する問題