特定の因子分類ラベルの数値範囲の決定方法R

ラベルに問題があります。私は階層的なクラスタリング分析を実行しており、データの範囲にラベルを付ける必要があります。（私は著書「データマイニングやR WITH ビジネス分析」の例からこのような構造を得る特定の因子分類ラベルの数値範囲の決定方法R

comisiones[["Monto.Pago.Credito"]] <- ordered(cut(comisiones[["Monto.Pago.Credito"]], c(100.96, 382.30, 866.80, 1040, 11500)), labels = c("min", "1er Quartil", "3er Quartil", "Max"))

ヨハネス：これは、私はいくつかのレベルにラベルを付けてみてください特定の変数のために、私のコードの一部です。 Ledolter、2013）。

このコードは、データをNULL値に変換するデータの一部を切り捨てて、それが私の問題です。

出典

2016-06-15 DanielYuksek

を、引数include.lowest = TRUEを使用する、すなわち

ordered(cut(comisiones[["Monto.Pago.Credito"]], c(100.96, 382.30, 866.80, 1040, 11500), include.lowest = TRUE), labels = c("min","1er Quartil", "3er Quartil", "Max"))

出典

2016-06-15 15:44:09 jkt

あなたの問題を解決するには、最小値と最大値のわずかに上と下の値を2番目のcut引数に追加してください。ここ

は再現例です

cut(1:10, c(3,7,8)) 
[1] <NA> <NA> <NA> (3,7] (3,7] (3,7] (3,7] (7,8] <NA> <NA> 
Levels: (3,7] (7,8]

は、下部及び上部の値を追加：cut(...)で

> cut(1:10, c(0,3,7,8,11)) 
[1] (0,3] (0,3] (0,3] (3,7] (3,7] (3,7] (3,7] (7,8] (8,11] (8,11] 
Levels: (0,3] (3,7] (7,8] (8,11]

出典

2016-06-15 15:29:52 lmo

特定の因子分類ラベルの数値範囲の決定方法R

答えて

関連する問題