とスケーリング:差Iは、以下のスキューデータを有する対数変換
:set.seed(3)
x <- rgamma(1e6, 0.1, .2)
summary(log(x))
# Min. 1st Qu. Median Mean 3rd Qu. Max.
# -170.637 -12.760 -5.825 -8.828 -1.745 3.807
、変換でデータを可視化データの対数変換分布
summary(log(x))
# Min. 1st Qu. Median Mean 3rd Qu. Max.
# -170.637 -12.760 -5.825 -8.828 -1.745 3.807
を見
ggplot(data.frame(x), aes(x)) +
geom_histogram(bins = 100) +
scale_x_continuous(trans = "log")
ggplotのログ変換とスケーリングの違いは何故ですか?私は、x軸を見て違いがあることを知っています。サマリーの最小値は-170.637
で、プロットは5.8e-62
の範囲の値です。
更新:
g1 <- ggplot(data.frame(x), aes(x)) + geom_histogram(bins = 100)
g2 <- ggplot(data.frame(x), aes(x)) + geom_histogram(bins = 100) + scale_x_continuous(trans = "log")
g3 <- ggplot(data.frame(x), aes(log(x))) + geom_histogram(bins = 100)
gridExtra::grid.arrange(g1, g2, g3, ncol=3)
g1 <- ggplot(data.frame(x), aes(x)) + geom_histogram(bins = 100)
g2 <- ggplot(data.frame(x), aes(x)) + geom_histogram(bins = 100) + scale_x_log10()
g3 <- ggplot(data.frame(x), aes(log10(x))) + geom_histogram(bins = 100)
gridExtra::grid.arrange(g1, g2, g3, ncol=3)
FYI、対数変換のデフォルトの区切りは 'スケール:: log_breaks'機能、私が見て有益な発見によって行われます。 – aosmith