300個のフィーチャーと1500個の観測を含むクラスター文書への単一リンケージで階層クラスター化を実行したい。私はこの問題のためのクラスターの最適な数を見つけたいと思う。Gap統計を使用して階層的クラスタリングで最適なクラスタ数を見つける方法は?
以下のリンクは、最大ギャップを持つクラスタの数を見つけるために以下のコードを使用しています。
# Compute gap statistic
set.seed(123)
iris.scaled <- scale(iris[, -5])
gap_stat <- clusGap(iris.scaled, FUN = hcut, K.max = 10, B = 50)
# Plot gap statistic
fviz_gap_stat(gap_stat)
しかし、リンクHCUTで
は明確に定義されていません。clusGap()
関数に対して、単一リンケージ階層クラスタリングを指定するにはどうすればよいですか?
clusGap()
のpythonに相当するものはありますか?
おかげ