0
私はデータマイニングの問題に取り組んでおり、オブジェクトのペア間で類似性を見つけなければなりません。私はすべての統計的距離が何であるかは知っていますが、統計的距離をいつ使うべきかを定義する情報源は見つけられませんか?KL-発散、Bhattacharyya距離などの統計的距離をいつ使用するかを明確に説明できますか?
私はデータマイニングの問題に取り組んでおり、オブジェクトのペア間で類似性を見つけなければなりません。私はすべての統計的距離が何であるかは知っていますが、統計的距離をいつ使うべきかを定義する情報源は見つけられませんか?KL-発散、Bhattacharyya距離などの統計的距離をいつ使用するかを明確に説明できますか?
私の答えは、統計的にそのようなことがないので、明白な "使用"ではありません。
Mahalanobisのような統計的な距離を使って私は過去に自分自身を見つけました。これは、同様の問題を扱う際のBhattacharyya距離の特別なケースです。私はKL-発散を使って木をつくっていました(最小限の樹木など)。
2つの主な違いは、Bhattacharyyaはメトリックであり、KLはそうでないため、データポイントについてどのような情報を抽出したいかを考えるとき、これを考慮する必要があります。
要するに、私はBhattacharyyaを使用します。