2009-06-15 16 views
4

私は世界中の国のデータを読んでおり、Googleの視覚化ガジェット、特にmap visualizationsで遊んでいます。問題は、米国が常に前線に出てくることです。ほとんどの国は1から50の価値を持っていますが、米国は一貫して2000+以上の価値があります。つまり、ビジュアライゼーションでは、すべての「小さな国」の違いを伝えることは難しいです。米国は常に濃い緑色ですが、淡い緑の色合いはほぼ同じです。視覚化のためにデータ値を「平滑化」するアルゴリズム

私は視覚化の精度について特に気にしないので、値を少しずつ平均化または平均化して、非常に低い、低い、低い国。それを行うための良いアルゴリズムは何ですか?

かなり単純な問題ですが、私は数学者ではありません。^_^;;

答えて

13

データを対数スケールで表示する方法はありますか?このようにして、値10は1に変換され、値100は2に変換され、1000は3に変換されます。

+0

ここで、log()がうまくいくかを学びました。 ;) ありがとうございます。 – deceze

+1

0はマイナスの無限大に変換されるため、問題が発生する可能性があります。実用的なトリックは、ログ(1 + x)またはログ(0.001 + x)またはあなたのために働くもの、あるいはログ(min(1、x))、ログ(min(0.001、x))などです。 –

0

ログスケールは、一般に重要なデータポイントのほとんどの間に大きさの差がある場合にオプションです。

しかし、ディストリビューションがバイモーダルの場合は、正規化してからデータを破棄する方がよいでしょう。

これを実行するには、米国2000+(GDPはおそらく?)に関連するパラメータを見つけ、すべてのデータポイントをこの数値の地域値に正規化する必要があります。あなたは直感的なカラーマップに興味のある正確な違いを見ることができます。

関連する問題