1

手書き数字0および1(http://yann.lecun.com/exdb/mnist/)の散布図を作成したいとします。私は2つの0と2の4つのサンプルを取った。手書き数字の散布図

各手書き数字は、次元1の相互778マトリックスを有するピクセル値を有する。

ここでは、これらの桁の散布図を2次元で分割して分離可能かどうかを確認します。

私はRでそれらをプロットしようとしましたが、最終的なプロットは点の混合です。 各桁の散布図が他と異なって見えるようにするにはどうすればよいですか?プロット中に正しい方向に進んでいますか?

お知らせください。

答えて

2
  1. これらはおそらく分離可能なので、実際には確認する必要はありません。

  2. これらが分離可能かどうかを知りたい場合は、SVMなどの分類子を使用するのが正しい方法です。

    4桁(4x778)のうちreduce the dimensionsを2次元(4x2)にしようとしています。それを行うには多くの方法があり、どれも完璧ではありません。ディメンションを縮小すると、一部の情報は常に失われるため、高次元のデータが分離可能かどうかを判断するための近似的な方法に過ぎません。

    2つ(または任意の数)の次元にデータを縮小する最も一般的な/簡単な方法は、PCAと呼ばれます。