3

これは本当に概念的な質問です。私はこれをいつかやっていますが、私の問題を解決する素晴らしい方法は見つけていません。私はhexagonal image with hexagonal binning/pixelsを持っており、各ピクセルの強度値はb/wで、これをディープオートエンコーダに入力しようとしていますが、正方形または長方形の画像(正方形ピクセル)を使用しているようです。 この画像は適切なx、y座標を持つ1次元配列として与えられることに注意してください。六角形(ビン)画像のニューラルネットワーク?

私はこの状況を処理するための考え方を数多く考えています。私は正しい方向へ。

  • 六角形のイメージを立方体に変換します。これはすべての完全な六角形ピクセルを扱うと機能しますが、半分のセル(半分の六角形)はこれを不可能にします。
  • 六角形のピクセルを同じサイズのピクセル(半角の六角形)にスライスするので、それらを「正方形」ピクセルとしてフィードできます。しかし、半六角形の向きは、これが課題であることを証明しています。私はまた、ピクセルをこれより小さな三角ピクセルにスライスすることを考えましたが、それに対処する方法はわかりませんでした。
  • 白いピクセル(つまり、すべて0)を追加し、画像を長方形または正方形のように見せます。しかし、正方形と六角形のピクセルの関係はわかりません。
  • 六角形ピクセルを正方形ピクセルに変換し、六角形イメージが矩形イメージになるように白いスペースを追加します。これは最も可能性が高いと思われ、私は現在、これを行う方法に関する記事を読んでいますが、半六角形のピクセルを正しく処理する方法がわかりません。

私は一般的な質問があると思います -

私は 画像を非矩形状と非矩形ピクセル化の両方の場合にニューラルネットワークに画像を送るに対処する方法を教えてください。

ご迷惑をおかけして申し訳ございません。ありがとう!

答えて

1

通常の正方形のグリッドで再サンプリングすることで問題は発生しませんので、正しい2D画像になります。どのような場合でも、ネットワークのサイズを適度に小さく保つために、それを行う必要があります。

+0

ああ、ハーフピクセルの場合、オートエンコーダが同じ値を再現したいという事実を考慮して、データ値を強度の半分として表現するか、ジオメトリは不変になりますか? 私はプールにCNNを適用しようとしています。 – Kai

+0

@ Kai、各正方形ピクセルには、そのピクセルの中心に対応する六角形グリッド上の位置にある値を割り当てます。それは写真を撮るようなものです。 –

+0

こんにちはドン - 大丈夫ですが、どうやって非長方形の画像を扱うのですか?上のリンクからの六角形の輪郭内にあるのは、画像が実際にどのようなものなのかです(画像を正方形にする他のものは、アーティストが描いたオーバーレイです)。オートエンコーダで使用されるテンソルは非長方形であり、行列に対しては不可能と思います。 – Kai