私はtensorRTを使って埋め込まれた深い学習推論C++プロジェクトに取り組んでいます。 私のモデルでは、平均画像を減算する必要があります。埋め込みシステム用のPNG画像をロードする
私が使用しているAPIは、RGB画像のための次のようなデータ構造での平均画像を定義するために私を許可する:
uint8_t *data[DW_MAX_IMAGE_PLANES]; // raw image data
size_t pitch; // pitch of the image in bytes
uint32_t height; // height of the image in px
uint32_t width; // image width in px
uint32_t planeCount; // plane count of the image
これまでのところ、私はこの作業のために、私は非常に便利ですLIB LodePNGを見つけました思う。 それはわずか数行でPNG画像を読み込むことができます。今
// Load file and decode image.
std::vector<unsigned char> image;
unsigned width, height;
unsigned error = lodepng::decode(image, width, height, filename);
質問はuint8_t *[DW_MAX_IMAGE_PLANES]
にstd::vector<unsigned char>
を変換し、ピッチとプレーン数の値を計算する方法ですか?
私は、RGB画像にDW_MAX_IMAGE_PLANESを使用していたようpitch
とplaneCount
3.
pngを既に正常に読み込んだので、あなたの質問のタイトルが間違っているようです。 –
おそらく['std :: vector'](http://en.cppreference.com/w/cpp/container/vector)の参考資料が参考になるでしょうか?ベクトルによって管理されているデータへのポインタを取得するには、最初の要素へのポインタを取得するなど、いくつかの方法があります(ただしこれに限定されません)。 –
残りの部分については、あなたが提供したライブラリがあなたにそのメタデータを提供していませんか? –