1
私はNEONレジスタにchar値の配列をロードし、16ビットまたは32ビットの整数値として扱おうとしています。だからこのようなもの...NEON/ARMを使用して8ビット値をロードする
void SubVector(short* c, const unsigned char* a, const unsigned char* b, int n)
{
for(int i = 0; i < n; i++)
{
c[i] = (short)a[i] - (short)b[i];
}
}
データをロードする方法がわかりません。 8ビットデータをレーンにロードしてから、レジスタを短絡として再解析する必要がありますか?またはロードして変換しますか?最速の方法は何でしょうか?
NEON組み込み関数でどのようにこれを行うかについての例がありますか?
ありがとうございます!
優れた答えです。 –
ありがとうございます。完璧。 – paul
私は同じことをやろうとしています。しかし、2つのuint8の差を計算すると、結果はuint16ではなくint16でなければなりません...この組み込み関数の使用は何ですか?私は私の否定的な結果を得るために再解釈する必要があります。 –