私は次のコードでフロップの総量を最小限に抑える必要があります。誰でも簡単に見てみてください。 ..以下のコードで浮動小数点演算を最小限に抑える方法
int twoDToOneD(int i, int j, int nRows)
{
return j*nRows + i;
}
double* addMatrices(int m, int n, double* A, double* B, bool add)
{
double* C = new double[m*n];
double* pA = A;
double* pB = B;
double* pC = C;
int i = m*n;
while(i--)
{
if(add)
{
*pC = *pA + *pB;
} else
{
*pC = *pA - *pB;
}
pC++;
pA++;
pB++;
}
return C;
}
おかげで、 チョー
SIMDを使用できない理由はありますか?これがすべて行列ベースなので、GPGPUカーネルとして最もよく機能するかもしれません。 – Necrolis
VS10でSIMDを使用できますか? – user1235325
ええ、vc6のどのバージョンでも、ターゲットプラットフォームがSSE1/2/3/4をサポートしているかどうか – Necrolis