ボックスをサンプリングする(ボックス内でランダムにポイントを選択し、これらのポイントで特定の関数を評価する)関数をopenMPと並列化したいと考えています。私は次のコードを書いた。openMP - 変数とアトミックへの同時アクセス
//storing points
double** points_ = new double*[N-m];
for(int i=0;i<N-m;i++)
{
points_[i]=new double[ndim];
}
double* evals_ = new double[N-m];
#pragma omp parallel for
for(int i=0;i<N-m;i++)
{
double* pt_ = randomPoint(lower,upper);
for(int k=0;k<ndim;k++)
{
points_[i][k]=pt_[k];
}
evals_[i]=evalFunc(pt_);
delete pt_;
}
しかし、私はこのコードには自信がありません:evals_とpoints_はかなりのスレッドで更新されています。私はそこにいくつかの原子のステートメントを追加することを考える:
#pragma omp parallel for
for(int i=0;i<N-m;i++)
{
double* pt_ = randomPoint(m_lower,m_upper);
for(int k=0;k<m_ndim;k++)
{
#pragma omp atomic update
points_[i][k]=pt_[k];
}
#pragma omp atomic update
evals_[i]=evalFunc(pt_);
delete pt_;
}
が、私は、これは非常にunefficientになることを恐れて:あなたは、より正確にそれを書くためのいくつかのアドバイスがありますか?そして...このコンパイルされていません...(エラー:式次の#pragma ompの原子が不適切なフォームを持っている)私は、OpenMP仕様でそのexamlpeを見つけることができますalthought、A22
void atomic_example(float *x, float *y, int *index, int n)
{
int i;
#pragma omp parallel for shared(x, y, index, n)
for (i=0; i<n; i++) {
#pragma omp atomic update
x[index[i]] += work1(i);
y[i] += work2(i);
}
}
とアトミック更新もここが続いています配列への影響。
ありがとうございます。
EDIT --------
私はチューダーの答えに同意します。なぜそれがその後、必要とされている
for(i=0;i<m_ndim;i++)
{
double sum_=0;
#pragma omp parallel reduction(+:sum_)
for(j=0;j<m_npts;j++)
{
sum_ += set_[j][i];
}
Sum_[i] = sum_;
}
ライン合計で_ + = ...、エラーが(同時アクセス)を発生します。?しかし、この例では、ここでは、コードの別の並列化作品で、原子必要ないと思われますかそれとも間違っていますか?
私は同意します!しかし、今、この他のコード部分(私はこのサンプルで上の記事を編集しました)が、 'sum _ + = set_ [j] [i]'行に同時アクセスがあると私に伝えて、クラッシュしています。ありがとう! – octoback
@dlib:それは '#pragma omp parallel reduction ...'ではないでしょうか?あなたは 'for'を欠いているように見えますが、これは計算とは全く異なる意味を与えます。 – Tudor