2012-04-16 15 views
4

ボックスをサンプリングする(ボックス内でランダムにポイントを選択し、これらのポイントで特定の関数を評価する)関数をopenMPと並列化したいと考えています。私は次のコードを書いた。openMP - 変数とアトミックへの同時アクセス

//storing points 
double** points_ = new double*[N-m]; 
for(int i=0;i<N-m;i++) 
{ 
    points_[i]=new double[ndim]; 
} 
double* evals_ = new double[N-m]; 

#pragma omp parallel for 
for(int i=0;i<N-m;i++) 
{ 
    double* pt_ = randomPoint(lower,upper); 
    for(int k=0;k<ndim;k++) 
    { 
     points_[i][k]=pt_[k]; 
    } 
    evals_[i]=evalFunc(pt_); 
    delete pt_; 
} 

しかし、私はこのコードには自信がありません:evals_とpoints_はかなりのスレッドで更新されています。私はそこにいくつかの原子のステートメントを追加することを考える:

#pragma omp parallel for 
for(int i=0;i<N-m;i++) 
{ 
    double* pt_ = randomPoint(m_lower,m_upper); 
    for(int k=0;k<m_ndim;k++) 
    { 
     #pragma omp atomic update 
     points_[i][k]=pt_[k]; 
    } 
    #pragma omp atomic update 
    evals_[i]=evalFunc(pt_); 
    delete pt_; 
} 

が、私は、これは非常にunefficientになることを恐れて:あなたは、より正確にそれを書くためのいくつかのアドバイスがありますか?そして...このコンパイルされていません...(エラー:式次の#pragma ompの原子が不適切なフォームを持っている)私は、OpenMP仕様でそのexamlpeを見つけることができますalthought、A22

void atomic_example(float *x, float *y, int *index, int n) 
{ 
    int i; 
    #pragma omp parallel for shared(x, y, index, n) 
    for (i=0; i<n; i++) { 
    #pragma omp atomic update 
    x[index[i]] += work1(i); 
    y[i] += work2(i); 
    } 
} 

とアトミック更新もここが続いています配列への影響。

ありがとうございます。

EDIT --------

私はチューダーの答えに同意します。なぜそれがその後、必要とされている

for(i=0;i<m_ndim;i++) 
{ 
    double sum_=0; 
    #pragma omp parallel reduction(+:sum_) 
    for(j=0;j<m_npts;j++) 
    { 
     sum_ += set_[j][i]; 
    } 
    Sum_[i] = sum_; 
} 

ライン合計で_ + = ...、エラーが(同時アクセス)を発生します。?しかし、この例では、ここでは、コードの別の並列化作品で、原子必要ないと思われますかそれとも間違っていますか?

答えて

3

コードにアトミック句は必要ありません。

外部ループがインデックスiに分割されているため、各スレッドはpoints_eval_の要素のセットを別のスレッドのワーキングセットと重複しないようにします。

evals_は配列なので、(暗黙の静的スケジューリング方式のために)各スレッドは連続したサブアレイを取得します。

0 1 2 3 . 4 5 6 7 . 8 9 10 11... 
    t1  t2  t3 

points_二次元の行列であり、各スレッドは、行の連続したセットを取得します:各ので、あなたがkの値の重複を持っているように思われる。この第2のケースで

0 
    1 
t1 2 
    3 
    . 
    4 
    5 
t2 6 
    7 
    . 
    8 
    9 
t3 10 
    11 
    ... 

をスレッドはkと同じ範囲ですが、更新されたポイントは異なる行(インデックスi)に属します。これは上に示したように、異なるスレッドでは重複しません。

+0

私は同意します!しかし、今、この他のコード部分(私はこのサンプルで上の記事を編集しました)が、 'sum _ + = set_ [j] [i]'行に同時アクセスがあると私に伝えて、クラッシュしています。ありがとう! – octoback

+0

@dlib:それは '#pragma omp parallel reduction ...'ではないでしょうか?あなたは 'for'を欠いているように見えますが、これは計算とは全く異なる意味を与えます。 – Tudor

関連する問題