odeintとopenmpを使用してopenmpを使用してコードを並列化しようとしていますが、スレッドの数を変更すると並列性がうまくいかず、実行を確定する時間が改善されません。私が間違っていることは何ですか?ここでodeintでopenmpを使用する
は、コードの重要な部分です:
using namespace boost::numeric::odeint;
using namespace std;
typedef std::vector<double> state_type;
struct ode {
void operator()(const state_type &XY , state_type &dUdt , double t) {
const size_t N = XY.size();
#pragma omp parallel for schedule(runtime)
for (size_t aux = 0; aux <= N; aux++) {
dUdt[0] = XY[1];
dUdt[1] = 2 * w * XY[3] + 3 * (w * w) * XY[0];
}
}
};
main() {
typedef runge_kutta4<
state_type , double ,
state_type , double ,
openmp_range_algebra
> rk4;
state_type XY(2);
int number_threads = 1;
omp_set_num_threads(number_threads);
int chunk_size = omp_get_max_threads();
omp_set_schedule(omp_sched_static , chunk_size);
integrate_n_steps(rk4() , ode() , XY , 0.0 , 0.00001 , 200);
}
私は、私は十分に明らかにされている願って、私はちょうど私のコードでのOpenMPを使用できるようにしたいと思います。
ありがとうございました。
forループでは、aux'変数が使用されていません。おそらくcompiler/runtimeはそれに気付くほどスマートです(ただし、警告?)、何も並列化しません。コンパイラオプションに '-fopenmp'が含まれていますか? –