openmp

0熱

1答えて

私のマシンの論理コアの数は8です。スレッドの数をたとえば16 omp_set_num_threads(16);に増やすとどのような欠点がありますか？

0熱

2答えて

私は並列プログラミングに慣れていないので、起動できるスレッドの最大数を知りたいと思っていました。私はこの #include<stdio.h> #include<omp.h> void pooh(int id,int a[]) { a[id]=a[id]-1 ; printf("%d\n",id) ; } int main() { int a[1001]

0熱

1答えて

内部ループのインデックス、プライベートまたは共有？

これは私のコードです。OpenMPと並列化したいのですが。私は並列といくつかの内部ループを作るために1つのメインループを持っています。はp、iまたはプライベートまたは共有Liのように、内部ループのインデックスはありますか？変数をプライベートまたは共有として宣言しないとどうなりますか？この並列ループに割り当て可能な変数を使用することをお勧めしますか？ !$OMP PARALLEL DO

2熱

2答えて

OpenMP：共有変数にスレッドIDでアクセスするときにクリティカルセクションが必要です

私はOpenMPを使ってforループを並列化しています。私はスレッドIDでC++ Armadilloベクトルにアクセスしようとしていますが、別のスレッドがメモリの別々の領域にアクセスしたとしても、クリティカルセクションにアクセスする必要があるのでしょうか？/ #include <armadillo> #include <omp.h> #include <iostream> int main

0熱

1答えて

C OpenMP parallel forループはシングルスレッドよりもはるかに遅くなります

私はOpenMPをC言語で使い慣れていますが、関数内でforループを並列化するのに使用しましたが、場合。たとえば、forループは各ポイント（ハロー）に対して約10秒で実行できますが、OpenMPでは数分かかります。この関数では、各点（ハロー）のシェルの密度を計算し、シェル内の粒子を数えて配列に出力します。 512^3個の粒子と、約200個の点（ハロー）が計算されます。私は速くするために別のスレッ

1熱

1答えて

OpenMPにより内部コンパイルエラーが発生する

OpenMPのパフォーマンス向上をテストするための小さなプログラムを作成しました。 Microsoft Visual Studioを使用してコンパイルします。 void findAllPrimesUntilX() { for (int i = 2; i <= upToXthPrimes; i++) { if (i % 500 == 0) std::cout << "First

1熱

1答えて

OpenMPのは、私は別のスレッドで実行するループを入れしようとしています間違った結果に

こんにちはを与えます。今度はdoループの中で、再びサブルーチンを呼び出して総和を加算する関数を呼び出しています。私はループを囲む平行に置けば今、それはランダムな結果を与えているが、私はCRITICAL環境内で機能を置けば、それは正しい結果を与えていることがわかります。しかし、これはより多くのCPU時間を要し、速度をまったく改善しない。私は小さなテストプログラムでテストされ、私のロジックが正しいこ

1熱

1答えて

slurm sbatch標準IOリダイレクト

標準のioから読み込む必要がある並列プログラムを実行する必要があります。 slurm sbatchでファイルをどのように渡すことができますか？私は-inputコマンドを試しましたが、動作しませんでした。ここに私のsbatchスクリプトが #!/bin/sh #SBATCH -p main #SBATCH --nodes=1 #SBATCH --ntasks=1

0熱

1答えて

OpenMPの複数スレッドのファイルにwtimeの違いを保存する方法は？

パフォーマンスを向上させるためにデータベース内部プロジェクトにOpenMPを使用しようとしています。このプログラムからコンソールに何かを印刷する方法がないので、実行時間（omp_get_wtime()を使用しています）をファイルに保存する必要があります。より良い方法があればお勧めします。私はすべてのスレッド（以下のコードを参照）から1つのファイルに書き込もうとしましたが、スレッド数が複数の場合はク

0熱

1答えて

libgomp：スレッドの作成に失敗しました：CPUを無効/有効にした後に無効な引数

14個のコアとハイパースレッディングが有効な2ソケットマシンがあり、合計14 * 2 * 2 = 56個の処理ユニットまたは論理CPU。私が行うことで、すべての奇数のCPU（1、3、5、7、...、53、55）を無効： for i in {1..55..2}; do echo 0 > /sys/devices/system/cpu/cpu$i/online; done /sys/d