vtune

    65

    2答えて

    私はWindowsとLinux(x86-64)の両方でプログラムを実行しています。これは同じコンパイラ(Intel Parallel Studio XE 2017)で同じオプションでコンパイルされており、WindowsのバージョンはLinuxのものより3倍高速です。原因は、std::erfへの呼び出しで、どちらの場合でもIntel数学ライブラリで解決されます(デフォルトではWindowsでは動的に

    1

    1答えて

    Visual Studio 15と共にインテルVTuneの試用版を使用してプロファイルを作成しようとしたCMakeを使用してプロジェクトを作成しました。Visual StudioでWindowsデバッグシンボルサーバを設定し、 VTuneはすべてのシンボルを見つけることができません。私のプロジェクトは、コースのデバッグ用に設定されています。 1)私はその場所を解決するために、プロジェクトフォルダに

    0

    1答えて

    お手伝いできますか? 私はWindows 7 x64でOpenCLアプリケーションを開発しています。ハードウェアはIntel Core i5、NVIDIA GTX 770です。OpenCLはアクセラレーションにNVIDIAを使用します。 Intel VTune Amplifier XE 2015を使用しようとすると、プロファイリングの終了時にアプリケーションがハングし、レポートが返されません。ドキ

    0

    2答えて

    私はC++でプログラムし、スレッド同期のためにCAS操作を使用します。 私はVtuneを使用して自分のプログラムをプロファイリングし、CASの操作に膨大な時間を費やしていることがわかりました。 私はアセンブリコードを見ました。 プロファイリング結果が '(%のRDI)、cmpxchgq%RCXロック' 時間のかなりの部分が 'MOVQの%のRAX、(%のRSI)' ではなく、上に費やされていること

    -1

    1答えて

    私の単純な(数行)のVS2015コンソールC++(ネイティブ)のインテルの「高度なホットスポット、スタックおよびコンテキストスイッチ分析」以上を実行すると、その処理がハングし、Windowsの再起動が必要な場合は、zipファイルで囲まれたサンプルの解決方法と画面のキャプチャを参照してください)。同じことが、より大きなソリューションに適用されます...基本的なホットスポット 『と『高度なホットスポッ

    0

    1答えて

    は、私は以下を参照してください。 Memory Bound 50.8% 私は(Intel doc)を言うインテルドキュメント、読み: メモリーバウンド対策スロットの割合をデマンドロード命令またはストア命令のためにパイプラインがストールする可能性があります。これは、店舗がパイプラインに背圧をかける可能性がある一般的でないケースに加えて、実行不足と同時に生じる不完全な機内メモリ要求負

    0

    1答えて

    私はマルチスレッドプログラムを持っています。スレッドプールの独自の実装を使用します。まず、プロジェクトの負荷は十分です。単一のスレッドにcompred、2つのスレッドのプログラムがより高速です。 スレッド数を2より大きくすると、パフォーマンスがひどくなります。明らかに、私たちはマルチスレッドパフォーマンスの問題に遭遇しました。 次に、インテル®VTune™アンプXE 2017パフォーマンス分析を使

    0

    1答えて

    私はインテル®VTuneアンプについて(Linuxからの)this video tutorialを以下だし、私はすべてに従ってきましたが、彼は二つの基本的な分析を比較したときに、このエラーがあります: どのように私はこの問題を解決することができますか?

    1

    1答えて

    9月ドライバが組み込まれていないし、インストールされなかった。 [email protected]:/opt/intel/vtune_amplifier_xe/sepdk/src$ sudo ./insmod-sep -q pax driver is not loaded. socperf2_0 driver is not loaded. sep4_0 driver is not loade

    1

    1答えて

    私はIntel VTune Amplifierを使ってOpenCVをプロファイルしようとしています。 thisページには、最適な解析を行うために推奨されるコンパイラオプションのリストがあります。 あなたが見ることができるように、それはデバッグフラグ(例えば-g)と最適化フラグ(例えば-O2以上)のミックスですので、我々はそれが「デバッグ情報とリリースモード」を提案すると言うことができます。 Ope