0
を鋳造私は組み込み関数__double2loint、__double2hiintと__hiloint2doubleキャストCUDAタイプのCPU同等物が何であるか、把握しようとしています。CUDAタイプと同等の組み込み関数は、組み込み関数の__double2loint、__double2hiintと__hiloint2double
_mm_cvttsd_si32は__double2lointと同等かもしれないと思いますが(それは正しいですか?)、__double2hiintと__hiloint2doubleに相当するものは見つかりませんでした。このような関数の高速版をC言語で実装することは可能ですか?
標準のCでこれらの関数を簡単に 'union'を使って書くことができます。 – tera
'_mm_cvttsd_si32'は再解釈ではなく、変換です。あなたは '_mm_castsi128_ps'などで再解釈することができますが、前述のようにC自体で行うことができます。 – harold
上記のCUDA型キャストイントリンシックのいずれかを実装するにはどうすればよいですか? –