をコンパイルしません私はvectorspace.cuh
にベクトルfloat3
上の空間(および類似の構造体を)持っている演算子をオーバーロード:スラストの低減および(定数するfloat3&、constのするfloat3&)operator-、オーバーロードが
// Boilerplate vector space over data type Pt
#pragma once
#include <type_traits>
// float3
__device__ __host__ float3 operator+=(float3& a, const float3& b) {
a.x += b.x; a.y += b.y; a.z += b.z;
return a;
}
__device__ __host__ float3 operator*=(float3& a, const float b) {
a.x *= b; a.y *= b; a.z *= b;
return a;
}
// float4
__device__ __host__ float4 operator+=(float4& a, const float4& b) {
a.x += b.x; a.y += b.y; a.z += b.z; a.w += b.w;
return a;
}
__device__ __host__ float4 operator*=(float4& a, const float b) {
a.x *= b; a.y *= b; a.z *= b; a.w *= b;
return a;
}
// Generalize += and *= to +, -=, -, *, /= and/
template<typename Pt> __device__ __host__
typename std::enable_if<std::is_class<Pt>::value || std::is_enum<Pt>::value, Pt>::type
operator+(const Pt& a, const Pt& b) {
auto sum = a;
sum += b;
return sum;
}
template<typename Pt> __device__ __host__
typename std::enable_if<std::is_class<Pt>::value || std::is_enum<Pt>::value, Pt>::type
operator-=(Pt& a, const Pt& b) {
a += -1*b;
return a;
}
template<typename Pt> __device__ __host__
typename std::enable_if<std::is_class<Pt>::value || std::is_enum<Pt>::value, Pt>::type
operator-(const Pt& a, const Pt& b) {
auto diff = a;
diff -= b;
return diff;
}
template<typename Pt> __device__ __host__
typename std::enable_if<std::is_class<Pt>::value || std::is_enum<Pt>::value, Pt>::type
operator-(const Pt& a) {
return -1*a;
}
template<typename Pt> __device__ __host__
typename std::enable_if<std::is_class<Pt>::value || std::is_enum<Pt>::value, Pt>::type
operator*(const Pt& a, const float b) {
auto prod = a;
prod *= b;
return prod;
}
template<typename Pt> __device__ __host__
typename std::enable_if<std::is_class<Pt>::value || std::is_enum<Pt>::value, Pt>::type
operator*(const float b, const Pt& a) {
auto prod = a;
prod *= b;
return prod;
}
template<typename Pt> __device__ __host__
typename std::enable_if<std::is_class<Pt>::value || std::is_enum<Pt>::value, Pt>::type
operator/=(Pt& a, const float b) {
a *= 1./b;
return a;
}
template<typename Pt> __device__ __host__
typename std::enable_if<std::is_class<Pt>::value || std::is_enum<Pt>::value, Pt>::type
operator/(const Pt& a, const float b) {
auto quot = a;
quot /= b;
return quot;
}
これらのオーバーロードは、のコンパイルを破りますthrust::reduce
、ここでの例:Ubuntuの16.04でnvcc -std=c++11 -arch=sm_52
を使用して
#include <thrust/reduce.h>
#include <thrust/execution_policy.h>
#include "vectorspace.cuh"
int main(int argc, char const *argv[]) {
int n = 10;
float3* d_arr;
cudaMalloc(&d_arr, n*sizeof(float3));
auto sum = thrust::reduce(thrust::device, d_arr, d_arr + n, float3 {0});
return 0;
}
コンパイルエラーの200以上の行で、この結果:
$ nvcc -std=c++11 -arch=sm_52 sandbox/mean.cu
sandbox/mean.cu(26): error: no operator "*" matches these operands
operand types are: int * const thrust::zip_iterator<thrust::tuple<const float3 *, thrust::pointer<float3, thrust::system::cuda::detail::par_t, thrust::use_default, thrust::use_default>, thrust::null_type, thrust::null_type, thrust::null_type, thrust::null_type, thrust::null_type, thrust::null_type, thrust::null_type, thrust::null_type>>
detected during:
instantiation of "std::enable_if<<expression>, Pt>::type operator-=(Pt &, const Pt &) [with Pt=thrust::zip_iterator<thrust::tuple<const float3 *, thrust::pointer<float3, thrust::system::cuda::detail::par_t, thrust::use_default, thrust::use_default>, thrust::null_type, thrust::null_type, thrust::null_type, thrust::null_type, thrust::null_type, thrust::null_type, thrust::null_type, thrust::null_type>>]"
(35): here
instantiation of "std::enable_if<<expression>, Pt>::type operator-(const Pt &, const Pt &) [with Pt=thrust::zip_iterator<thrust::tuple<const float3 *, thrust::pointer<float3, thrust::system::cuda::detail::par_t, thrust::use_default, thrust::use_default>, thrust::null_type, thrust::null_type, thrust::null_type, thrust::null_type, thrust::null_type, thrust::null_type, thrust::null_type, thrust::null_type>>]"
...
thrust
を壊さずに演算子をオーバーロードするにはどうすればよいですか?
私は最小限の例を少し遠すぎていました...私は 'floa t3'、 'float4'などのカスタム構造体があります。 – qiv
@qiv:質問の変更に合わせて編集しました。 – einpoklum
今私はそれを得る、ありがとうたくさん:-) – qiv