generic_simd/generic4_8h_source.html

 #ifndef GENERIC4_H_

 #define GENERIC4_H_


 #include "gsimd_utility.h"


 namespace generic {


 #define LANES 4

 //

 // Constructor Section

 //


 template <>

 struct svec<LANES,bool>;

 template <>

   struct svec<LANES,int8_t>;

 template <>

   struct svec<LANES,uint8_t>;

 template <>

   struct svec<LANES,int16_t>;

 template <>

   struct svec<LANES,uint16_t>;

 template <>

   struct svec<LANES,int32_t>;

 template <>

   struct svec<LANES,uint32_t>;

 template <>

   struct svec<LANES,int64_t>;

 template <>

   struct svec<LANES,uint64_t>;

 template <>

   struct svec<LANES,float>;

 template <>

   struct svec<LANES,double>;

 template <>

   struct svec<LANES,void*>;


 template<>

 struct svec<LANES,bool> {


     uint32_t v; //only use 4 bits


     FORCEINLINE svec() { v = 0;}

     FORCEINLINE svec(uint32_t a, uint32_t b, uint32_t c, uint32_t d) {

       v = ((a ? 1 : 0) |(b ? 2 : 0)|(c ? 4 : 0)|(d ? 8 : 0));

     }

     FORCEINLINE svec( uint32_t a){

       v = a ? 15 : 0;

     }


     SUBSCRIPT_FUNC_BOOL_DECL(uint32_t);

     COUT_FUNC_BOOL_DECL();

     SVEC_BOOL_CLASS_METHOD_DECL();

 };


 template <>

 struct svec<LANES,int8_t> {

     int8_t v[LANES];


     FORCEINLINE svec() { }

     FORCEINLINE svec(int8_t a, int8_t b, int8_t c, int8_t d) {

       v[0] = a; v[1] = b; v[2] = c; v[3] = d;

     }

     FORCEINLINE svec( int8_t a) {

       v[0] = v[1] = v[2] = v[3] = a;

     }

     SUBSCRIPT_FUNC_DECL(int8_t);

     COUT_FUNC_CHAR_DECL(int8_t);


     VEC_CLASS_METHOD_DECL(int8_t);

     VEC_INT_CLASS_METHOD_DECL(int8_t, uint8_t);

 };


 template<>

 struct svec<LANES,uint8_t> {

     uint8_t v[LANES];

     FORCEINLINE svec() { }

     FORCEINLINE svec(uint8_t a, uint8_t b, uint8_t c, uint8_t d) {

       v[0] = a; v[1] = b; v[2] = c; v[3] = d;

     }

     FORCEINLINE svec(uint8_t a){

       v[0] = v[1] = v[2] = v[3] = a;

     }

     SUBSCRIPT_FUNC_DECL(uint8_t);

     COUT_FUNC_CHAR_DECL(uint8_t);


     VEC_CLASS_METHOD_DECL(uint8_t);

     VEC_INT_CLASS_METHOD_DECL(uint8_t, uint8_t);

 };


 template <>

 struct svec<LANES,int16_t> {

     int16_t v[LANES];

     FORCEINLINE svec() { }

     FORCEINLINE svec(int16_t a, int16_t b, int16_t c, int16_t d) {

       v[0] = a; v[1] = b; v[2] = c; v[3] = d;

     }

     FORCEINLINE svec( int16_t a) {

       v[0] = v[1] = v[2] = v[3] = a;

     }

     SUBSCRIPT_FUNC_DECL(int16_t);

     COUT_FUNC_DECL(int16_t);


     VEC_CLASS_METHOD_DECL(int16_t);

     VEC_INT_CLASS_METHOD_DECL(int16_t, uint16_t);


 };


 template <>

 struct svec<LANES,uint16_t> {

     uint16_t v[LANES];

     FORCEINLINE svec() { }

     FORCEINLINE svec(uint16_t a, uint16_t b, uint16_t c, uint16_t d) {

       v[0] = a; v[1] = b; v[2] = c; v[3] = d;

     }

     FORCEINLINE svec( uint16_t a) {

       v[0] = v[1] = v[2] = v[3] = a;

     }

     SUBSCRIPT_FUNC_DECL(uint16_t);

     COUT_FUNC_DECL(uint16_t);


     VEC_CLASS_METHOD_DECL(uint16_t);

     VEC_INT_CLASS_METHOD_DECL(uint16_t, uint16_t);


 };


 template <>

 struct svec<LANES,int32_t> {

     int32_t v[LANES];

     FORCEINLINE svec() { }

     FORCEINLINE svec(int a, int b, int c, int d) {

       v[0] = a; v[1] = b; v[2] = c; v[3] = d;

     }

     FORCEINLINE svec(int32_t a) {

       v[0] = v[1] = v[2] = v[3] = a;

     }

     SUBSCRIPT_FUNC_DECL(int32_t);

     COUT_FUNC_DECL(int32_t);


     VEC_CLASS_METHOD_DECL(int32_t);

     VEC_INT_CLASS_METHOD_DECL(int32_t, uint32_t);


 };


 template <>

 struct svec<LANES,uint32_t> {

    uint32_t v[LANES];

     FORCEINLINE svec() { }

     FORCEINLINE svec(uint32_t a, uint32_t b, uint32_t c, uint32_t d) {

       v[0] = a; v[1] = b; v[2] = c; v[3] = d;

     }

     FORCEINLINE svec( uint32_t a) {

       v[0] = v[1] = v[2] = v[3] = a;

     }

     SUBSCRIPT_FUNC_DECL(uint32_t);

     COUT_FUNC_DECL(uint32_t);


     VEC_CLASS_METHOD_DECL(uint32_t);

     VEC_INT_CLASS_METHOD_DECL(uint32_t, uint32_t);

 };


 template <>

 struct svec<LANES,int64_t> {

     int64_t v[LANES];

     FORCEINLINE svec() { }

     FORCEINLINE svec(int64_t a, int64_t b, int64_t c, int64_t d) {

       v[0] = a; v[1] = b; v[2] = c; v[3] = d;

     }

     FORCEINLINE svec( int64_t a) {

       v[0] = v[1] = v[2] = v[3] = a;

     }

     SUBSCRIPT_FUNC_DECL(int64_t);

     COUT_FUNC_DECL(int64_t);


     VEC_CLASS_METHOD_DECL(int64_t);

     VEC_INT_CLASS_METHOD_DECL(int64_t, uint64_t);

 };


 template <>

 struct svec<LANES,uint64_t> {

     uint64_t v[LANES];

     FORCEINLINE svec() { }

     FORCEINLINE svec(uint64_t a, uint64_t b, uint64_t c, uint64_t d) {

       v[0] = a; v[1] = b; v[2] = c; v[3] = d;

     }

     FORCEINLINE svec( uint64_t a) {

       v[0] = v[1] = v[2] = v[3] = a;

     }

     SUBSCRIPT_FUNC_DECL(uint64_t);

     COUT_FUNC_DECL(uint64_t);


     VEC_CLASS_METHOD_DECL(uint64_t);

     VEC_INT_CLASS_METHOD_DECL(uint64_t, uint64_t);

 };


 template<>

 struct svec<LANES,float> {

     float v[LANES];

     FORCEINLINE svec() { }

     FORCEINLINE svec(float a, float b, float c, float d) {

       v[0] = a; v[1] = b; v[2] = c; v[3] = d;

     }

     FORCEINLINE svec( float a) {

       v[0] = v[1] = v[2] = v[3] = a;

     }

     SUBSCRIPT_FUNC_DECL(float);

     COUT_FUNC_DECL(float);


     VEC_CLASS_METHOD_DECL(float);

     VEC_FLOAT_CLASS_METHOD_DECL(float);

 };


 template<>

 struct svec<LANES,double> {

     double v[LANES];

     FORCEINLINE svec() { }

     FORCEINLINE svec(double a, double b, double c, double d) {

       v[0] = a; v[1] = b; v[2] = c; v[3] = d;

     }

     FORCEINLINE svec( double a) {

       v[0] = v[1] = v[2] = v[3] = a;

     }

     SUBSCRIPT_FUNC_DECL(double);

     COUT_FUNC_DECL(double);


     VEC_CLASS_METHOD_DECL(double);

     VEC_FLOAT_CLASS_METHOD_DECL(double);

 };


 //

 // Data operation interfaces

 //


 //

 //

 //i1 use different approach

 static FORCEINLINE uint32_t svec_extract(svec<LANES,bool> v, int index) {

   return (v.v & (1 << index)) ? -1 : 0;

 }

 static FORCEINLINE void svec_insert(svec<LANES,bool> *v, int index, uint32_t val) {

   if(!val) {

     v->v &= ~(1 << index);

   } else {

     v->v |= (1 << index);

   }

 }

 INSERT_EXTRACT(int8_t);

 INSERT_EXTRACT(uint8_t);

 INSERT_EXTRACT(int16_t);

 INSERT_EXTRACT(uint16_t);

 INSERT_EXTRACT(int32_t);

 INSERT_EXTRACT(uint32_t);

 INSERT_EXTRACT(int64_t);

 INSERT_EXTRACT(uint64_t);

 INSERT_EXTRACT(float);

 INSERT_EXTRACT(double);


 // 1. Load / Store

 LOAD_STORE(bool);

 LOAD_STORE(int8_t);

 LOAD_STORE(uint8_t);

 LOAD_STORE(int16_t);

 LOAD_STORE(uint16_t);

 LOAD_STORE(int32_t);

 LOAD_STORE(uint32_t);

 LOAD_STORE(int64_t);

 LOAD_STORE(uint64_t);

 LOAD_STORE(float);

 LOAD_STORE(double);


 // 3. Select

 static FORCEINLINE svec<LANES,bool> svec_select(svec<LANES,bool> mask, svec<LANES,bool> a, svec<LANES,bool> b) {

   svec<LANES,bool> ret;

   ret.v = (a.v & mask.v) | (b.v & ~mask.v);

   return ret;

 }

 SELECT(int8_t);

 SELECT(uint8_t);

 SELECT(int16_t);

 SELECT(uint16_t);

 SELECT(int32_t);

 SELECT(uint32_t);

 SELECT(int64_t);

 SELECT(uint64_t);

 SELECT(float);

 SELECT(double);


 SELECT_BOOLCOND(bool);

 SELECT_BOOLCOND(int8_t);

 SELECT_BOOLCOND(uint8_t);

 SELECT_BOOLCOND(int16_t);

 SELECT_BOOLCOND(uint16_t);

 SELECT_BOOLCOND(int32_t);

 SELECT_BOOLCOND(uint32_t);

 SELECT_BOOLCOND(int64_t);

 SELECT_BOOLCOND(uint64_t);

 SELECT_BOOLCOND(float);

 SELECT_BOOLCOND(double);


 // 4. broadcast/rotate/shuffle/smear/setzero

 BROADCAST(int8_t);

 BROADCAST(uint8_t);

 BROADCAST(int16_t);

 BROADCAST(uint16_t);

 BROADCAST(int32_t);

 BROADCAST(uint32_t);

 BROADCAST(int64_t);

 BROADCAST(uint64_t);

 BROADCAST(float);

 BROADCAST(double);


 ROTATE(int8_t);

 ROTATE(uint8_t);

 ROTATE(int16_t);

 ROTATE(uint16_t);

 ROTATE(int32_t);

 ROTATE(uint32_t);

 ROTATE(int64_t);

 ROTATE(uint64_t);

 ROTATE(float);

 ROTATE(double);


 SHUFFLES(int8_t);

 SHUFFLES(uint8_t);

 SHUFFLES(int16_t);

 SHUFFLES(uint16_t);

 SHUFFLES(int32_t);

 SHUFFLES(uint32_t);

 SHUFFLES(int64_t);

 SHUFFLES(uint64_t);

 SHUFFLES(float);

 SHUFFLES(double);


 //load const

 LOAD_CONST(int8_t);

 LOAD_CONST(uint8_t);

 LOAD_CONST(int16_t);

 LOAD_CONST(uint16_t);

 LOAD_CONST(int32_t);

 LOAD_CONST(uint32_t);

 LOAD_CONST(int64_t);

 LOAD_CONST(uint64_t);

 LOAD_CONST(float);

 LOAD_CONST(double);


 // 5. Gather / Scatter

 #if defined(__x86_64__) || defined(__PPC64__)

 template<>

 struct svec<LANES,void*> : public svec<LANES,uint64_t>{

     FORCEINLINE svec(void* p0, void* p1, void* p2, void* p3):

     svec<LANES,uint64_t>((uint64_t)(p0),(uint64_t)(p1),(uint64_t)(p2),(uint64_t)(p3)){}

 };

 #else // 32-bit

 template<>

   struct svec<LANES,void*>: public svec<LANES,uint32_t>{

     FORCEINLINE svec(void* p0, void* p1, void* p2, void* p3):

     svec<LANES,uint32_t>((uint32_t)(p0),(uint32_t)(p1),(uint32_t)(p2),(uint32_t)(p3)){}

 };

 #endif // __PPC64__


 #ifndef DOXYGEN_SHOULD_SKIP_THIS //not want generate svec_gather*/svec_scatter methods


 template <class RetVecType> static RetVecType svec_gather(svec<LANES, uint32_t> ptrs, svec<LANES,bool> mask);

 template <class RetVecType> static RetVecType svec_gather(svec<LANES, uint64_t> ptrs, svec<LANES,bool> mask);


 GATHER_GENERAL(int8_t, uint32_t);

 GATHER_GENERAL(int8_t, uint64_t);

 GATHER_GENERAL(uint8_t, uint32_t);

 GATHER_GENERAL(uint8_t, uint64_t);

 GATHER_GENERAL(int16_t, uint32_t);

 GATHER_GENERAL(int16_t, uint64_t);

 GATHER_GENERAL(uint16_t, uint32_t);

 GATHER_GENERAL(uint16_t, uint64_t);

 GATHER_GENERAL(int32_t, uint32_t);

 GATHER_GENERAL(int32_t, uint64_t);

 GATHER_GENERAL(uint32_t, uint32_t);

 GATHER_GENERAL(uint32_t, uint64_t);

 GATHER_GENERAL(int64_t, uint32_t);

 GATHER_GENERAL(int64_t, uint64_t);

 GATHER_GENERAL(uint64_t, uint32_t);

 GATHER_GENERAL(uint64_t, uint64_t);

 GATHER_GENERAL(float, uint32_t);

 GATHER_GENERAL(float, uint64_t);

 GATHER_GENERAL(double, uint32_t);

 GATHER_GENERAL(double, uint64_t);


 GATHER_BASE_OFFSETS(int8_t, int32_t);

 GATHER_BASE_OFFSETS(int8_t, int64_t);

 GATHER_BASE_OFFSETS(uint8_t, int32_t);

 GATHER_BASE_OFFSETS(uint8_t, int64_t);

 GATHER_BASE_OFFSETS(int16_t, int32_t);

 GATHER_BASE_OFFSETS(int16_t, int64_t);

 GATHER_BASE_OFFSETS(uint16_t, int32_t);

 GATHER_BASE_OFFSETS(uint16_t, int64_t);

 GATHER_BASE_OFFSETS(int32_t, int32_t);

 GATHER_BASE_OFFSETS(int32_t, int64_t);

 GATHER_BASE_OFFSETS(uint32_t, int32_t);

 GATHER_BASE_OFFSETS(uint32_t, int64_t);

 GATHER_BASE_OFFSETS(int64_t, int32_t);

 GATHER_BASE_OFFSETS(int64_t, int64_t);

 GATHER_BASE_OFFSETS(uint64_t, int32_t);

 GATHER_BASE_OFFSETS(uint64_t, int64_t);

 GATHER_BASE_OFFSETS(float, int32_t);

 GATHER_BASE_OFFSETS(float, int64_t);

 GATHER_BASE_OFFSETS(double, int32_t);

 GATHER_BASE_OFFSETS(double, int64_t);


 GATHER_STRIDE(int8_t, int32_t);

 GATHER_STRIDE(int8_t, int64_t);

 GATHER_STRIDE(uint8_t, int32_t);

 GATHER_STRIDE(uint8_t, int64_t);

 GATHER_STRIDE(int16_t, int32_t);

 GATHER_STRIDE(int16_t, int64_t);

 GATHER_STRIDE(uint16_t, int32_t);

 GATHER_STRIDE(uint16_t, int64_t);

 GATHER_STRIDE(int32_t, int32_t);

 GATHER_STRIDE(int32_t, int64_t);

 GATHER_STRIDE(uint32_t, int32_t);

 GATHER_STRIDE(uint32_t, int64_t);

 GATHER_STRIDE(int64_t, int32_t);

 GATHER_STRIDE(int64_t, int64_t);

 GATHER_STRIDE(uint64_t, int32_t);

 GATHER_STRIDE(uint64_t, int64_t);

 GATHER_STRIDE(float, int32_t);

 GATHER_STRIDE(float, int64_t);

 GATHER_STRIDE(double, int32_t);

 GATHER_STRIDE(double, int64_t);


 SCATTER_GENERAL(int8_t, uint32_t);

 SCATTER_GENERAL(int8_t, uint64_t);

 SCATTER_GENERAL(uint8_t, uint32_t);

 SCATTER_GENERAL(uint8_t, uint64_t);

 SCATTER_GENERAL(int16_t, uint32_t);

 SCATTER_GENERAL(int16_t, uint64_t);

 SCATTER_GENERAL(uint16_t, uint32_t);

 SCATTER_GENERAL(uint16_t, uint64_t);

 SCATTER_GENERAL(int32_t, uint32_t);

 SCATTER_GENERAL(int32_t, uint64_t);

 SCATTER_GENERAL(uint32_t, uint32_t);

 SCATTER_GENERAL(uint32_t, uint64_t);

 SCATTER_GENERAL(int64_t, uint32_t);

 SCATTER_GENERAL(int64_t, uint64_t);

 SCATTER_GENERAL(uint64_t, uint32_t);

 SCATTER_GENERAL(uint64_t, uint64_t);

 SCATTER_GENERAL(float, uint32_t);

 SCATTER_GENERAL(float, uint64_t);

 SCATTER_GENERAL(double, uint32_t);

 SCATTER_GENERAL(double, uint64_t);


 SCATTER_BASE_OFFSETS(int8_t, int32_t);

 SCATTER_BASE_OFFSETS(int8_t, int64_t);

 SCATTER_BASE_OFFSETS(uint8_t, int32_t);

 SCATTER_BASE_OFFSETS(uint8_t, int64_t);

 SCATTER_BASE_OFFSETS(int16_t, int32_t);

 SCATTER_BASE_OFFSETS(int16_t, int64_t);

 SCATTER_BASE_OFFSETS(uint16_t, int32_t);

 SCATTER_BASE_OFFSETS(uint16_t, int64_t);

 SCATTER_BASE_OFFSETS(int32_t, int32_t);

 SCATTER_BASE_OFFSETS(int32_t, int64_t);

 SCATTER_BASE_OFFSETS(uint32_t, int32_t);

 SCATTER_BASE_OFFSETS(uint32_t, int64_t);

 SCATTER_BASE_OFFSETS(int64_t, int32_t);

 SCATTER_BASE_OFFSETS(int64_t, int64_t);

 SCATTER_BASE_OFFSETS(uint64_t, int32_t);

 SCATTER_BASE_OFFSETS(uint64_t, int64_t);

 SCATTER_BASE_OFFSETS(float, int32_t);

 SCATTER_BASE_OFFSETS(float, int64_t);

 SCATTER_BASE_OFFSETS(double, int32_t);

 SCATTER_BASE_OFFSETS(double, int64_t);


 SCATTER_STRIDE(int8_t, int32_t);

 SCATTER_STRIDE(int8_t, int64_t);

 SCATTER_STRIDE(uint8_t, int32_t);

 SCATTER_STRIDE(uint8_t, int64_t);

 SCATTER_STRIDE(int16_t, int32_t);

 SCATTER_STRIDE(int16_t, int64_t);

 SCATTER_STRIDE(uint16_t, int32_t);

 SCATTER_STRIDE(uint16_t, int64_t);

 SCATTER_STRIDE(int32_t, int32_t);

 SCATTER_STRIDE(int32_t, int64_t);

 SCATTER_STRIDE(uint32_t, int32_t);

 SCATTER_STRIDE(uint32_t, int64_t);

 SCATTER_STRIDE(int64_t, int32_t);

 SCATTER_STRIDE(int64_t, int64_t);

 SCATTER_STRIDE(uint64_t, int32_t);

 SCATTER_STRIDE(uint64_t, int64_t);

 SCATTER_STRIDE(float, int32_t);

 SCATTER_STRIDE(float, int64_t);

 SCATTER_STRIDE(double, int32_t);

 SCATTER_STRIDE(double, int64_t);


 #endif //DOXYGEN_SHOULD_SKIP_THIS


 //  5. masked load/masked store


 //Masked load/store is implemented based on gather_base_offsets/scatter_base_offsets

 //Here we only use offsets with 32bit


 MASKED_LOAD_STORE_L4(int8_t);

 MASKED_LOAD_STORE_L4(uint8_t);

 MASKED_LOAD_STORE_L4(int16_t);

 MASKED_LOAD_STORE_L4(uint16_t);

 MASKED_LOAD_STORE_L4(int32_t);

 MASKED_LOAD_STORE_L4(uint32_t);

 MASKED_LOAD_STORE_L4(int64_t);

 MASKED_LOAD_STORE_L4(uint64_t);

 MASKED_LOAD_STORE_L4(float);

 MASKED_LOAD_STORE_L4(double);


 //

 // Mask type (i1) interfaces

 //


 // 1. mask construction

 static FORCEINLINE bool svec_any_true(const svec<LANES,bool>& mask) {

   return (mask.v != 0);

 }


 static FORCEINLINE bool svec_all_true(const svec<LANES,bool>& mask) {

   return (mask.v & 0xF) == 0xF;

 }


 static FORCEINLINE bool svec_none_true(const svec<LANES,bool>& mask) {

   return (mask.v == 0);

 }


 // 2. bit operations


 static FORCEINLINE svec<LANES,bool> svec_and(svec<LANES,bool> a, svec<LANES,bool> b) {

   svec<LANES,bool> ret;

   ret.v = a.v & b.v;

   return ret;

 }


 static FORCEINLINE svec<LANES,bool> svec_or(svec<LANES,bool> a, svec<LANES,bool> b) {

   svec<LANES,bool> ret;

   ret.v = a.v | b.v;

   return ret;

 }


 static FORCEINLINE svec<LANES,bool> svec_xor(svec<LANES,bool> a, svec<LANES,bool> b) {

   svec<LANES,bool> ret;

   ret.v = a.v ^ b.v;

   return ret;

 }


 static FORCEINLINE svec<LANES,bool> svec_not(svec<LANES,bool> a) {

   svec<LANES,bool> ret;

   ret.v = ~a.v;

   return ret;

 }


 static FORCEINLINE uint64_t svec_movmsk(svec<LANES,bool> mask) {

   return (uint64_t)(mask.v);

 }


 //

 // General data operation interfaces

 //

 // 1. Unary


 // neg operation

 UNARY_OP(int8_t, svec_neg, -);

 UNARY_OP(uint8_t, svec_neg, -);

 UNARY_OP(int16_t, svec_neg, -);

 UNARY_OP(uint16_t, svec_neg, -);

 UNARY_OP(int32_t, svec_neg, -);

 UNARY_OP(uint32_t, svec_neg, -);

 UNARY_OP(int64_t, svec_neg, -);

 UNARY_OP(uint64_t, svec_neg, -);

 UNARY_OP(float, svec_neg, -);

 UNARY_OP(double, svec_neg, -);


 //  2. Math unary

 //round

 UNARY_OP(float, svec_round, roundf);

 UNARY_OP(double, svec_round, round);

 //floor

 UNARY_OP(float, svec_floor, floorf);

 UNARY_OP(double, svec_floor, floor);

 //ceil

 UNARY_OP(float, svec_ceil, ceilf);

 UNARY_OP(double, svec_ceil, ceil);

 //reverse 1/

 UNARY_OP(float, svec_rcp, 1.0/);

 UNARY_OP(double, svec_rcp, 1.0/);

 //reverse sqrt

 UNARY_OP(float, svec_rsqrt, 1.0/sqrtf);

 UNARY_OP(double, svec_rsqrt, 1.0/sqrt);

 //sqrt

 UNARY_OP(float, svec_sqrt, sqrtf);

 UNARY_OP(double, svec_sqrt, sqrt);

 //exp

 UNARY_OP(float, svec_exp, expf);

 UNARY_OP(double, svec_exp, exp);

 //log

 UNARY_OP(float, svec_log, logf);

 UNARY_OP(double, svec_log, log);

 //abs - for all types

 UNARY_OP(int8_t, svec_abs, abs<int8_t>);

 static FORCEINLINE svec<LANES,uint8_t>  svec_abs(svec<LANES,uint8_t> v) { return v;}

 UNARY_OP(int16_t, svec_abs, abs<int16_t>);

 static FORCEINLINE svec<LANES,uint16_t>  svec_abs(svec<LANES,uint16_t> v) { return v;}

 UNARY_OP(int32_t, svec_abs, abs<int32_t>);

 static FORCEINLINE svec<LANES,uint32_t>  svec_abs(svec<LANES,uint32_t> v) { return v;}

 UNARY_OP(int64_t, svec_abs, abs<int64_t>);

 static FORCEINLINE svec<LANES,uint64_t>  svec_abs(svec<LANES,uint64_t> v) { return v;}

 UNARY_OP(float, svec_abs, abs);

 UNARY_OP(double, svec_abs, abs);


 //  3. Binary


 //add, sub, div, mul.

 #define BINARY_OP_METHODS(STYPE) \

 BINARY_OP(STYPE, svec_add, +); \

 BINARY_OP(STYPE, svec_sub, -); \

 BINARY_OP(STYPE, svec_mul, *); \

 BINARY_OP(STYPE, svec_div, /); \

 BINARY_OP_SCALAR(STYPE, svec_add_scalar, +); \

 BINARY_SCALAR_OP(STYPE, svec_scalar_add, +); \

 BINARY_OP_SCALAR(STYPE, svec_sub_scalar, -); \

 BINARY_SCALAR_OP(STYPE, svec_scalar_sub, -); \

 BINARY_OP_SCALAR(STYPE, svec_mul_scalar, *); \

 BINARY_SCALAR_OP(STYPE, svec_scalar_mul, *); \

 BINARY_OP_SCALAR(STYPE, svec_div_scalar, /); \

 BINARY_SCALAR_OP(STYPE, svec_scalar_div, /); \


 #define INT_BINARY_OP_METHODS(STYPE) \

 BINARY_OP(STYPE, svec_or, |); \

 BINARY_OP(STYPE, svec_and, &); \

 BINARY_OP(STYPE, svec_xor, ^); \

 BINARY_SHT_SCALAR(STYPE, int32_t, svec_shl, <<); \

 BINARY_SHT_SCALAR(STYPE, int32_t, svec_shr, >>); \

 BINARY_OP(STYPE, svec_rem, %); \

 BINARY_OP_SCALAR(STYPE, svec_rem, %);


 BINARY_OP_METHODS(int8_t);

 BINARY_OP_METHODS(uint8_t);

 BINARY_OP_METHODS(int16_t);

 BINARY_OP_METHODS(uint16_t);

 BINARY_OP_METHODS(int32_t);

 BINARY_OP_METHODS(uint32_t);

 BINARY_OP_METHODS(int64_t);

 BINARY_OP_METHODS(uint64_t);

 BINARY_OP_METHODS(float);

 BINARY_OP_METHODS(double);


 INT_BINARY_OP_METHODS(int8_t);

 INT_BINARY_OP_METHODS(uint8_t);

 INT_BINARY_OP_METHODS(int16_t);

 INT_BINARY_OP_METHODS(uint16_t);

 INT_BINARY_OP_METHODS(int32_t);

 INT_BINARY_OP_METHODS(uint32_t);

 INT_BINARY_OP_METHODS(int64_t);

 INT_BINARY_OP_METHODS(uint64_t);


 //power only for float

 BINARY_OP_FUNC(float, svec_pow, powf);

 BINARY_OP_FUNC(double, svec_pow, pow);


 //shift left

 BINARY_OP2(int8_t, uint8_t, svec_shl, <<);

 BINARY_OP2(uint8_t, uint8_t, svec_shl, <<);

 BINARY_OP2(int16_t, uint16_t, svec_shl, <<);

 BINARY_OP2(uint16_t, uint16_t, svec_shl, <<);

 BINARY_OP2(int32_t, uint32_t, svec_shl, <<);

 BINARY_OP2(uint32_t, uint32_t, svec_shl, <<);

 BINARY_OP2(int64_t, uint64_t, svec_shl, <<);

 BINARY_OP2(uint64_t, uint64_t, svec_shl, <<);


 //shift right

 BINARY_OP2(int8_t, uint8_t, svec_shr, >>);

 BINARY_OP2(uint8_t, uint8_t, svec_shr, >>);

 BINARY_OP2(int16_t, uint16_t, svec_shr, >>);

 BINARY_OP2(uint16_t, uint16_t, svec_shr, >>);

 BINARY_OP2(int32_t, uint32_t, svec_shr, >>);

 BINARY_OP2(uint32_t, uint32_t, svec_shr, >>);

 BINARY_OP2(int64_t, uint64_t, svec_shr, >>);

 BINARY_OP2(uint64_t, uint64_t, svec_shr, >>);


 //  4. Ternary


 //madd / msub for only int32/u32/float/double

 TERNERY(int32_t);

 TERNERY(uint32_t);

 TERNERY(int64_t);

 TERNERY(uint64_t);

 TERNERY(float);

 TERNERY(double);


 //  5. Max/Min & 6. Reduce

 #define MAX_MIN_REDUCE_METHODS(STYPE) \

 BINARY_OP_FUNC(STYPE, svec_max, max<STYPE>); \

 BINARY_OP_FUNC(STYPE, svec_min, min<STYPE>); \

 BINARY_OP_REDUCE_FUNC(STYPE, svec_reduce_add, add<STYPE>); \

 BINARY_OP_REDUCE_FUNC(STYPE, svec_reduce_max, max<STYPE>); \

 BINARY_OP_REDUCE_FUNC(STYPE, svec_reduce_min, min<STYPE>); \


 MAX_MIN_REDUCE_METHODS(int8_t);

 MAX_MIN_REDUCE_METHODS(uint8_t);

 MAX_MIN_REDUCE_METHODS(int16_t);

 MAX_MIN_REDUCE_METHODS(uint16_t);

 MAX_MIN_REDUCE_METHODS(int32_t);

 MAX_MIN_REDUCE_METHODS(uint32_t);

 MAX_MIN_REDUCE_METHODS(int64_t);

 MAX_MIN_REDUCE_METHODS(uint64_t);

 MAX_MIN_REDUCE_METHODS(float);

 MAX_MIN_REDUCE_METHODS(double);


 FORCEINLINE svec<LANES,float> svec_preduce_add(svec<LANES,float> v0, svec<LANES,float> v1, svec<LANES,float> v2, svec<LANES,float> v3) {

   return svec<LANES,float>(

       svec_reduce_add(v0),

       svec_reduce_add(v1),

       svec_reduce_add(v2),

       svec_reduce_add(v3)

       );

 }


 FORCEINLINE svec<LANES,double> svec_preduce_add(svec<LANES,double> v0, svec<LANES,double> v1, svec<LANES,double> v2, svec<LANES,double> v3) {

   return svec<LANES,double>(

       svec_reduce_add(v0),

       svec_reduce_add(v1),

       svec_reduce_add(v2),

       svec_reduce_add(v3)

       );

 }


 //  7. Compare

 CMP_ALL_OP(int8_t);

 CMP_ALL_OP(uint8_t);

 CMP_ALL_OP(int16_t);

 CMP_ALL_OP(uint16_t);

 CMP_ALL_OP(int32_t);

 CMP_ALL_OP(uint32_t);

 CMP_ALL_OP(int64_t);

 CMP_ALL_OP(uint64_t);

 CMP_ALL_OP(float);

 CMP_ALL_OP(double);


 CMP_OP(bool, equal, ==);

 CMP_OP(bool, not_equal, !=);


 //  8. Cast


 //i1 -> all

 //CAST(bool, uint32_t);

 CAST(bool, int8_t);  //better way: packing

 CAST(bool, uint8_t);  //better way: packing

 CAST(bool, int16_t);  //better way: packing

 CAST(bool, uint16_t); //better way: packing

 CAST(bool, int32_t);

 CAST(bool, uint32_t);

 CAST(bool, int64_t); //better way: unpack, singed ext

 CAST(bool, uint64_t);//better way: unpack, singed ext

 CAST(bool, float); //si to fp call

 CAST(bool, double);


 //i8 -> all

 CAST(int8_t, bool);

 //CAST(int8_t, int8_t);

 CAST(int8_t, uint8_t);

 CAST(int8_t, int16_t); //better way, use vec_unpackh

 CAST(int8_t, uint16_t); //better way, sext + zero mask and

 CAST(int8_t, int32_t); //better way, use twice vec_unpack

 CAST(int8_t, uint32_t); //better way, use unpack + zero mask

 CAST(int8_t, int64_t);

 CAST(int8_t, uint64_t);

 CAST(int8_t, float);

 CAST(int8_t, double);


 //u8 -> all

 CAST(uint8_t, bool);

 CAST(uint8_t, int8_t);

 //CAST(uint8_t, uint8_t);

 CAST(uint8_t, int16_t); //better way, use unpack + zero mask

 CAST(uint8_t, uint16_t); //better way use unpack + zero mask

 CAST(uint8_t, int32_t);

 CAST(uint8_t, uint32_t);

 CAST(uint8_t, int64_t);

 CAST(uint8_t, uint64_t);

 CAST(uint8_t, float);

 CAST(uint8_t, double);


 //i16 -> all

 CAST(int16_t, bool);

 CAST(int16_t, int8_t); //could use pack

 CAST(int16_t, uint8_t); //could use pack

 //CAST(int16_t, int16_t);

 CAST(int16_t, uint16_t);

 CAST(int16_t, int32_t); //use unpack

 CAST(int16_t, uint32_t); //use unpack and zeromaskout

 CAST(int16_t, int64_t);

 CAST(int16_t, uint64_t);

 CAST(int16_t, float);

 CAST(int16_t, double);


 //u16 -> all

 CAST(uint16_t, bool);

 CAST(uint16_t, int8_t);

 CAST(uint16_t, uint8_t);

 CAST(uint16_t, int16_t);

 //CAST(uint16_t, uint16_t);

 CAST(uint16_t, int32_t); //use unpack +mask

 CAST(uint16_t, uint32_t); //use unpack + mask

 CAST(uint16_t, int64_t);

 CAST(uint16_t, uint64_t);

 CAST(uint16_t, float);

 CAST(uint16_t, double);


 //i32 -> all

 CAST(int32_t, bool);

 CAST(int32_t, int8_t);

 CAST(int32_t, uint8_t);

 CAST(int32_t, int16_t);

 CAST(int32_t, uint16_t);

 //CAST(int32_t, int32_t);

 CAST(int32_t, uint32_t);

 CAST(int32_t, int64_t); //use p8 unpack

 CAST(int32_t, uint64_t); //use p8 unpack

 CAST(int32_t, float); //use ctf

 CAST(int32_t, double);


 //u32 -> all

 CAST(uint32_t, bool);

 CAST(uint32_t, int8_t);

 CAST(uint32_t, uint8_t);

 CAST(uint32_t, int16_t);

 CAST(uint32_t, uint16_t);

 CAST(uint32_t, int32_t);

 //CAST(uint32_t, uint32_t);

 CAST(uint32_t, int64_t); //use p8 unpack

 CAST(uint32_t, uint64_t); //use p8 unpack

 CAST(uint32_t, float);

 CAST(uint32_t, double);


 //i64-> all

 CAST(int64_t, bool);

 CAST(int64_t, int8_t);

 CAST(int64_t, uint8_t);

 CAST(int64_t, int16_t);

 CAST(int64_t, uint16_t);

 CAST(int64_t, int32_t); //use p8 trunk

 CAST(int64_t, uint32_t); //use p8 trunk

 //CAST(int64_t, int64_t);

 CAST(int64_t, uint64_t);

 CAST(int64_t, float);

 CAST(int64_t, double);


 //u64 -> all

 CAST(uint64_t, bool);

 CAST(uint64_t, int8_t);

 CAST(uint64_t, uint8_t);

 CAST(uint64_t, int16_t);

 CAST(uint64_t, uint16_t);

 CAST(uint64_t, int32_t); //use p8 pack

 CAST(uint64_t, uint32_t); //use p8 pack

 CAST(uint64_t, int64_t);

 //CAST(uint64_t, uint64_t);

 CAST(uint64_t, float);

 CAST(uint64_t, double);


 //float -> all

 CAST(float, bool);

 CAST(float, int8_t); //use cts + pack+pack

 CAST(float, uint8_t); //use ctu + pack + pack

 CAST(float, int16_t); //use cts + pack

 CAST(float, uint16_t); //use ctu + pack

 CAST(float, int32_t);//use cts

 CAST(float, uint32_t); //use ctu

 CAST(float, int64_t);

 CAST(float, uint64_t);

 //CAST(float, float);

 CAST(float, double);


 //double -> all

 CAST(double, bool);

 CAST(double, int8_t);

 CAST(double, uint8_t);

 CAST(double, int16_t);

 CAST(double, uint16_t);

 CAST(double, int32_t);

 CAST(double, uint32_t);

 CAST(double, int64_t);

 CAST(double, uint64_t);

 CAST(double, float);

 //CAST(double, double);


 CAST_BITS(int32_t, i32, float, f);

 CAST_BITS(uint32_t, u32, float, f);

 CAST_BITS(float, f, int32_t, i32);

 CAST_BITS(float, f, uint32_t, u32);


 CAST_BITS(int64_t, i64, double, d);

 CAST_BITS(uint64_t, u64, double, d);

 CAST_BITS(double, d, int64_t, i64);

 CAST_BITS(double, d, uint64_t, u64);


 //

 // Class operations based on the above interfaces

 //


 //add the impl of i1's

 FORCEINLINE void svec<LANES,bool>::Helper::operator=(uint32_t value) {

   svec_insert(m_self, m_index, value);

 }

 FORCEINLINE void svec<LANES,bool>::Helper::operator=(svec<LANES,bool>::Helper helper) {

   svec_insert(m_self, m_index, helper.operator uint32_t());

 }

 FORCEINLINE svec<LANES,bool>::Helper::operator uint32_t() const {

   return svec_extract(*m_self, m_index);

 }

 const FORCEINLINE uint32_t svec<LANES,bool>::operator[](int index) const {

   return svec_extract(*this, index);

 }

 SUBSCRIPT_FUNC_IMPL(int8_t);

 SUBSCRIPT_FUNC_IMPL(uint8_t);

 SUBSCRIPT_FUNC_IMPL(int16_t);

 SUBSCRIPT_FUNC_IMPL(uint16_t);

 SUBSCRIPT_FUNC_IMPL(int32_t);

 SUBSCRIPT_FUNC_IMPL(uint32_t);

 SUBSCRIPT_FUNC_IMPL(int64_t);

 SUBSCRIPT_FUNC_IMPL(uint64_t);

 SUBSCRIPT_FUNC_IMPL(float);

 SUBSCRIPT_FUNC_IMPL(double);


 FORCEINLINE bool svec<LANES,bool>::any_true() { return svec_any_true(*this); }


 FORCEINLINE bool svec<LANES,bool>::all_true() { return svec_all_true(*this); }


 FORCEINLINE bool svec<LANES,bool>::none_true() { return svec_none_true(*this); }


 FORCEINLINE svec<LANES,bool> svec<LANES,bool>::operator~() { return svec_not(*this); }


 FORCEINLINE svec<LANES,bool> svec<LANES,bool>::operator|(svec<LANES,bool> a) { return svec_or(*this, a); }

 FORCEINLINE svec<LANES,bool> svec<LANES,bool>::operator&(svec<LANES,bool> a) { return svec_and(*this, a); }

 FORCEINLINE svec<LANES,bool> svec<LANES,bool>::operator^(svec<LANES,bool> a) { return svec_xor(*this, a); }

 FORCEINLINE svec<LANES,bool> svec<LANES,bool>::operator!() { return svec_not(*this); }


 FORCEINLINE svec<LANES,bool> svec<LANES,bool>::operator&&(svec<LANES,bool> a) { return svec_and(*this, a); }

 FORCEINLINE svec<LANES,bool> svec<LANES,bool>::operator||(svec<LANES,bool> a) { return svec_or(*this, a); }

 FORCEINLINE svec<LANES,bool> svec<LANES,bool>::operator ==(svec<LANES,bool> a) {

     return svec_equal(*this, a);

 }


 FORCEINLINE svec<LANES,bool> svec<LANES,bool>::operator !=(svec<LANES,bool> a) {

     return svec_not_equal(*this, a);

 }


 VEC_CMP_IMPL(int8_t);

 VEC_CMP_IMPL(uint8_t);

 VEC_CMP_IMPL(int16_t);

 VEC_CMP_IMPL(uint16_t);

 VEC_CMP_IMPL(int32_t);

 VEC_CMP_IMPL(uint32_t);

 VEC_CMP_IMPL(int64_t);

 VEC_CMP_IMPL(uint64_t);

 VEC_CMP_IMPL(float);

 VEC_CMP_IMPL(double);


 MVEC_CLASS_METHOD_IMPL(bool);

 VEC_CLASS_METHOD_IMPL(int8_t);

 VEC_CLASS_METHOD_IMPL(uint8_t);

 VEC_CLASS_METHOD_IMPL(int16_t);

 VEC_CLASS_METHOD_IMPL(uint16_t);

 VEC_CLASS_METHOD_IMPL(int32_t);

 VEC_CLASS_METHOD_IMPL(uint32_t);

 VEC_CLASS_METHOD_IMPL(int64_t);

 VEC_CLASS_METHOD_IMPL(uint64_t);

 VEC_CLASS_METHOD_IMPL(float);

 VEC_CLASS_METHOD_IMPL(double);


 VEC_INT_CLASS_METHOD_IMPL(int8_t, uint8_t);

 VEC_INT_CLASS_METHOD_IMPL(uint8_t, uint8_t);

 VEC_INT_CLASS_METHOD_IMPL(int16_t, uint16_t);

 VEC_INT_CLASS_METHOD_IMPL(uint16_t, uint16_t);

 VEC_INT_CLASS_METHOD_IMPL(int32_t, uint32_t);

 VEC_INT_CLASS_METHOD_IMPL(uint32_t, uint32_t);

 VEC_INT_CLASS_METHOD_IMPL(int64_t, uint64_t);

 VEC_INT_CLASS_METHOD_IMPL(uint64_t, uint64_t);


 VEC_FLOAT_CLASS_METHOD_IMPL(float);

 VEC_FLOAT_CLASS_METHOD_IMPL(double);


 #undef LANES

 } //end of namespace generic

 #endif /* POWER_VSX4_H_ */


COUT_FUNC_BOOL_DECL
#define COUT_FUNC_BOOL_DECL()
Definition: gsimd_utility.h:266

generic::svec< 4, double >::svec
svec(double a)
Constructor.
Definition: generic4.h:543

generic::svec< 4, int8_t >::svec
svec(int8_t a)
Constructor.
Definition: generic4.h:206

MAX_MIN_REDUCE_METHODS
#define MAX_MIN_REDUCE_METHODS(STYPE)
Definition: generic4.h:1088

VEC_INT_CLASS_METHOD_DECL
#define VEC_INT_CLASS_METHOD_DECL(STYPE, USTYPE)
macros method definition for integer vector only Note: shift&#39;s operator can only be unsigned vector ...
Definition: gsimd_utility.h:379

generic::svec< 4, uint8_t >::svec
svec(uint8_t a, uint8_t b, uint8_t c, uint8_t d)
Constructor.
Definition: generic4.h:236

generic::svec< 4, void * >::svec
svec(void *p0, void *p1, void *p2, void *p3)
Constructor.
Definition: generic4.h:708

generic::svec< 4, bool >::svec
svec(uint32_t a, uint32_t b, uint32_t c, uint32_t d)
Constructor.
Definition: generic4.h:164

SCATTER_BASE_OFFSETS
#define SCATTER_BASE_OFFSETS(STYPE, OSTYPE)
Definition: gsimd_utility.h:765

generic::svec< 4, int64_t >::svec
svec(int64_t a, int64_t b, int64_t c, int64_t d)
Constructor.
Definition: generic4.h:424

CAST
#define CAST(SFROM, STO)
Definition: gsimd_utility.h:1112

generic::svec< 4, int32_t >::svec
svec(int32_t a)
Constructor.
Definition: generic4.h:357

generic::svec< 4, uint8_t >::svec
svec(uint8_t a)
Constructor.
Definition: generic4.h:244

generic::svec< 4, int64_t >::svec
svec(int64_t a)
Constructor.
Definition: generic4.h:432

LOAD_CONST
#define LOAD_CONST(STYPE)
Definition: gsimd_utility.h:562

VEC_FLOAT_CLASS_METHOD_DECL
#define VEC_FLOAT_CLASS_METHOD_DECL(STYPE)
Definition: gsimd_utility.h:393

VEC_CLASS_METHOD_DECL
#define VEC_CLASS_METHOD_DECL(STYPE)
macros for non-mask i8 - double types&#39;s method
Definition: gsimd_utility.h:350

INT_BINARY_OP_METHODS
#define INT_BINARY_OP_METHODS(STYPE)
Definition: generic4.h:1022

generic::svec< 4, float >::svec
svec(float a)
Constructor.
Definition: generic4.h:506

BINARY_OP_FUNC
#define BINARY_OP_FUNC(STYPE, NAME, FUNC)
Definition: gsimd_utility.h:869

generic::svec< 4, uint8_t >::svec
svec()
Default constructor.
Definition: generic4.h:231

vsx::svec_select
svec< 4, bool > svec_select(svec< 4, bool > mask, svec< 4, bool > a, svec< 4, bool > b)
construct c by selecting elements from two input vectors according to the mask
Definition: power_vsx4.h:1126

ROTATE
#define ROTATE(STYPE)
macro for rotate method implementation
Definition: gsimd_utility.h:496

TERNERY
#define TERNERY(STYPE)
Definition: gsimd_utility.h:958

generic::svec< 4, uint32_t >::svec
svec()
Default constructor.
Definition: generic4.h:382

SVEC_BOOL_CLASS_METHOD_DECL
#define SVEC_BOOL_CLASS_METHOD_DECL()
macros for svec&lt;N,bool&gt; class&#39;s class method
Definition: gsimd_utility.h:330

generic::svec< 4, int16_t >::svec
svec()
Default constructor.
Definition: generic4.h:268

generic::svec< 4, double >::svec
svec(double a, double b, double c, double d)
Constructor.
Definition: generic4.h:535

generic::svec< 4, uint32_t >::svec
svec(uint32_t a)
Constructor.
Definition: generic4.h:395

BROADCAST
#define BROADCAST(STYPE)
macro for broadcast method implementation All broadcast are slow implementation
Definition: gsimd_utility.h:472

COUT_FUNC_DECL
#define COUT_FUNC_DECL(STYPE)
Definition: gsimd_utility.h:283

BINARY_OP_METHODS
#define BINARY_OP_METHODS(STYPE)
Definition: generic4.h:1008

generic::svec< 4, float >::svec
svec(float a, float b, float c, float d)
Constructor.
Definition: generic4.h:498

generic::svec< 4, int64_t >::svec
svec()
Default constructor,.
Definition: generic4.h:419

generic::svec< 4, uint64_t >::svec
svec(uint64_t a, uint64_t b, uint64_t c, uint64_t d)
Constructor.
Definition: generic4.h:461

SUBSCRIPT_FUNC_IMPL
#define SUBSCRIPT_FUNC_IMPL(STYPE)
Definition: gsimd_utility.h:1160

VEC_CMP_IMPL
#define VEC_CMP_IMPL(STYPE)
Definition: gsimd_utility.h:1175

GATHER_GENERAL
#define GATHER_GENERAL(STYPE, PSTYPE)
slow implementation of gather general Must use template to specify the return type ...
Definition: gsimd_utility.h:602

generic::svec< 4, uint16_t >::svec
svec(uint16_t a)
Constructor.
Definition: generic4.h:319

SUBSCRIPT_FUNC_DECL
#define SUBSCRIPT_FUNC_DECL(STYPE)
macros to define a intrinsic based subscript opertor
Definition: gsimd_utility.h:247

generic::svec
Definition: generic.h:57

generic::svec_preduce_add
svec< 4,float > svec_preduce_add(svec< 4, float > v0, svec< 4, float > v1, svec< 4, float > v2, svec< 4, float > v3)
Definition: generic4.h:1106

MVEC_CLASS_METHOD_IMPL
#define MVEC_CLASS_METHOD_IMPL(STYPE)
mask class&#39;s class method impl
Definition: gsimd_utility.h:1285

SUBSCRIPT_FUNC_BOOL_DECL
#define SUBSCRIPT_FUNC_BOOL_DECL(STYPE)
Definition: gsimd_utility.h:251

VEC_CLASS_METHOD_IMPL
#define VEC_CLASS_METHOD_IMPL(STYPE)
Definition: gsimd_utility.h:1301

MASKED_LOAD_STORE_L4
#define MASKED_LOAD_STORE_L4(STYPE)
Definition: gsimd_utility.h:797

VEC_FLOAT_CLASS_METHOD_IMPL
#define VEC_FLOAT_CLASS_METHOD_IMPL(STYPE)
Definition: gsimd_utility.h:1433

LANES
#define LANES
Definition: generic4.h:108

generic::svec< 4, int32_t >::svec
svec(int a, int b, int c, int d)
Constructor.
Definition: generic4.h:349

INSERT_EXTRACT
#define INSERT_EXTRACT(STYPE)
macros for svec&#39;s insert extract method implementation The implementation is based on vector type&#39;s s...
Definition: gsimd_utility.h:409

generic::svec< 4, uint64_t >::svec
svec()
Default constructor.
Definition: generic4.h:456

LOAD_STORE
#define LOAD_STORE(STYPE)
Definition: gsimd_utility.h:419

generic::svec< 4, double >::svec
svec()
Default constructor.
Definition: generic4.h:530

CAST_BITS
#define CAST_BITS(SFROM, FROM_F, STO, TO_F)
Definition: gsimd_utility.h:1143

GATHER_STRIDE
#define GATHER_STRIDE(STYPE, OSTYPE)
macros for general impl of gather base step
Definition: gsimd_utility.h:666

generic::svec< 4, uint16_t >::svec
svec()
Default constructor.
Definition: generic4.h:306

generic::svec< 4, int8_t >::svec
svec(int8_t a, int8_t b, int8_t c, int8_t d)
Constructor.
Definition: generic4.h:199

SCATTER_STRIDE
#define SCATTER_STRIDE(STYPE, OSTYPE)
Definition: gsimd_utility.h:705

SCATTER_GENERAL
#define SCATTER_GENERAL(STYPE, PSTYPE)
Definition: gsimd_utility.h:736

GATHER_BASE_OFFSETS
#define GATHER_BASE_OFFSETS(STYPE, OSTYPE)
Definition: gsimd_utility.h:647

generic::svec< 4, uint32_t >::svec
svec(uint32_t a, uint32_t b, uint32_t c, uint32_t d)
Constructor.
Definition: generic4.h:387

UNARY_OP
#define UNARY_OP(STYPE, NAME, OP)
Definition: gsimd_utility.h:833

SELECT
#define SELECT(STYPE)
macros for svec&#39;s select by mask vector method generic implementation
Definition: gsimd_utility.h:448

CMP_ALL_OP
#define CMP_ALL_OP(STYPE)
Definition: gsimd_utility.h:1107

BINARY_OP2
#define BINARY_OP2(STYPE, STYPE2, NAME, OP)
Definition: gsimd_utility.h:861

generic::svec< 4, int16_t >::svec
svec(int16_t a)
Constructor.
Definition: generic4.h:281

COUT_FUNC_CHAR_DECL
#define COUT_FUNC_CHAR_DECL(STYPE)
Definition: gsimd_utility.h:275

CMP_OP
#define CMP_OP(STYPE, NAME, OP)
macros for binary: vector op scalar
Definition: gsimd_utility.h:1049

generic::svec< 4, uint64_t >::svec
svec(uint64_t a)
Constructor.
Definition: generic4.h:469

generic::svec< 4, int32_t >::svec
svec()
Default constructor.
Definition: generic4.h:344

SHUFFLES
#define SHUFFLES(STYPE)
macro for shuffle/shuffle2 methods implementation
Definition: gsimd_utility.h:521

gsimd_utility.h

generic::svec< 4, bool >::svec
svec()
Default constructor.
Definition: generic4.h:157

SELECT_BOOLCOND
#define SELECT_BOOLCOND(STYPE)
macros for svec&#39;s select by bool scalar method implementation
Definition: gsimd_utility.h:459

VEC_INT_CLASS_METHOD_IMPL
#define VEC_INT_CLASS_METHOD_IMPL(STYPE, STYPE2)
Definition: gsimd_utility.h:1394

FORCEINLINE
#define FORCEINLINE
Definition: gsimd_utility.h:175

generic::svec< 4, bool >::v
uint32_t v
Definition: generic4.h:151

generic::svec< 4, int16_t >::svec
svec(int16_t a, int16_t b, int16_t c, int16_t d)
Constructor.
Definition: generic4.h:273

generic::svec< 4, int8_t >::svec
svec()
Default constructor.
Definition: generic4.h:194

generic::svec< 4, float >::svec
svec()
Default constructor.
Definition: generic4.h:493

generic::svec< 4, bool >::svec
svec(uint32_t a)
Constructor.
Definition: generic4.h:173

generic::svec< 4, uint16_t >::svec
svec(uint16_t a, uint16_t b, uint16_t c, uint16_t d)
Constructor.
Definition: generic4.h:311