new build method
[vg.git] / src / vg / vg_m.h
index a61c6f0565575a442a98fa43fb675b3ef2edb834..a97101e6d0ac94b5012cd69f93f8dcf67d7a3eba 100644 (file)
@@ -23,16 +23,31 @@ static inline float vg_signf( float a )
    return a < 0.0f? -1.0f: 1.0f;
 }
 
+static inline float vg_fractf( float a )
+{
+   return a - floorf( a );
+}
+
 static inline float vg_randf(void)
 {
    return (float)rand()/(float)(RAND_MAX);
 }
 
-static inline float vg_randint(int max)
+static inline int vg_randint(int max)
 {
    return rand()%max;
 }
 
+static float stable_force( float current, float diff )
+{
+   float fnew = current + diff;
+
+   if( fnew * current < 0.0f )
+      return 0.0f;
+
+   return fnew;
+}
+
 #define VG_MIN( A, B ) ((A)<(B)?(A):(B))
 #define VG_MAX( A, B ) ((A)>(B)?(A):(B))
 
@@ -59,6 +74,11 @@ static inline void v2_copy( v2f a, v2f b )
        b[0] = a[0]; b[1] = a[1];
 }
 
+static inline void v2_zero( v2f a )
+{
+       a[0] = 0.f; a[1] = 0.f;
+}
+
 static inline void v2i_copy( v2i a, v2i b )
 {
        b[0] = a[0]; b[1] = a[1];
@@ -103,7 +123,7 @@ static inline float v2_dot( v2f a, v2f b )
 
 static inline float v2_cross( v2f a, v2f b )
 {
-       return a[0] * b[1] - a[1] * b[0];
+       return a[0]*b[1] - a[1]*b[0];
 }
 
 static inline void v2_add( v2f a, v2f b, v2f d )
@@ -177,6 +197,12 @@ static inline void v2_normalize( v2f a )
        v2_muls( a, 1.f / v2_length( a ), a );
 }
 
+static inline void v2_floor( v2f a, v2f b )
+{
+   b[0] = floorf( a[0] );
+   b[1] = floorf( a[1] );
+}
+
 /*
  * Vector 3
  */
@@ -237,11 +263,13 @@ static inline float v3_dot( v3f a, v3f b )
        return a[0] * b[0] + a[1] * b[1] + a[2] * b[2];
 }
 
-static inline void v3_cross( v3f a, v3f b, v3f d )
+static inline void v3_cross( v3f a, v3f b, v3f dest )
 {
-  d[0] = a[1] * b[2] - a[2] * b[1];
-  d[1] = a[2] * b[0] - a[0] * b[2];
-  d[2] = a[0] * b[1] - a[1] * b[0];
+   v3f d;
+   d[0] = a[1]*b[2] - a[2]*b[1];
+   d[1] = a[2]*b[0] - a[0]*b[2];
+   d[2] = a[0]*b[1] - a[1]*b[0];
+   v3_copy( d, dest );
 }
 
 static inline float v3_length2( v3f a )
@@ -366,7 +394,15 @@ static inline void v4_zero( v4f a )
        a[0] = 0.f; a[1] = 0.f; a[2] = 0.f; a[3] = 0.f;
 }
 
-static inline void v4_muladds( v3f a, v3f b, float s, v3f d )
+static inline void v4_muls( v4f a, float s, v4f d )
+{
+       d[0] = a[0]*s; 
+   d[1] = a[1]*s;
+   d[2] = a[2]*s;
+   d[3] = a[3]*s;
+}
+
+static inline void v4_muladds( v4f a, v4f b, float s, v4f d )
 {
        d[0] = a[0]+b[0]*s; 
    d[1] = a[1]+b[1]*s;
@@ -598,6 +634,13 @@ static inline void m4x3_to_3x3( m4x3f a, m3x3f b )
        v3_copy( a[2], b[2] );
 }
 
+static inline void m4x3_invert_affine( m4x3f a, m4x3f b )
+{
+   m3x3_transpose( a, b );
+   m3x3_mulv( b, a[3], b[3] );
+   v3_negate( b[3], b[3] );
+}
+
 static inline void m4x3_copy( m4x3f a, m4x3f b )
 {
        v3_copy( a[0], b[0] );
@@ -649,6 +692,20 @@ static inline void m4x3_mulv( m4x3f m, v3f v, v3f d )
        v3_copy( res, d );
 }
 
+/* 
+ * Transform plane ( xyz, distance )
+ */
+static inline void m4x3_mulp( m4x3f m, v4f p, v4f d )
+{
+   v3f o;
+
+   v3_muls( p, p[3], o );
+   m4x3_mulv( m, o, o );
+   m3x3_mulv( m, p, d );
+   
+   d[3] = v3_dot( o, d );
+}
+
 /*
  * Affine transforms
  */
@@ -667,6 +724,13 @@ static inline void m4x3_scale( m4x3f m, float s )
        v3_muls( m[2], s, m[2] );
 }
 
+static inline void m4x3_scalev( m4x3f m, v3f v )
+{
+   v3_muls(m[0], v[0], m[0]);
+   v3_muls(m[1], v[1], m[1]);
+   v3_muls(m[2], v[2], m[2]);
+}
+
 static inline void m4x3_rotate_x( m4x3f m, float angle )
 {
        m4x3f t = M4X3_IDENTITY;
@@ -736,6 +800,12 @@ static inline void m4x3_expand_aabb_point( m4x3f m, boxf box, v3f point )
        v3_maxv( box[1], v, box[1] );
 }
 
+static inline void box_addpt( boxf a, v3f pt )
+{
+       v3_minv( a[0], pt, a[0] );
+       v3_maxv( a[1], pt, a[1] );
+}
+
 static inline void box_concat( boxf a, boxf b )
 {
        v3_minv( a[0], b[0], a[0] );
@@ -748,6 +818,21 @@ static inline void box_copy( boxf a, boxf b )
        v3_copy( a[1], b[1] );
 }
 
+static inline int box_overlap( boxf a, boxf b )
+{
+   return
+       ( a[0][0] <= b[1][0] && a[1][0] >= b[0][0] ) &&
+       ( a[0][1] <= b[1][1] && a[1][1] >= b[0][1] ) &&
+       ( a[0][2] <= b[1][2] && a[1][2] >= b[0][2] )
+       ;
+}
+
+static inline void box_init_inf( boxf box )
+{
+       v3_fill( box[0],  INFINITY );
+       v3_fill( box[1], -INFINITY );
+}
+
 static inline void m4x3_transform_aabb( m4x3f m, boxf box )
 {
        v3f a; v3f b;
@@ -757,14 +842,35 @@ static inline void m4x3_transform_aabb( m4x3f m, boxf box )
        v3_fill( box[0],  INFINITY );
        v3_fill( box[1], -INFINITY );
 
-       m4x3_expand_aabb_point( m, box, a );
+       m4x3_expand_aabb_point( m, box, (v3f){ a[0], a[1], a[2] } );
        m4x3_expand_aabb_point( m, box, (v3f){ a[0], b[1], a[2] } );
-       m4x3_expand_aabb_point( m, box, (v3f){ b[0], a[1], a[2] } );
        m4x3_expand_aabb_point( m, box, (v3f){ b[0], b[1], a[2] } );
-       m4x3_expand_aabb_point( m, box, b );
+       m4x3_expand_aabb_point( m, box, (v3f){ b[0], a[1], a[2] } );
+
+       m4x3_expand_aabb_point( m, box, (v3f){ a[0], a[1], b[2] } );
        m4x3_expand_aabb_point( m, box, (v3f){ a[0], b[1], b[2] } );
-       m4x3_expand_aabb_point( m, box, (v3f){ b[0], a[1], b[2] } );
        m4x3_expand_aabb_point( m, box, (v3f){ b[0], b[1], b[2] } );
+       m4x3_expand_aabb_point( m, box, (v3f){ b[0], a[1], b[2] } );
+}
+
+int ray_aabb( boxf box, v3f co, v3f dir, float dist )
+{
+   v3f v0, v1;
+   float tmin, tmax;
+
+   v3_sub( box[0], co, v0 );
+   v3_sub( box[1], co, v1 );
+   v3_div( v0, dir, v0 );
+   v3_div( v1, dir, v1 );
+   
+   tmin = vg_minf( v0[0], v1[0] );
+   tmax = vg_maxf( v0[0], v1[0] );
+   tmin = vg_maxf( tmin, vg_minf( v0[1], v1[1] ));
+   tmax = vg_minf( tmax, vg_maxf( v0[1], v1[1] ));
+   tmin = vg_maxf( tmin, vg_minf( v0[2], v1[2] ));
+   tmax = vg_minf( tmax, vg_maxf( v0[2], v1[2] ));
+
+   return tmax >= tmin && tmin < dist && tmax > 0;
 }
 
 static inline void m4x3_lookat( m4x3f m, v3f pos, v3f target, v3f up )
@@ -773,7 +879,7 @@ static inline void m4x3_lookat( m4x3f m, v3f pos, v3f target, v3f up )
    v3_sub( target, pos, dir );
    v3_normalize( dir );
 
-   v3_negate( dir, m[2] );
+   v3_copy( dir, m[2] );
 
    v3_cross( up, m[2], m[0] );
    v3_normalize( m[0] );
@@ -790,31 +896,35 @@ static inline void m4x3_lookat( m4x3f m, v3f pos, v3f target, v3f up )
                                                                { 0.0f, 1.0f, 0.0f, 0.0f },\
                                                                { 0.0f, 0.0f, 1.0f, 0.0f },\
                                                                { 0.0f, 0.0f, 0.0f, 1.0f }}
+#define M4X4_ZERO                      {{0.0f, 0.0f, 0.0f, 0.0f },\
+                                                               { 0.0f, 0.0f, 0.0f, 0.0f },\
+                                                               { 0.0f, 0.0f, 0.0f, 0.0f },\
+                                                               { 0.0f, 0.0f, 0.0f, 0.0f }}
 
 static void m4x4_projection( m4x4f m, float angle,
-      float ratio, float near, float far )
+      float ratio, float fnear, float ffar )
 {
-   float scale = tanf( angle * 0.5f * VG_PIf / 180.0f ) * near,
+   float scale = tanf( angle * 0.5f * VG_PIf / 180.0f ) * fnear,
          r = ratio * scale,
          l = -r,
          t = scale,
          b = -t;
 
-   m[0][0] =  2.0f * near / (r - l); 
+   m[0][0] =  2.0f * fnear / (r - l); 
    m[0][1] =  0.0f; 
    m[0][2] =  0.0f; 
    m[0][3] =  0.0f; 
    m[1][0] =  0.0f; 
-   m[1][1] =  2.0f * near / (t - b); 
+   m[1][1] =  2.0f * fnear / (t - b); 
    m[1][2] =  0.0f; 
    m[1][3] =  0.0f; 
    m[2][0] =  (r + l) / (r - l); 
    m[2][1] =  (t + b) / (t - b); 
-   m[2][2] = -(far + near) / (far - near); 
+   m[2][2] = -(ffar + fnear) / (ffar - fnear); 
    m[2][3] = -1.0f; 
    m[3][0] =  0.0f; 
    m[3][1] =  0.0f; 
-   m[3][2] = -2.0f * far * near / (far - near); 
+   m[3][2] = -2.0f * ffar * fnear / (ffar - fnear); 
    m[3][3] =  0.0f;
 } 
 
@@ -839,6 +949,12 @@ static inline void m4x4_identity( m4x4f a )
        m4x4_copy( id, a );
 }
 
+static inline void m4x4_zero( m4x4f a )
+{
+       m4x4f zero = M4X4_ZERO;
+       m4x4_copy( zero, a );
+}
+
 static inline void m4x4_mul( m4x4f a, m4x4f b, m4x4f d )
 {
    float a00 = a[0][0], a01 = a[0][1], a02 = a[0][2], a03 = a[0][3],
@@ -869,6 +985,75 @@ static inline void m4x4_mul( m4x4f a, m4x4f b, m4x4f d )
   d[3][3] = a03*b30 + a13*b31 + a23*b32 + a33*b33;
 }
 
+static inline void m4x4_mulv( m4x4f m, v4f v, v4f d ) 
+{
+       v4f res;
+  
+       res[0] = m[0][0]*v[0] + m[1][0]*v[1] + m[2][0]*v[2] + m[3][0]*v[3];
+       res[1] = m[0][1]*v[0] + m[1][1]*v[1] + m[2][1]*v[2] + m[3][1]*v[3];
+       res[2] = m[0][2]*v[0] + m[1][2]*v[1] + m[2][2]*v[2] + m[3][2]*v[3];
+       res[3] = m[0][3]*v[0] + m[1][3]*v[1] + m[2][3]*v[2] + m[3][3]*v[3];
+
+       v4_copy( res, d );
+}
+
+static inline void m4x4_inv( m4x4f a, m4x4f d )
+{
+   float a00 = a[0][0], a01 = a[0][1], a02 = a[0][2], a03 = a[0][3],
+         a10 = a[1][0], a11 = a[1][1], a12 = a[1][2], a13 = a[1][3],
+         a20 = a[2][0], a21 = a[2][1], a22 = a[2][2], a23 = a[2][3],
+         a30 = a[3][0], a31 = a[3][1], a32 = a[3][2], a33 = a[3][3],
+         det,
+         t[6];
+
+   t[0] = a22*a33 - a32*a23;
+   t[1] = a21*a33 - a31*a23;
+   t[2] = a21*a32 - a31*a22;
+   t[3] = a20*a33 - a30*a23;
+   t[4] = a20*a32 - a30*a22;
+   t[5] = a20*a31 - a30*a21;
+
+   d[0][0] =  a11*t[0] - a12*t[1] + a13*t[2];
+   d[1][0] =-(a10*t[0] - a12*t[3] + a13*t[4]);
+   d[2][0] =  a10*t[1] - a11*t[3] + a13*t[5];
+   d[3][0] =-(a10*t[2] - a11*t[4] + a12*t[5]);
+
+   d[0][1] =-(a01*t[0] - a02*t[1] + a03*t[2]);
+   d[1][1] =  a00*t[0] - a02*t[3] + a03*t[4];
+   d[2][1] =-(a00*t[1] - a01*t[3] + a03*t[5]);
+   d[3][1] =  a00*t[2] - a01*t[4] + a02*t[5];
+
+   t[0] = a12*a33 - a32*a13;
+   t[1] = a11*a33 - a31*a13;
+   t[2] = a11*a32 - a31*a12;
+   t[3] = a10*a33 - a30*a13;
+   t[4] = a10*a32 - a30*a12;
+   t[5] = a10*a31 - a30*a11;
+
+   d[0][2] =  a01*t[0] - a02*t[1] + a03*t[2];
+   d[1][2] =-(a00*t[0] - a02*t[3] + a03*t[4]);
+   d[2][2] =  a00*t[1] - a01*t[3] + a03*t[5];
+   d[3][2] =-(a00*t[2] - a01*t[4] + a02*t[5]);
+
+   t[0] = a12*a23 - a22*a13;
+   t[1] = a11*a23 - a21*a13;
+   t[2] = a11*a22 - a21*a12;
+   t[3] = a10*a23 - a20*a13;
+   t[4] = a10*a22 - a20*a12;
+   t[5] = a10*a21 - a20*a11;
+
+   d[0][3] =-(a01*t[0] - a02*t[1] + a03*t[2]);
+   d[1][3] =  a00*t[0] - a02*t[3] + a03*t[4];
+   d[2][3] =-(a00*t[1] - a01*t[3] + a03*t[5]);
+   d[3][3] =  a00*t[2] - a01*t[4] + a02*t[5];
+   
+   det = 1.0f / (a00*d[0][0] + a01*d[1][0] + a02*d[2][0] + a03*d[3][0]);
+   v4_muls( d[0], det, d[0] );
+   v4_muls( d[1], det, d[1] );
+   v4_muls( d[2], det, d[2] );
+   v4_muls( d[3], det, d[3] );
+}
+
 /*
  * Planes (double precision)
  */
@@ -1009,3 +1194,91 @@ static inline void q_m3x3( v4f q, m3x3f d )
    d[2][1] = yz - wx;
    d[0][2] = xz - wy;
 }
+
+static void m3x3_q( m3x3f m, v4f q )
+{
+   float diag, r, rinv;
+
+   diag = m[0][0] + m[1][1] + m[2][2];
+   if( diag >= 0.0f )
+   {
+      r    = sqrtf( 1.0f + diag );
+      rinv = 0.5f / r;
+      q[0] = rinv * (m[1][2] - m[2][1]);
+      q[1] = rinv * (m[2][0] - m[0][2]);
+      q[2] = rinv * (m[0][1] - m[1][0]);
+      q[3] = r    * 0.5f;
+   } 
+   else if( m[0][0] >= m[1][1] && m[0][0] >= m[2][2] )
+   {
+      r    = sqrtf( 1.0f - m[1][1] - m[2][2] + m[0][0] );
+      rinv = 0.5f / r;
+      q[0] = r    * 0.5f;
+      q[1] = rinv * (m[0][1] + m[1][0]);
+      q[2] = rinv * (m[0][2] + m[2][0]);
+      q[3] = rinv * (m[1][2] - m[2][1]);
+   } 
+   else if( m[1][1] >= m[2][2] )
+   {
+      r    = sqrtf( 1.0f - m[0][0] - m[2][2] + m[1][1] );
+      rinv = 0.5f / r;
+      q[0] = rinv * (m[0][1] + m[1][0]);
+      q[1] = r    * 0.5f;
+      q[2] = rinv * (m[1][2] + m[2][1]);
+      q[3] = rinv * (m[2][0] - m[0][2]);
+   } 
+   else 
+   {
+      r    = sqrtf( 1.0f - m[0][0] - m[1][1] + m[2][2] );
+      rinv = 0.5f / r;
+      q[0] = rinv * (m[0][2] + m[2][0]);
+      q[1] = rinv * (m[1][2] + m[2][1]);
+      q[2] = r    * 0.5f;
+      q[3] = rinv * (m[0][1] - m[1][0]);
+   }
+}
+
+static int ray_tri( v3f tri[3], v3f co, v3f dir, float *dist )
+{
+   float const kEpsilon = 0.00001f;
+
+   v3f v0, v1, h, s, q, n;
+   float a,f,u,v,t;
+
+   float *pa = tri[0],
+         *pb = tri[1],
+         *pc = tri[2];
+
+   v3_sub( pb, pa, v0 );
+   v3_sub( pc, pa, v1 );
+   v3_cross( dir, v1, h );
+   v3_cross( v0, v1, n );
+
+   if( v3_dot( n, dir ) > 0.0f ) /* Backface culling */
+      return 0;
+   
+   /* Parralel */
+   a = v3_dot( v0, h );
+   if( a > -kEpsilon && a < kEpsilon )
+      return 0;
+
+   f = 1.0f/a;
+   v3_sub( co, pa, s );
+
+   u = f * v3_dot(s, h);
+   if( u < 0.0f || u > 1.0f )
+      return 0;
+   
+   v3_cross( s, v0, q );
+   v = f * v3_dot( dir, q );
+   if( v < 0.0f || u+v > 1.0f )
+      return 0;
+
+   t = f * v3_dot(v1, q);
+   if( t > kEpsilon )
+   {
+      *dist = t;
+      return 1;
+   }
+   else return 0;
+}