[Bf-blender-cvs] [5df36687057] soc-2020-soft-body: threading

over0219 Wed, 10 Jun 2020 09:48:19 -0700

Commit: 5df366870579a86edf975f97f4afa197d4071d47
Author: over0219
Date:   Wed Jun 10 11:47:53 2020 -0500
Branches: soc-2020-soft-body
https://developer.blender.org/rB5df366870579a86edf975f97f4afa197d4071d47


threading

===================================================================

M       extern/softbody/CMakeLists.txt
M       extern/softbody/src/admmpd_energy.cpp
M       extern/softbody/src/admmpd_solver.cpp
M       extern/softbody/src/admmpd_solver.h
M       source/blender/blenkernel/intern/softbody.c

===================================================================

diff --git a/extern/softbody/CMakeLists.txt b/extern/softbody/CMakeLists.txt
index 8f6ec97d7dd..05caac30633 100644
--- a/extern/softbody/CMakeLists.txt
+++ b/extern/softbody/CMakeLists.txt
@@ -24,6 +24,7 @@ set(INC
 
 set(INC_SYS
   ${EIGEN3_INCLUDE_DIRS}
+  ../../source/blender/blenlib
 )
 
 set(SRC
diff --git a/extern/softbody/src/admmpd_energy.cpp 
b/extern/softbody/src/admmpd_energy.cpp
index cbe60cb1511..36f0bfa1478 100644
--- a/extern/softbody/src/admmpd_energy.cpp
+++ b/extern/softbody/src/admmpd_energy.cpp
@@ -9,7 +9,7 @@ using namespace Eigen;
 
 Lame::Lame() : m_model(0)
 {
-       set_from_youngs_poisson(100000,0.299);
+       set_from_youngs_poisson(10000000,0.399);
 }
 
 void Lame::set_from_youngs_poisson(double youngs, double poisson)
@@ -55,6 +55,7 @@ void EnergyTerm::update(
        Eigen::MatrixXd *z,
        Eigen::MatrixXd *u)
 {
+       (void)(x);
        Matrix3d Dix = Dx->block<3,3>(index,0);
        Matrix3d ui = u->block<3,3>(index,0);
        Matrix3d zi = Dix + ui;
@@ -92,9 +93,11 @@ int EnergyTerm::init_tet(
        Matrix<double,3,3> edges_inv = edges.inverse();
        volume = edges.determinant() / 6.0f;
        if( volume < 0 )
-               throw std::runtime_error("**Solver::energy_init: Inverted 
initial tet");
+       {
+               printf("**EnergyTerm::init_tet: Inverted initial tet");
+               return 0;
+       }
        double k = lame.m_bulk_mod;
-std::cout << "IDX: " << index << " bulk mod: " << k << std::endl;
        weight = std::sqrt(k*volume);
        Matrix<double,4,3> S = Matrix<double,4,3>::Zero();
        S(0,0) = -1; S(0,1) = -1; S(0,2) = -1;
diff --git a/extern/softbody/src/admmpd_solver.cpp 
b/extern/softbody/src/admmpd_solver.cpp
index c5831077b0b..ad64e4ed277 100644
--- a/extern/softbody/src/admmpd_solver.cpp
+++ b/extern/softbody/src/admmpd_solver.cpp
@@ -12,10 +12,17 @@
 #include <stdio.h>
 #include <iostream>
 
+#include "BLI_task.h" // threading
+
 namespace admmpd {
 using namespace Eigen;
 template <typename T> using RowSparseMatrix = SparseMatrix<T,RowMajor>;
 
+typedef struct ThreadData {
+       const Options *options;
+       Data *data;
+} ThreadData;
+
 bool Solver::init(
     const Eigen::MatrixXd &V,
        const Eigen::MatrixXi &T,
@@ -41,30 +48,14 @@ int Solver::solve(
        // the variables are sized correctly.
        init_solve(options,data);
 
-       int ne = data->rest_volumes.size();
-       Lame lame; // TODO lame params as input
-
        // Begin solver loop
        int iters = 0;
        for (; iters < options->max_admm_iters; ++iters)
        {
-               // Local step
-               data->Dx.noalias() = data->D * data->x;
-               for(int i=0; i<ne; ++i)
-               {
-                       EnergyTerm().update(
-                               data->indices[i][0],
-                               lame,
-                               data->rest_volumes[i],
-                               data->weights[i],
-                               &data->x,
-                               &data->Dx,
-                               &data->z,
-                               &data->u );
-               }
 
-               // Global step
+               solve_local_step(options,data);
                update_constraints(options,data);
+
                data->b.noalias() = data->M_xbar + data->DtW2*(data->z-data->u);
                solve_conjugate_gradients(options,data);
 
@@ -103,6 +94,35 @@ void Solver::init_solve(
 
 } // end init solve
 
+static void parallel_zu_update(
+       void *__restrict userdata,
+       const int i,
+       const TaskParallelTLS *__restrict UNUSED(tls))
+{
+       Lame lame; // TODO lame params as input
+       ThreadData *td = (ThreadData*)userdata;
+       EnergyTerm().update(
+               td->data->indices[i][0],
+               lame,
+               td->data->rest_volumes[i],
+               td->data->weights[i],
+               &td->data->x,
+               &td->data->Dx,
+               &td->data->z,
+               &td->data->u );
+} // end parallel zu update
+
+void Solver::solve_local_step(
+       const Options *options,
+       Data *data)
+{
+       int ne = data->rest_volumes.size();
+       ThreadData thread_data = {.options=options, .data = data};
+       TaskParallelSettings settings;
+       BLI_parallel_range_settings_defaults(&settings);
+       BLI_task_parallel_range(0, ne, &thread_data, parallel_zu_update, 
&settings);
+} // end local step
+
 void Solver::update_constraints(
        const Options *options,
        Data *data)
@@ -145,19 +165,45 @@ void Solver::update_constraints(
 
 } // end update constraints
 
+typedef struct LinSolveThreadData {
+       Data *data;
+       MatrixXd *x;
+       MatrixXd *b;
+} LinSolveThreadData;
+
+static void parallel_lin_solve(
+       void *__restrict userdata,
+       const int i,
+       const TaskParallelTLS *__restrict UNUSED(tls))
+{
+       LinSolveThreadData *td = (LinSolveThreadData*)userdata;
+       td->x->col(i) = td->data->ldltA.solve(td->b->col(i));
+} // end parallel lin solve
+
 void Solver::solve_conjugate_gradients(
        const Options *options,
        Data *data)
 {
+       // Solve Ax = b in parallel
+       auto solve_Ax_b = [](
+               Data *data_,
+               MatrixXd *x_,
+               MatrixXd *b_)
+       {
+               LinSolveThreadData thread_data = {.data=data_, .x=x_, .b=b_};
+               TaskParallelSettings settings;
+               BLI_parallel_range_settings_defaults(&settings);
+               BLI_task_parallel_range(0, 3, &thread_data, parallel_lin_solve, 
&settings);
+       };
+
        // If we don't have any constraints,
        // we don't need to perform CG
-       int nnz = std::max(std::max(
+       if (std::max(std::max(
                data->K[0].nonZeros(),
                data->K[1].nonZeros()),
-               data->K[2].nonZeros());
-       if (nnz==0)
+               data->K[2].nonZeros())==0)
        {
-               data->x.noalias() = data->ldltA.solve(data->b);
+               solve_Ax_b(data,&data->x,&data->b);
                return;
        }
 
@@ -165,7 +211,7 @@ void Solver::solve_conjugate_gradients(
        // if they were instead vectorized
        auto mat_inner = [](
                const MatrixXd &A,
-               const MatrixXd &B )
+               const MatrixXd &B)
        {
                double dot = 0.0;
                int nr = std::min(A.rows(), B.rows());
@@ -192,7 +238,7 @@ void Solver::solve_conjugate_gradients(
                b.col(i) += data->spring_k*Kt*data->l;
                r.col(i) = b.col(i) - A[i]*data->x.col(i);
        }
-       z = data->ldltA.solve(r);
+       solve_Ax_b(data,&z,&r);
        p = z;
 
        for (int iter=0; iter<options->max_cg_iters; ++iter)
@@ -213,8 +259,7 @@ void Solver::solve_conjugate_gradients(
                r -= alpha * Ap;
                if( r.lpNorm<Infinity>() < eps )
                        break;
-
-               z = data->ldltA.solve(r);
+               solve_Ax_b(data,&z,&r);
                double beta = mat_inner(z,r) / zk_dot_rk;
                p = z + beta*p;
        }
@@ -237,10 +282,7 @@ void Solver::compute_matrices(
                data->v.setZero();
        }
        if (data->m.rows() != nx)
-       { // TODO get from input
-               data->m.resize(nx);
-               data->m.setOnes();
-       }
+               compute_masses(options,data);
 
        // Add per-element energies to data
        std::vector< Triplet<double> > trips;
@@ -290,6 +332,33 @@ void Solver::compute_matrices(
 
 } // end compute matrices
 
+void Solver::compute_masses(
+       const Options *options,
+       Data *data)
+{
+       // Source: 
https://github.com/mattoverby/mclscene/blob/master/include/MCL/TetMesh.hpp
+       // Computes volume-weighted masses for each vertex
+       // density_kgm3 is the unit-volume density (e.g. soft rubber: 1100)
+       double density_kgm3 = 1100;
+       data->m.resize(data->x.rows());
+       data->m.setZero();
+       int n_tets = data->tets.rows();
+       for (int t=0; t<n_tets; ++t)
+       {
+               RowVector4i tet = data->tets.row(t);
+               Matrix3d edges;
+               edges.col(0) = data->x.row(tet[1]) - data->x.row(tet[0]);
+               edges.col(1) = data->x.row(tet[2]) - data->x.row(tet[0]);
+               edges.col(2) = data->x.row(tet[3]) - data->x.row(tet[0]);
+               double v = std::abs((edges).determinant()/6.f);
+               double tet_mass = density_kgm3 * v;
+               data->m[ tet[0] ] += tet_mass / 4.f;
+               data->m[ tet[1] ] += tet_mass / 4.f;
+               data->m[ tet[2] ] += tet_mass / 4.f;
+               data->m[ tet[3] ] += tet_mass / 4.f;
+       }
+}
+
 void Solver::append_energies(
        const Options *options,
        Data *data,
diff --git a/extern/softbody/src/admmpd_solver.h 
b/extern/softbody/src/admmpd_solver.h
index 6b397bee406..970cbfb6368 100644
--- a/extern/softbody/src/admmpd_solver.h
+++ b/extern/softbody/src/admmpd_solver.h
@@ -84,6 +84,10 @@ protected:
         const Options *options,
         Data *data);
 
+       void solve_local_step(
+        const Options *options,
+        Data *data);
+
     // Global step with CG:
     // 1/2||Ax-b||^2 + k/2||Kx-l||^2
        void solve_conjugate_gradients(
@@ -98,6 +102,10 @@ protected:
         const Options *options,
         Data *data);
 
+    void compute_masses(
+        const Options *options,
+        Data *data);
+
        void append_energies(
                const Options *options,
                Data *data,
diff --git a/source/blender/blenkernel/intern/softbody.c 
b/source/blender/blenkernel/intern/softbody.c
index a14cb41a4af..63c01e6ef3f 100644
--- a/source/blender/blenkernel/intern/softbody.c
+++ b/source/blender/blenkernel/intern/softbody.c
@@ -3545,6 +3545,46 @@ static void sbStoreLastFrame(struct Depsgraph 
*depsgraph, Object *object, float
   object_orig->soft->last_frame = framenr;
 }
 
+static void admm_resize_softbody(Object *ob, int totpoint)
+{
+  if (totpoint<=0)
+    return;
+
+  SoftBody *sb = ob->soft;
+  if (sb->totpoint && sb->bpoint !=NULL)
+    MEM_freeN(sb->bpoint);
+  printf("bp ptr: %p\n",sb);
+  printf("bodypt: %d\n",sb->totpoint);
+
+  sb->totpoint = totpoint;
+  sb->totspring = 0;
+//  sb->bpoint = MEM_mallocN(totpoint * sizeof(BodyPoint), "bodypoint");
+}
+
+static void admm_copy_to_softbody(Object *ob)
+{
+  SoftBody *sb = ob->soft;
+  ADMMPDInterfaceData *admmpd = sb->admmpd;
+  if (admmpd == NULL)
+    return;
+
+  if (sb->totpoint != admmpd->out_totverts)
+  {
+    printf("**admm_copy_to_softbody error: DOF missmatch");
+    return;
+  }
+
+  for (int i=0; i<admmpd->out_totverts; ++i)
+  {
+    BodyPoint *pt = &sb->bpoint[i];
+    for (int j=0; j<3; ++j)
+    {
+      pt->pos[j] = admmpd->out_verts[i*3+j];
+      pt->vec[j] = admmpd->out_vel[i*3+j];
+    }
+  }
+}
+
 /* simulates one step. framenr is in frames */
 void sbObjectStep_admmpd(struct Depsgraph *depsgraph,
                   Scene *scene,
@@ -3558,22 +3598,24 @@ void sbObjectStep_admmpd(struct Depsgraph *depsgraph,
 
   Mesh *me = ob->data;
   SoftBody *sb = ob->soft;
-  PointCache *cache = sb->shared->pointcache;
-  int framenr = (int)cfra;
-  int framedelta = framenr - cache->simframe;
-
-  PTCacheID pid;
-  BKE_ptcache_id_from_softbody(&pid, ob, sb);
-  float timescale;
-  int startframe, endframe; // start and end frame of the cache
-  BKE_ptcache_id_time(&pid, scene, framenr, &startframe, &endframe, 
&timescale);
-  framenr = framenr < endframe ? framenr : endframe; // min(framenr,endframe)
 
-  if (framenr < startframe)
-  {
-    BKE_ptcache_invalidate(cache);
-    return;
-  }
+//  PointCache *cache = sb->shared->pointcache;
+  int framenr = (int)cfra;
+//  int framedelta = framenr - cache->simframe;
+  int startframe = 1;
+
+//  PTCacheID pid;
+//  BKE_ptcache_id_from_s

@@ Diff output truncated at 10240 characters. @@

_______________________________________________
Bf-blender-cvs mailing list
[email protected]
https://lists.blender.org/mailman/listinfo/bf-blender-cvs

[Bf-blender-cvs] [5df36687057] soc-2020-soft-body: threading

Reply via email to