[madlib] 02/02: DL: Record metrics_elapsed_time in model summary table

njayaram Wed, 29 May 2019 12:05:05 -0700

This is an automated email from the ASF dual-hosted git repository.

njayaram pushed a commit to branch master
in repository https://gitbox.apache.org/repos/asf/madlib.git


commit d1fa5ab8f3bf3b5c4536d25ac51160e952c4baf0
Author: Nandish Jayaram <[email protected]>
AuthorDate: Thu May 23 14:11:44 2019 -0700

    DL: Record metrics_elapsed_time in model summary table
    
    JIRA: MADLIB-1338
    Change time_iter reported earlier to metrics_elapsed_time that contains
    the elapsed time in seconds, instead of timestamps. The size of this
    array must be the same as metrics_iter in the summary table.
---
 .../postgres/modules/deep_learning/madlib_keras.py_in      | 14 +++++++++-----
 .../modules/deep_learning/test/madlib_keras.sql_in         | 10 +++++-----
 2 files changed, 14 insertions(+), 10 deletions(-)

diff --git a/src/ports/postgres/modules/deep_learning/madlib_keras.py_in 
b/src/ports/postgres/modules/deep_learning/madlib_keras.py_in
index bafc7e0..16cf7af 100644
--- a/src/ports/postgres/modules/deep_learning/madlib_keras.py_in
+++ b/src/ports/postgres/modules/deep_learning/madlib_keras.py_in
@@ -76,6 +76,8 @@ def fit(schema_madlib, source_table, model,model_arch_table,
     if metrics_compute_frequency is None:
         metrics_compute_frequency = num_iterations
 
+    # The following two times must be recorded together.
+    metrics_elapsed_start_time = time.time()
     start_training_time = datetime.datetime.now()
 
     gpus_per_host = 0 if gpus_per_host is None else gpus_per_host
@@ -168,7 +170,7 @@ def fit(schema_madlib, source_table, model,model_arch_table,
 
     # Define the state for the model and loss/metric storage lists
     model_state = madlib_keras_serializer.serialize_weights(0, model_weights)
-    training_loss, training_metrics, aggregate_runtime = [], [], []
+    training_loss, training_metrics, metrics_elapsed_time = [], [], []
     metrics_iters = []
 
     # get the size of serialized model weights string in KB
@@ -188,7 +190,6 @@ def fit(schema_madlib, source_table, model,model_arch_table,
         if should_compute_metrics_this_iter(i, metrics_compute_frequency,
                                             num_iterations):
             # Compute loss/accuracy for training data.
-            aggregate_runtime.append(datetime.datetime.now())
             compute_loss_and_metrics(
                 schema_madlib, source_table, dependent_varname,
                 independent_varname, compile_params_to_pass, model_arch,
@@ -206,6 +207,9 @@ def fit(schema_madlib, source_table, model,model_arch_table,
                     images_per_seg_val, gp_segment_id_col,
                     validation_metrics, validation_loss,
                     i, "Validation")
+            metrics_elapsed_end_time = time.time()
+            metrics_elapsed_time.append(
+                metrics_elapsed_end_time-metrics_elapsed_start_time)
 
     end_training_time = datetime.datetime.now()
 
@@ -266,7 +270,7 @@ def fit(schema_madlib, source_table, model,model_arch_table,
             {model_size}::DOUBLE PRECISION AS model_size,
             '{start_training_time}'::TIMESTAMP AS start_training_time,
             '{end_training_time}'::TIMESTAMP AS end_training_time,
-            $5 AS time_iter,
+            $5 AS metrics_elapsed_time,
             '{version}'::TEXT AS madlib_version,
             {num_classes}::INTEGER AS num_classes,
             $6 AS {class_values_colname},
@@ -287,11 +291,11 @@ def fit(schema_madlib, source_table, 
model,model_arch_table,
                    dependent_vartype_colname=DEPENDENT_VARTYPE_COLNAME,
                    normalizing_const_colname=NORMALIZING_CONST_COLNAME,
                    **locals()),
-                   ["TEXT", "TEXT", "TEXT","TEXT", "TIMESTAMP[]",
+                   ["TEXT", "TEXT", "TEXT","TEXT", "DOUBLE PRECISION[]",
                     class_values_type])
     plpy.execute(create_output_summary_table,
                  [compile_params, fit_params, name,
-                  description, aggregate_runtime, class_values])
+                  description, metrics_elapsed_time, class_values])
 
     create_output_table = plpy.prepare("""
         CREATE TABLE {0} AS SELECT
diff --git a/src/ports/postgres/modules/deep_learning/test/madlib_keras.sql_in 
b/src/ports/postgres/modules/deep_learning/test/madlib_keras.sql_in
index 9b577b3..fc96f1e 100644
--- a/src/ports/postgres/modules/deep_learning/test/madlib_keras.sql_in
+++ b/src/ports/postgres/modules/deep_learning/test/madlib_keras.sql_in
@@ -144,7 +144,7 @@ SELECT assert(
         training_loss_final  >= 0  AND
         array_upper(training_metrics, 1) = 1 AND
         array_upper(training_loss, 1) = 1 AND
-        array_upper(time_iter, 1) = 1 AND
+        array_upper(metrics_elapsed_time, 1) = 1 AND
         validation_metrics_final >= 0 AND
         validation_loss_final  >= 0  AND
         array_upper(validation_metrics, 1) = 1 AND
@@ -179,7 +179,7 @@ SELECT assert(
         metrics_type = '{accuracy}' AND
         array_upper(training_metrics, 1) = 2 AND
         array_upper(training_loss, 1) = 2 AND
-        array_upper(time_iter, 1) = 2 AND
+        array_upper(metrics_elapsed_time, 1) = 2 AND
         validation_metrics_final >= 0 AND
         validation_loss_final  >= 0  AND
         array_upper(validation_metrics, 1) = 2 AND
@@ -256,7 +256,7 @@ SELECT assert(
     model_size > 0 AND
     start_training_time         < now() AND
     end_training_time > start_training_time AND
-    array_upper(time_iter, 1) = 2 AND
+    array_upper(metrics_elapsed_time, 1) = 2 AND
     dependent_vartype = 'smallint' AND
     madlib_version is NOT NULL AND
     num_classes = 2 AND
@@ -291,7 +291,7 @@ SELECT assert(
         metrics_type is NULL AND
         training_metrics IS NULL AND
         array_upper(training_loss, 1) = 1 AND
-        array_upper(time_iter, 1) = 1 AND
+        array_upper(metrics_elapsed_time, 1) = 1 AND
         validation_metrics_final IS NULL AND
         validation_loss_final  >= 0  AND
         validation_metrics IS NULL AND
@@ -314,7 +314,7 @@ SELECT assert(
         metrics_type IS NULL AND
         training_metrics IS NULL AND
         array_upper(training_loss, 1) = 1 AND
-        array_upper(time_iter, 1) = 1 AND
+        array_upper(metrics_elapsed_time, 1) = 1 AND
         validation_metrics_final IS NULL AND
         validation_loss_final  >= 0  AND
         validation_metrics IS NULL AND

[madlib] 02/02: DL: Record metrics_elapsed_time in model summary table

Reply via email to