AutonomyLab
diff --git a/‎code/autoencoder_model/gifs/vid_17.gif‎
-540 KB b/‎code/autoencoder_model/gifs/vid_17.gif‎
-540 KB
diff --git a/‎code/autoencoder_model/gifs/vid_18.gif‎
-551 KB b/‎code/autoencoder_model/gifs/vid_18.gif‎
-551 KB
diff --git a/‎code/autoencoder_model/scripts/attention_autoencoder.py‎
Lines changed: 42 additions & 71 deletions b/‎code/autoencoder_model/scripts/attention_autoencoder.py‎
Lines changed: 42 additions & 71 deletions
diff --git a/‎code/autoencoder_model/scripts/config_aa.py‎
Lines changed: 2 additions & 2 deletions b/‎code/autoencoder_model/scripts/config_aa.py‎
Lines changed: 2 additions & 2 deletions
diff --git a/‎code/autoencoder_model/scripts/config_aa.pyc‎
-3 Bytes b/‎code/autoencoder_model/scripts/config_aa.pyc‎
-3 Bytes
diff --git a/‎code/autoencoder_model/scripts/config_oc.py‎
Lines changed: 19 additions & 21 deletions b/‎code/autoencoder_model/scripts/config_oc.py‎
Lines changed: 19 additions & 21 deletions
diff --git a/‎code/autoencoder_model/scripts/config_r10.py‎
Lines changed: 114 additions & 0 deletions b/‎code/autoencoder_model/scripts/config_r10.py‎
Lines changed: 114 additions & 0 deletions
diff --git a/‎code/autoencoder_model/scripts/config_vm.py‎
Lines changed: 22 additions & 5 deletions b/‎code/autoencoder_model/scripts/config_vm.py‎
Lines changed: 22 additions & 5 deletions
@@ -51,90 +51,45 @@
 import os
 
 
-# def encoder_model():
-#     model = Sequential()
-#
-#     # 10x128x128
-#     model.add(Conv3D(filters=128,
-#                      strides=(1, 4, 4),
-#                      kernel_size=(3, 11, 11),
-#                      padding='same',
-#                      input_shape=(int(VIDEO_LENGTH/2), 128, 128, 3)))
-#     model.add(TimeDistributed(BatchNormalization()))
-#     model.add(TimeDistributed(LeakyReLU(alpha=0.2)))
-#     model.add(TimeDistributed(Dropout(0.5)))
-#
-#     # 10x32x32
-#     model.add(Conv3D(filters=64,
-#                      strides=(1, 2, 2),
-#                      kernel_size=(3, 5, 5),
-#                      padding='same'))
-#     model.add(TimeDistributed(BatchNormalization()))
-#     model.add(TimeDistributed(LeakyReLU(alpha=0.2)))
-#     model.add(TimeDistributed(Dropout(0.5)))
-#
-#     # 10x16x16
-#     model.add(Conv3D(filters=64,
-#                      strides=(1, 1, 1),
-#                      kernel_size=(3, 3, 3),
-#                      padding='same'))
-#     model.add(TimeDistributed(BatchNormalization()))
-#     model.add(TimeDistributed(LeakyReLU(alpha=0.2)))
-#     model.add(TimeDistributed(Dropout(0.5)))
-#
-#     return model
-
-
 def encoder_model():
-    inputs = Input(shape=(int(VIDEO_LENGTH / 2), 128, 128, 3))
+    model = Sequential()
 
     # 10x128x128
-    conv_1 = TimeDistributed(Conv2D(filters=64,
-                            strides=(4, 4),
-                            kernel_size=(11, 11),
-                            padding='same'))(inputs)
-    x = TimeDistributed(BatchNormalization())(conv_1)
-    x = TimeDistributed(LeakyReLU(alpha=0.2))(x)
-    x = TimeDistributed(Dropout(0.4))(x)
+    model.add(Conv3D(filters=128,
+                     strides=(1, 4, 4),
+                     kernel_size=(3, 11, 11),
+                     padding='same',
+                     input_shape=(int(VIDEO_LENGTH/2), 128, 128, 3)))
+    model.add(TimeDistributed(BatchNormalization()))
+    model.add(TimeDistributed(LeakyReLU(alpha=0.2)))
+    model.add(TimeDistributed(Dropout(0.5)))
 
     # 10x32x32
-    conv_2 = TimeDistributed(Conv2D(filters=128,
-                     strides=(2, 2),
-                     kernel_size=(5, 5),
-                     padding='same'))(x)
-    x = TimeDistributed(BatchNormalization())(conv_2)
-    x = TimeDistributed(LeakyReLU(alpha=0.2))(x)
-    out_2 = TimeDistributed(Dropout(0.5))(x)
+    model.add(Conv3D(filters=64,
+                     strides=(1, 2, 2),
+                     kernel_size=(3, 5, 5),
+                     padding='same'))
+    model.add(TimeDistributed(BatchNormalization()))
+    model.add(TimeDistributed(LeakyReLU(alpha=0.2)))
+    model.add(TimeDistributed(Dropout(0.5)))
 
     # 10x16x16
-    conv_3 = TimeDistributed(Conv2D(filters=128,
-                     strides=(1, 1),
-                     kernel_size=(3, 3),
-                     padding='same'))(out_2)
-    x = TimeDistributed(BatchNormalization())(conv_3)
-    x = TimeDistributed(LeakyReLU(alpha=0.2))(x)
-    in_rep = TimeDistributed(Dropout(0.5))(x)
-
-    # res_1 = concatenate([out_2, in_rep])
-    #
-    # clstm_1 = ConvLSTM2D(filters=1,
-    #                      kernel_size=(3, 3),
-    #                      strides=(1, 1),
-    #                      padding='same',
-    #                      return_sequences=False,
-    #                      activation='relu',
-    #                      recurrent_dropout=0.2)(res_1)
-    # tr_in = add([in_rep, clstm_1])
-    model = Model(inputs=inputs, outputs=in_rep)
+    model.add(Conv3D(filters=64,
+                     strides=(1, 1, 1),
+                     kernel_size=(3, 3, 3),
+                     padding='same'))
+    model.add(TimeDistributed(BatchNormalization()))
+    model.add(TimeDistributed(LeakyReLU(alpha=0.2)))
+    model.add(TimeDistributed(Dropout(0.5)))
 
     return model
 
 
 def decoder_model():
-    inputs = Input(shape=(int(VIDEO_LENGTH/2), 16, 16, 128))
+    inputs = Input(shape=(int(VIDEO_LENGTH/2), 16, 16, 64))
 
     # 10x16x16
-    convlstm_1 = ConvLSTM2D(filters=128,
+    convlstm_1 = ConvLSTM2D(filters=64,
                             kernel_size=(3, 3),
                             strides=(1, 1),
                             padding='same',
@@ -192,13 +147,29 @@ def decoder_model():
     h_4 = TimeDistributed(LeakyReLU(alpha=0.2))(x)
     out_4 = UpSampling3D(size=(1, 2, 2))(h_4)
 
+    aclstm_1 = ConvLSTM2D(filters=1,
+                          kernel_size=(3, 3),
+                          strides=(1, 1),
+                          padding='same',
+                          return_sequences=True,
+                          recurrent_dropout=0.2)(h_4)
+    x = TimeDistributed(BatchNormalization())(aclstm_1)
+    flat_1 = TimeDistributed(Flatten())(x)
+    dense_1 = TimeDistributed(Dense(units=128 * 128, activation='softmax'))(flat_1)
+    x = TimeDistributed(BatchNormalization())(dense_1)
+    x = TimeDistributed(Dropout(0.2))(x)
+    print (x.shape)
+    a1_reshape = Reshape(target_shape=(int(VIDEO_LENGTH/2), 128, 128, 1))(x)
+    a1 = AttnLossLayer()(a1_reshape)
+    dot_1 = multiply([out_4, a1])
+
     # 10x128x128
     convlstm_5 = ConvLSTM2D(filters=3,
                             kernel_size=(3, 3),
                             strides=(1, 1),
                             padding='same',
                             return_sequences=True,
-                            recurrent_dropout=0.2)(out_4)
+                            recurrent_dropout=0.2)(dot_1)
     predictions = TimeDistributed(Activation('tanh'))(convlstm_5)
 
     model = Model(inputs=inputs, outputs=predictions)
 
@@ -29,8 +29,8 @@
 
 VAL_DATA_DIR= '/local_home/JAAD_Dataset/iros/resized_imgs_128/val/'
 
-TEST_DATA_DIR= '/local_home/JAAD_Dataset/iros/resized_imgs_128/test/'
-# TEST_DATA_DIR= '/local_home/JAAD_Dataset/fun_experiments/resized/'
+# TEST_DATA_DIR= '/local_home/JAAD_Dataset/iros/resized_imgs_128/test/'
+TEST_DATA_DIR= '/local_home/JAAD_Dataset/fun_experiments/resized/'
 
 MODEL_DIR = './../' + path_var + 'models'
 if not os.path.exists(MODEL_DIR):
 
@@ -21,12 +21,12 @@
 else:
     path_var = 'zhora/'
 
-DATA_DIR= '/local_home/JAAD_Dataset/iros/resized_imgs_128/train/'
+DATA_DIR= '/local_home/JAAD_Dataset/iros/resized_imgs_208/train/'
 # DATA_DIR= '/local_home/data/KITTI_data/'
 
-TEST_DATA_DIR= '/local_home/JAAD_Dataset/iros/resized_imgs_128/test/'
+TEST_DATA_DIR= '/local_home/JAAD_Dataset/iros/resized_imgs_208/test/'
 
-VAL_DATA_DIR= '/local_home/JAAD_Dataset/iros/resized_imgs_128/val/'
+VAL_DATA_DIR= '/local_home/JAAD_Dataset/iros/resized_imgs_208/val/'
 
 PRETRAINED_C3D= '/home/pratik/git_projects/c3d-keras/models/sports1M_weights_tf.json'
 PRETRAINED_C3D_WEIGHTS= '/home/pratik/git_projects/c3d-keras/models/sports1M_weights_tf.h5'
@@ -73,35 +73,33 @@
 SAVE_GENERATED_IMAGES = True
 SHUFFLE = True
 VIDEO_LENGTH = 16
-IMG_SIZE = (128, 128, 3)
+IMG_SIZE = (128, 208, 3)
 VIS_ATTN = True
-ATTN_COEFF = 0
-# KL coeff damages learning
-KL_COEFF = 0
 CLASSIFIER = True
 BUF_SIZE = 10
 LOSS_WEIGHTS = [1, 1]
 A_TRAIN_RATIO = 1
 C_TRAIN_RATIO = 1
 RAM_DECIMATE = False
-RETRAIN_CLASSIFIER = True
+RETRAIN_CLASSIFIER = False
 CLASS_TARGET_INDEX = 8
 
-ped_actions = ['slow down', 'moving slow', 'standing', 'stopped',
-               'speed up', 'moving fast', 'look', 'looking',  'clear path',
-               'crossing', 'nod', 'handwave', 'unknown']
+
+# ped_actions = ['standing 0', 'moving slow 1', 'moving fast 2', 'look 3', 'looking 4',
+#                'slow down 5', 'speed up 6', 'crossing 7', 'stopped 8', 'clear path 9',
+#                 'nod 10', 'handwave 11', 'unknown 12']
+ped_actions = ['standing', 'moving slow', 'moving fast', 'look', 'looking',
+               'slow down', 'speed up', 'crossing', 'stopped', 'clear path',
+                'nod', 'handwave', 'unknown']
 # simple_ped_set = ['moving slow', 'stopped', 'moving fast', 'looking', 'clear path', 'crossing',
 #                   'handwave', 'unknown']
 
-simple_ped_set = ['crossing', 'stopped', 'looking', 'clear path', 'unknown']
+# simple_ped_set = ['crossing', 'stopped', 'looking', 'clear path', 'unknown']
+
+# simple_ped_set = ['standing 0', 'approaching 1', 'looking 2', 'crossing 3', 'stopped 4', 'clear path 5', 'unknown 6']
+simple_ped_set = ['standing', 'approaching', 'looking', 'crossing', 'stopped', 'clear path', 'unknown']
+
 
-# ped_actions = ['slow down 0', 'moving slow 1', 'standing 2', 'stopped 3',
-#                'speed up 4', 'moving fast 5', 'look 6', 'looking 7',  'clear path 8',
-#                'crossing 9', 'nod 10', 'handwave 11', 'unknown 12']
-#
-#
-# simple_ped_set = ['moving slow 0', 'stopped 1', 'moving fast 2', 'looking 3', 'clear path 4', 'crossing 5',
-#                   'handwave 6', 'unknown 7']
 
 
 
@@ -128,8 +126,8 @@
 BATCH_SIZE = 25
 NB_EPOCHS_CLASS = 100
 
-# OPTIM_C = Adam(lr=0.0000002, beta_1=0.5)
-OPTIM_C = SGD(lr=0.0001, momentum=0.9, nesterov=True)
+OPTIM_C = Adam(lr=0.0000002, beta_1=0.5)
+# OPTIM_C = SGD(lr=0.0001, momentum=0.9, nesterov=True)
 
 # lr_schedule = [10, 20, 30]  # epoch_step
 
 
@@ -0,0 +1,114 @@
+from __future__ import absolute_import
+from __future__ import division
+from __future__ import print_function
+
+from keras.optimizers import SGD
+from keras.optimizers import Adam
+from keras.optimizers import adadelta
+from keras.optimizers import rmsprop
+from keras.layers import Layer
+from keras import backend as K
+K.set_image_dim_ordering('tf')
+import socket
+import os
+
+# -------------------------------------------------
+# Background config:
+hostname = socket.gethostname()
+if hostname == 'baymax':
+    path_var = 'baymax/'
+elif hostname == 'walle':
+    path_var = 'walle/'
+elif hostname == 'bender':
+    path_var = 'bender/'
+else:
+    path_var = 'zhora/'
+
+DATA_DIR= '/local_home/JAAD_Dataset/iros/resized_imgs_208/train/'
+# DATA_DIR= '/local_home/data/KITTI_data/'
+
+VAL_DATA_DIR= '/local_home/JAAD_Dataset/iros/resized_imgs_208/val/'
+
+TEST_DATA_DIR= '/local_home/JAAD_Dataset/iros/resized_imgs_208/test/'
+# TEST_DATA_DIR= '/local_home/JAAD_Dataset/fun_experiments/resized/'
+
+MODEL_DIR = './../' + path_var + 'models'
+if not os.path.exists(MODEL_DIR):
+    os.mkdir(MODEL_DIR)
+
+CHECKPOINT_DIR = './../' + path_var + 'checkpoints'
+if not os.path.exists(CHECKPOINT_DIR):
+    os.mkdir(CHECKPOINT_DIR)
+
+ATTN_WEIGHTS_DIR = './../' + path_var + 'attn_weights'
+if not os.path.exists(ATTN_WEIGHTS_DIR):
+    os.mkdir(ATTN_WEIGHTS_DIR)
+
+GEN_IMAGES_DIR = './../' + path_var + 'generated_images'
+if not os.path.exists(GEN_IMAGES_DIR):
+    os.mkdir(GEN_IMAGES_DIR)
+
+LOG_DIR = './../' + path_var + 'logs'
+if not os.path.exists(LOG_DIR):
+    os.mkdir(LOG_DIR)
+
+TF_LOG_DIR = './../' + path_var + 'tf_logs'
+if not os.path.exists(TF_LOG_DIR):
+    os.mkdir(TF_LOG_DIR)
+
+TEST_RESULTS_DIR = './../' + path_var + 'test_results'
+if not os.path.exists(TEST_RESULTS_DIR):
+    os.mkdir(TEST_RESULTS_DIR)
+
+PRINT_MODEL_SUMMARY = True
+SAVE_MODEL = True
+PLOT_MODEL = True
+SAVE_GENERATED_IMAGES = True
+SHUFFLE = True
+VIDEO_LENGTH = 20
+IMG_SIZE = (128, 208, 3)
+ATTN_COEFF = 0
+KL_COEFF = 0
+RAM_DECIMATE = True
+
+# -------------------------------------------------
+# Network configuration:
+print ("Loading network/training configuration.")
+print ("Config file: " + str(__name__))
+
+BATCH_SIZE = 10
+NB_EPOCHS_AUTOENCODER = 40
+
+OPTIM_A = Adam(lr=0.0001, beta_1=0.5)
+# OPTIM_A = SGD(lr=0.000001, momentum=0.5, nesterov=True)
+# OPTIM_A = rmsprop(lr=0.00001)
+
+lr_schedule = [10, 20, 30]  # epoch_step
+
+def schedule(epoch_idx):
+    if (epoch_idx + 1) < lr_schedule[0]:
+        return 0.0001
+    elif (epoch_idx + 1) < lr_schedule[1]:
+        return 0.0001  # lr_decay_ratio = 10
+    elif (epoch_idx + 1) < lr_schedule[2]:
+        return 0.0001
+    return 0.0001
+
+ # aclstm_1 = ConvLSTM2D(filters=1,
+    #                       kernel_size=(3, 3),
+    #                       strides=(1, 1),
+    #                       padding='same',
+    #                       return_sequences=True,
+    #                       recurrent_dropout=0.2)(h_4)
+    # x = TimeDistributed(BatchNormalization())(aclstm_1)
+    #
+    # flat_1 = TimeDistributed(Flatten())(x)
+    # dense_1 = TimeDistributed(Dense(units=128 * 208, activation='softmax'))(flat_1)
+    # x = TimeDistributed(BatchNormalization())(dense_1)
+    # x = TimeDistributed(Dropout(0.2))(x)
+    # print (x.shape)
+    # a1_reshape = Reshape(target_shape=(int(VIDEO_LENGTH/2), 128, 208, 1))(x)
+    # a1 = AttnLossLayer()(a1_reshape)
+    # dot_1 = multiply([out_4, a1])
+
+
@@ -24,13 +24,13 @@
 else:
     path_var = 'zhora/'
 
-DATA_DIR= '/local_home/JAAD_Dataset/iros/resized_imgs_128/train/'
+DATA_DIR= '/local_home/JAAD_Dataset/iros/resized_imgs_208/train/'
 # DATA_DIR= '/local_home/data/KITTI_data/'
 
-VAL_DATA_DIR= '/local_home/JAAD_Dataset/iros/resized_imgs_128/val/'
+VAL_DATA_DIR= '/local_home/JAAD_Dataset/iros/resized_imgs_208/val/'
 
-TEST_DATA_DIR= '/local_home/JAAD_Dataset/iros/resized_imgs_128/test/'
-# TEST_DATA_DIR= '/local_home/JAAD_Dataset/fun_experiments/resized/'
+# TEST_DATA_DIR= '/local_home/JAAD_Dataset/iros/resized_imgs_208/test/'
+TEST_DATA_DIR= '/local_home/JAAD_Dataset/fun_experiments/resized/'
 
 MODEL_DIR = './../' + path_var + 'models'
 if not os.path.exists(MODEL_DIR):
@@ -66,7 +66,7 @@
 SAVE_GENERATED_IMAGES = True
 SHUFFLE = True
 VIDEO_LENGTH = 32
-IMG_SIZE = (128, 128, 3)
+IMG_SIZE = (128, 208, 3)
 ATTN_COEFF = 0
 KL_COEFF = 0
 RAM_DECIMATE = False
@@ -94,4 +94,21 @@ def schedule(epoch_idx):
         return 0.0001
     return 0.0001
 
+ # aclstm_1 = ConvLSTM2D(filters=1,
+    #                       kernel_size=(3, 3),
+    #                       strides=(1, 1),
+    #                       padding='same',
+    #                       return_sequences=True,
+    #                       recurrent_dropout=0.2)(h_4)
+    # x = TimeDistributed(BatchNormalization())(aclstm_1)
+    #
+    # flat_1 = TimeDistributed(Flatten())(x)
+    # dense_1 = TimeDistributed(Dense(units=128 * 208, activation='softmax'))(flat_1)
+    # x = TimeDistributed(BatchNormalization())(dense_1)
+    # x = TimeDistributed(Dropout(0.2))(x)
+    # print (x.shape)
+    # a1_reshape = Reshape(target_shape=(int(VIDEO_LENGTH/2), 128, 208, 1))(x)
+    # a1 = AttnLossLayer()(a1_reshape)
+    # dot_1 = multiply([out_4, a1])
+