[add] Add first lab files

949ccf6b · Simone Rossi · 949ccf6b · 949ccf6b · 949ccf6b · 949ccf6b
Commit 949ccf6b authored 6 years ago by Simone Rossi
--- a/DL_lab1/Data/mnist.pkl.gz
+++ b/DL_lab1/Data/mnist.pkl.gz
--- a/DL_lab1/Lab1_DL-Students_2019.ipynb
+++ b/DL_lab1/Lab1_DL-Students_2019.ipynb
--- a/DL_lab1/NeuralNetwork.py
+++ b/DL_lab1/NeuralNetwork.py
+import time
+import numpy as np
+from utils import *
+from transfer_functions import *
+
+SEED = 12345
+np.random.seed(seed=SEED)
+
+class NeuralNetwork(object):
+    
+    def __init__(self, input_layer_size, hidden_layer_size, output_layer_size, transfer_f=sigmoid, transfer_df=dsigmoid):
+        """
+        input_layer_size: number of input neurons
+        hidden_layer_size: number of hidden neurons
+        output_layer_size: number of output neurons
+        iterations: number of iterations
+        learning_rate: initial learning rate
+        """
+
+        # initialize transfer functions
+        self.transfer_f = transfer_f
+        self.transfer_df = transfer_df
+
+        # initialize layer sizes
+        self.input_layer_size = input_layer_size+1  # +1 for the bias node in the input Layer
+        self.hidden_layer_size = hidden_layer_size+1 # +1 for the bias node in the hidden layer 
+        self.output_layer_size = output_layer_size
+
+        # initialize arrays for inputs
+        self.input = np.ones((1, self.input_layer_size))
+
+        # initialize arrays for activations
+        self.u_hidden = np.zeros((1, self.hidden_layer_size-1))
+        self.u_output = np.zeros((1, self.output_layer_size))
+
+        # initialize arrays for outputs
+        self.o_hidden = np.ones((1, self.hidden_layer_size))
+        self.o_output = np.ones((1, self.output_layer_size))
+
+        # initialize arrays for partial derivatives according to activations
+        self.dL_du_hidden = np.zeros((1, self.hidden_layer_size-1))
+        self.dL_du_output = np.zeros((1, self.output_layer_size))
+
+        # create randomized weights Yann LeCun method in 1988's paper ( Default values)
+        input_range = 1.0 / self.input_layer_size ** (1/2)
+        self.W_input_to_hidden = np.random.normal(loc = 0, scale = input_range, size =(self.input_layer_size, self.hidden_layer_size-1))
+        self.W_hidden_to_output = np.random.uniform(size = (self.hidden_layer_size, self.output_layer_size)) / np.sqrt(self.hidden_layer_size)
+
+    def weights_init(self,wi=None,wo=None):
+        input_range = 1.0 / self.input_layer_size ** (1/2)
+        if wi is not None:
+            self.W_input_to_hidden = wi # weights between input and hidden layers
+        else:
+            self.W_input_to_hidden = np.random.normal(loc = 0, scale = input_range, size =(self.input_layer_size, self.hidden_layer_size-1))
+        if wo is not None:
+            self.W_hidden_to_output = wo # weights between hidden and output layers
+        else:
+            self.W_hidden_to_output = np.random.uniform(size = (self.hidden_layer_size, self.output_layer_size)) / np.sqrt(self.hidden_layer_size)
+
+    def train(self, data, validation_data, iterations=50, learning_rate=5.0, verbose=False):
+        start_time = time.time()
+        training_accuracies = []
+        validation_accuracies = []
+        errors = []
+        inputs  = data[0]
+        targets = data[1]
+        best_val_acc = 100*self.predict(validation_data)/len(validation_data[0])
+        best_i2h_W = self.W_input_to_hidden
+        best_h2o_W = self.W_hidden_to_output
+        for it in range(iterations):
+            self.feedforward(inputs)
+            self.backpropagate(targets, learning_rate=learning_rate)
+            error = targets - self.o_output
+            error *= error
+            training_accuracies.append(100*self.predict(data)/len(data[0]))
+            validation_accuracies.append(100*self.predict(validation_data)/len(validation_data[0]))
+            if validation_accuracies[-1] > best_val_acc:
+                best_i2h_W = self.W_input_to_hidden
+                best_h2o_W = self.W_hidden_to_output
+            if verbose:
+                print("[Iteration %2d/%2d]  -Training_Accuracy:  %2.2f %%  -Validation_Accuracy: %2.2f %%  -time: %2.2f " %(it+1, iterations,
+                                                            training_accuracies[-1], validation_accuracies[-1], time.time() - start_time))
+                print("    - MSE:", np.sum(error)/len(targets))
+        print("Training time:", time.time()-start_time)
+        plot_train_val(range(1, iterations+1), training_accuracies, validation_accuracies, "Accuracy")
+       
+    def train_xe(self, data, validation_data, iterations=50, learning_rate=5.0, verbose=False):
+        start_time = time.time()
+        training_accuracies = []
+        validation_accuracies = []
+        errors = []
+        xes = []
+        inputs  = data[0]
+        targets = data[1]
+        best_val_acc = 100*self.predict(validation_data)/len(validation_data[0])
+        best_i2h_W = self.W_input_to_hidden
+        best_h2o_W = self.W_hidden_to_output
+        for it in range(iterations):
+            self.feedforward_xe(inputs)
+            self.backpropagate_xe(targets, learning_rate=learning_rate)
+            xe = targets*np.log(self.o_output)*(-1)
+            error = targets - self.o_output
+            error *= error
+            training_accuracies.append(100*self.predict(data)/len(data[0]))
+            validation_accuracies.append(100*self.predict(validation_data)/len(validation_data[0]))
+            if validation_accuracies[-1] > best_val_acc:
+                best_i2h_W = self.W_input_to_hidden
+                best_h2o_W = self.W_hidden_to_output
+            if verbose:
+                print("[Iteration %2d/%2d]  -Training_Accuracy:  %2.2f %%  -Validation_Accuracy: %2.2f %%  -time: %2.2f " %(it+1, iterations,
+                                                            training_accuracies[-1], validation_accuracies[-1], time.time() - start_time))
+                print("    - MSE:", np.sum(error)/len(targets))
+                print("    - X-Entropy:", np.sum(xe)/len(targets))
+        print("Training time:", time.time()-start_time)
+        self.W_input_to_hidden = best_i2h_W
+        self.W_hidden_to_output = best_h2o_W
+        plot_train_val(range(1, iterations+1), training_accuracies, validation_accuracies, "Accuracy")
+
+    def predict(self, test_data):
+        """ Evaluate performance by counting how many examples in test_data are correctly 
+            evaluated. """
+        self.feedforward(test_data[0])
+        answer = np.argmax(test_data[1], axis=1)
+        prediction = np.argmax(self.o_output, axis=1)
+        count = len(test_data[0]) - np.count_nonzero(answer - prediction)
+        return count 
+
--- a/DL_lab1/Nimages/.ipynb_checkpoints/NN-checkpoint.png
+++ b/DL_lab1/Nimages/.ipynb_checkpoints/NN-checkpoint.png
--- a/DL_lab1/Nimages/NN.png
+++ b/DL_lab1/Nimages/NN.png
--- a/DL_lab1/Nimages/_NN.png
+++ b/DL_lab1/Nimages/_NN.png
--- a/DL_lab1/Nimages/mnist.png
+++ b/DL_lab1/Nimages/mnist.png
--- a/DL_lab1/transfer_functions.py
+++ b/DL_lab1/transfer_functions.py
+# transfer functions
+
+
+import numpy as np
+
+def sigmoid(x):
+    return 1 / (1 + np.exp(-x))
+
+# derivative of sigmoid
+
+def dsigmoid(x):
+    y = sigmoid(x)
+    return y * (1.0 - y)
+
+
+def tanh(x):
+    return np.tanh(x)
+
+# derivative of tanh
+
+def dtanh(x):
+    y = tanh(x)
+    return 1 - y*y
+
+
+def identity(x):
+    return x
+
+# derivative of identity
+
+def didentity(x):
+    return np.ones(x.shape)
+
+
+def relu(x):
+    return (x + np.sign(x)*x)/2
+
+# derivative of relu
+
+def drelu(x):
+    return (1 + np.sign(x))/2
+
+def softmax(x):
+    K = np.tile(np.reshape(np.sum(np.exp(x), axis=1), [x.shape[0], 1]), [1, x.shape[1]])
+    return np.exp(x)/K
\ No newline at end of file
--- a/DL_lab1/utils.py
+++ b/DL_lab1/utils.py
+import numpy as np
+import gzip
+import pickle
+import matplotlib.pyplot as plt
+
+
+def load_data():
+    np.random.seed(1990)
+    print("Loading MNIST data .....")
+
+    # Load the MNIST dataset
+    with gzip.open('Data/mnist.pkl.gz', 'r') as f:
+        # u = pickle._Unpickler(f)
+        # u.encoding = 'latin1'
+        # train_set, valid_set, test_set = u.load()
+        train_set, valid_set, test_set = pickle.load(f, encoding='latin1')
+        train_set = [train_set[0].tolist(), [[1 if j == train_set[1][i] else 0 for j in range(10)] for i in np.arange(len(train_set[0]))]]
+        valid_set = [valid_set[0].tolist(), [[1 if j == valid_set[1][i] else 0 for j in range(10)] for i in np.arange(len(valid_set[0]))]]
+        test_set = [test_set[0].tolist(), [[1 if j == test_set[1][i] else 0 for j in range(10)] for i in np.arange(len(test_set[0]))]]
+    print("Done.")
+    return train_set, valid_set, test_set
+
+   
+def plot_curve(t,s,metric):
+    plt.plot(t, s)
+    plt.ylabel(metric) # or ERROR
+    plt.xlabel('Epoch')
+    plt.title('Learning Curve_'+str(metric))
+    #curve_name=str(metric)+"LC.png"
+    #plt.savefig(Figures/curve_name)
+    plt.show()
+    
+def plot_train_val(t, st, sv, metric):
+    plt.plot(t, st, label='Accuracy on training set')
+    plt.plot(t, sv, label='Accuracy on validation set')
+    plt.ylabel(metric) # or ERROR
+    plt.xlabel('Epoch')
+    plt.title('Learning Curve: '+str(metric))
+    #curve_name=str(metric)+"LC.png"
+    #plt.savefig(Figures/curve_name)
+    plt.show()
+