Obiettivi Formativi

Consentire l’apprendimento delle principali tecniche per l’analisi dei dati mirate alla raccolta, analisi ed interpretazione statistica dei dati ed all’estrapolazione delle informazioni. I contenuti sono presentati allo studente seguendo un approccio orientato al problem solving al fine di sviluppare le conoscenze algoritmiche e le competenze utili per valutare le strategie necessarie alla risoluzione di problemi specifici dell’ingegneria. Far acquisire adeguate competenze per la comprensione dell’analisi dei dati e per modellare, analizzare e risolvere problemi dell’ingegneria attraverso un’analisi strutturata e sapendo utilizzare le conoscenze informatiche e statistiche acquisite. Verranno trattati gli aspetti dell’apprendimento supervisionato e non supervisionato mediante lo studio delle basi teoriche e la loro applicazione a problemi reali. Il corso intende fornire anche agli studenti le capacità pratiche per l’utilizzo dei principali ambienti di sviluppo di algoritmi di machine learning. Far acquisire la capacità di individuare autonomamente i principali tools per l’analisi dei dati, individuare appropriati metodi di modellazione e trarre conclusioni anche attraverso l'integrazione delle conoscenze acquisite con appropriate indagini bibliografiche tali da consentire un confronto critico tra le diverse soluzioni possibili. Far acquisire la capacità di interloquire con linguaggio tecnico appropriato alla disciplina. Far acquisire la capacità di un adeguato metodo di studio logico-deduttivo, al fine di consentire autonomamente l'approfondimento delle conoscenze e di e affrontare gli studi successivi all'ingegneria.

Learning Goals

To allow the learning of the main techniques for data analysis aimed at the collection, analysis and statistical interpretation of data and the extrapolation of information. The contents are presented to the student following a problem-oriented approach in order to develop algorithmic knowledge and skills useful for evaluating the strategies necessary for solving specific engineering problems. To acquire adequate skills for understanding data analysis and for modelling, analysing and solving engineering problems through structured analysis and understanding how to use the acquired algorithmic and statistical knowledge. The aspects of supervised and unsupervised learning will be treated through the study of the theoretical bases and their application to real problems. The course also aims to provide students with the practical skills for using the main software environments for the development of machine learning algorithms. To acquire the ability to independently identify the main tools for data analysis, identify appropriate modelling methods and draw conclusions also through the integration of the knowledge acquired with appropriate bibliographic investigations such as to allow a critical comparison between the different possible solutions. To acquire the ability to speak with technical language appropriate to the discipline. To acquire the ability of an appropriate logical-deductive study method, in order to allow the deepening of knowledge autonomously and to face subsequent studies in engineering.

Metodi didattici

Il corso, al fine di raggiungere gli obiettivi formativi previsti, si svolge prevalentemente attraverso lezioni frontali. Sono inoltre previste esercitazioni in aula ed esercitazioni guidate svolte dagli studenti con lo scopo di stimolare l’approccio ai problemi con autonomia e senso critico. Tutte le attività sono svolte con supporto di lavagna digitale (tablet) e computer per la parte di programmazione.

Teaching Methods

The course, in order to achieve the expected objectives, mainly takes place through lectures. There are also practical based lessons in the classroom and guided exercises with teacher support with the aim of stimulating the approach to problem solving with autonomy and a critical thinking. All activities are carried out with the support of a digital board (tablet) and a computer for the programming activities.


Conoscenze di statistica (concetti di probabilità, momenti statistici, variabili casuali) Conoscenze di algebra lineare (operazioni matriciali)


Knowledge in statistics (concepts of probability, statistic moments, random variables) Knowledge in linear algebra (matrix operations)

Verifiche dell'apprendimento

L'esame consiste nella presentazione di un progetto. Il progetto da elaborare viene concordato con il docente e consiste nella scelta di un problema e di un relativo dataset e nella successiva applicazione di alcune delle tecniche apprese durante il corso per la risoluzione del problema. Durante la presentazione del progetto saranno chiesti eventuali approfondimenti sugli argomenti trattati durante il corso (definizioni, esempi rilevanti, applicazioni, collegamenti tra i vari argomenti…) con il duplice scopo di verificare il livello di conoscenza e di comprensione dei contenuti del corso e di valutare l'autonomia di giudizio, la capacità di apprendimento, l'abilità comunicativa e la proprietà di linguaggio scientifico e indi valutare le facoltà logico-deduttive acquisite dallo studente. La valutazione è fatta in trentesimi.


The exam consists in the presentation of a project. The project to be developed is agreed with the teacher and consists in the choice of a problem and a related dataset and in the subsequent application of some of the techniques learned during the course for the resolution of the problem. During the presentation of the project, any further information on the topics covered during the course will be asked (definitions, relevant examples, applications, links between the various topics ...) with the dual purpose of verifying the level of knowledge and understanding of the course contents and of evaluating the autonomy of judgment, the ability to learn, the communicative ability and the property of scientific language and then evaluate the logical-deductive faculties acquired by the student. The evaluation is made out of thirty.

Programma del Corso

-INTRODUZIONE ALL’ANALISI DEI DATI: Raccolta ed immagazzinamento dei dati. Big Data. Il machine learning. Il concetto di data set. Exploratory Data Analysis. Apprendimento supervisionato e non-supervisionato. Interpretazione statistica dei dati. Panoramica dei principali tool per l’analisi dei dati. -IL LINGUAGGIO PYTHON: Introduzione alla programmazione. Costrutti di base. I notebook e l’ambiente Jupyter. Librerie per l’analisi dei dati. -LA REGRESSIONE: La regressione lineare. Regressione univariata. Regressione multivariata. Funzione di costo. Training e testing. Regressione come problema di ottimizzazione. L’algoritmo Gradient Descent. Normal equation. Regressione polinomiale. -LA CLASSIFICAZIONE: Classificazione binaria e multi-classe. Logistic regression. Funzione di costo. Decision boundary. Esempi di Classificazione. MNIST dataset. IRIS dataset. Accuratezza. Precision, Recall. Indice F1. Classificazione Softmax. -ANALISI DEGLI ALGORITMI: Capacità di un modello. Underfitting e Overfitting. Learning curves. Regolarizzazione. Scelta dei parametri di un modello. Cross validation. -ALGORITMI SUPERVISIONATI: K-nearest neighbors. Alberi decisionali. Random forest. -ALGORITMI NON-SUPERVISIONATI: Clustering. K-means. -RIDUZIONE DELLA DIMENSIONALITÀ: Visualizzazione. Compressione. L’algoritmo PCA. -LE RETI NEURALI: Il modello di neurone. Il Percettrone. Percettrone multi-strato. L’algoritmo di Back Propagation. Funzioni di attivazione. Regressione e classificazione con le reti neurali. - INTRODUZIONE AL DEEP LEARNING: Il concetto di Deep Learning. Le reti neurali convoluzionali. Le reti neurali ricorrenti.

Course Syllabus

-INTRODUCTION TO DATA ANLYSIS: Data collection and storing. Big Data. The machine learning. The data-set concept. Exploratory Data Analysis. Supervised learning. Unsupervised learning. A statistic approach to data. An overview of the main data analysis tools. -THE PYTHON LANGUAGE: Programming basics. Main constructs. Notebooks and the Jupyter environment. Data analysis libraries. -REGRESSION: Linear regression. Univariate regression. Multivariate regression. Cost function. Training and testing. Optimization problems. The Gradient descent algorithm. Normal equation. Polynomial regression. -CLASSIFICATION: Bynary and multi-class classifications. Logistic regression. Cost function. Decision boundary. Classification examples. MNIST dataset. IRIS dataset. Accuracy. Precision, Recall. F1 Score. Softmax Classification. -ALGORITHM ANALYSIS: Model capacity. Underfitting and Overfitting. Learning curves. Regularization. Model tuning. Cross validation. -SUPERVISED ALGORITHMS: K-nearest neighbors. Decision trees. Random forests. -UNSUPERVISED ALGORITHMS: Clustering. K-means. -DIMENSIONALITY REDUCTION: Visualization. Compression. The PCA algorithm. -NEURAL NETWORKS: The neuron model. The Perceptron. Multi-layer perceptron. The Back Propagation algorithm. Activation functions. Regression and Classification with Neural Networks. -DEEP LEARNING INTRODUCTION: The deep learning concept. Convolutional neural networks. Recurrent neural networks.

Testi di riferimento: Stephen Marsland – “Machine Learning An Algorithmic Perspective”, Second Edition - Chapman and Hall/CRC - ISBN: 9781466583337 Aurélien Géron – “Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow”, 2nd Edition - O'Reilly - ISBN: 9781492032649

Orario di Ricevimento - DARIO BRUNEO

GiornoOra inizioOra fineLuogo
Martedì 15:00 17:00Dipartimento di Ingegneria - 7° piano - blocco B
