Offerta Didattica

 

DATA SCIENCE

MODELLING FOR DATA ANALYSIS

Classe di corso: LM Data - Data science
AA: 2022/2023
Sedi: MESSINA
SSDTAFtipologiafrequenzamoduli
MAT/07, SECS-S/01Affine/Integrativa, CaratterizzanteLiberaLibera
CFUCFU LEZCFU LABCFU ESEOREORE LEZORE LABORE ESE
1210028460024
Legenda
CFU: n. crediti dell’insegnamento
CFU LEZ: n. cfu di lezione in aula
CFU LAB: n. cfu di laboratorio
CFU ESE: n. cfu di esercitazione
FREQUENZA:Libera/Obbligatoria
MODULI:SI - L'insegnamento prevede la suddivisione in moduli, NO - non sono previsti moduli
ORE: n. ore programmate
ORE LEZ: n. ore programmate di lezione in aula
ORE LAB: n. ore programmate di laboratorio
ORE ESE: n. ore programmate di esercitazione
SSD:sigla del settore scientifico disciplinare dell’insegnamento
TAF:sigla della tipologia di attività formativa
TIPOLOGIA:LEZ - lezioni frontali, ESE - esercitazioni, LAB - laboratorio

Obiettivi Formativi

L'obiettivo di questo corso è di approfondire l'ampia gamma di tecniche per la modellizzazione dell'analisi dei dati e di promuovere argomenti multidisciplinari in quest'area. Al termine del corso lo studente è in grado di: - identificare le sfide dietro l'analisi dei big dataset; - rilevare le caratteristiche principali del data set senza alcuna ulteriore conoscenza preventiva delle variabili coinvolte; - utilizzare software statistico rilevante per l'analisi di casi studio del mondo reale - selezionare la tecnica appropriata in base allo specifico problema di analisi dei dati da indagare; - analizzare i dati applicando la specifica tecnica di modellazione; - implementare diverse analisi statistiche e interpretare i risultati - sviluppare una valutazione critica delle implicazioni dei risultati.

Learning Goals

The objective of this course is to deeply investigate the broad range of techniques for modelling data analysis and to foster multi-disciplinary topics in this area. At the end of the course the student is able to: - identify the challenges behind the analysis of big datasets; - detect the main features of the data set without any additional prior knowledge about the involved variables; - use relevant statistical software for the analysis of real world case studies - select the appropriate technique according to the specific data analysis problem to investigate; - analyze data by applying the specific modelling technique; - implement different statistical analysis and interpret the results - develop a critical evaluation of the implications of the results.

Metodi didattici

Durante il corso saranno privilegiate lezioni frontali con modalità didattiche attive. Il corso utilizza una varietà di metodologie di apprendimento, tra cui analisi di casi di studio reali ed esercitazioni in classe. Tutte le attività sono svolte con supporto di slide delle lezioni. e l'ausilio di software scientifico.

Teaching Methods

During the course active teaching methods will be applied. The course uses a variety of learning methods including case studies analysis and in-class exercises. All activities are carried out with the support of lecture slides and by means of scientific software.

Prerequisiti

Conoscenza di algebra lineare e delle matrici calcolo differenziale e integrale, programmazione.

Prerequisites

Knowledge of linear algebra and matrices, differential and integral calculus, programming.

Verifiche dell'apprendimento

L'esame finale consiste in una prova orale volta a verificare il grado di raggiungimento degli obiettivi formativi in termini di livello di conoscenza degli argomenti teorici e capacità di impostare e risolvere problemi. Nello specifico, lo studente deve rispondere ad una serie di domande (da 3 a 6) sugli argomenti del corso e su come tali argomenti possono essere applicati in problemi pratici.

Assessment

The exam is oral and is devoted to verify the level of the achievement of the educational goals in terms of knowledge of the theoretical contents and ability to set and solve problems. Specifically, the student has to respond to a set of questions (from 3 to 6) on the topics of the course and how such topics can be applied in practical exercises.

Programma del Corso

------------------------------------------------------------ Modulo: A001847 - MATHEMATICAL METHODS AND MODELS FOR DATA SCIENCE ------------------------------------------------------------ Modellistica matematica: classificazione dei modelli matematici, implementazione di un modello dai dati, stima dei parametri. Analisi di Fourier: serie polinomiali e trigonometriche, trasformata di Fourier, trasformata veloce di Fourier, applicazioni all’analisi di segnali ed elaborazione di immagini. Elaborazione di dati e funzioni: interpolazione polinomiale, funzioni spline, fitting lineare e analisi della varianza, fitting non lineare. Ottimizzazione: problemi di minimo, convessità e metodo di Newton, moltiplicatori di Lagrange, variabili di decisione, vincoli lineari e non lineari, programmazione lineare, metodo di discesa del gradiente. Applicazioni con MATLAB. Metodi probabilistici: variabili aleatorie, distribuzioni di probabilità discrete e continue. Introduzione ai processi stocastici e alle catene di Markov. Grafi: definizione e proprietà. Catene di Markov ergodiche, algoritmo Metropolis, pagerank, clustering spettrale su grafi, relazioni nei grafi. ------------------------------------------------------------ Modulo: A001848 - STATISTICAL MODELS FOR LARGE DATASETS ------------------------------------------------------------ Schemi di osservazione, censura e probabilità Procedure non parametriche e grafiche Procedure di inferenza per Modelli Parametrici e per Distribuzioni Log-Location-Scale Modelli multivariati Errori di misura Classificazione incrociata e strutture multiple di appartenenza. Strutture di varianza complesse Analisi del livello aggregato Meta-analisi Modelli di categorie a scelta multipla Modelli per i conteggi Modelli misti discreti - risposta continua Modelli per dati di misure ripetute Dati multivariati Modelli normali latenti per dati multivariati Analisi fattoriale multilivello, equazioni strutturali e modelli di miscele Modellazione multilivello nelle indagini campionarie Strutture dati cross-classificate Dati mancanti, dati parzialmente osservati e imputazione multipla Software per la modellazione multilivello

Course Syllabus

------------------------------------------------------------ Modulo: A001847 - MATHEMATICAL METHODS AND MODELS FOR DATA SCIENCE ------------------------------------------------------------ Mathematical modelling: classification of mathematical models, construction of a model from data, tuning and parameter estimate. Fourier analysis: polynomial and trigonometric series, Fourier transform, Fast Fourier transform, applications to signal data analysis and image processing. Data and functions processing: polynomial interpolation, spline functions, linear fitting and analysis of variance, nonlinear fitting. Optimization: minimum problems, convexity and Newton's method, Lagrange multipliers, decision variables, linear and non-linear constraints, linear programming, gradient descent. Applications with MATLAB. Probabilistic methods: random variables, discrete and continuous probability distributions. Introduction to stochastic processes and Markov chains. Graphs: definition and properties. Ergodic Markov chains, Metropolis algorithm, pagerank, spectral clustering on graphs, communities in graphs. ------------------------------------------------------------ Modulo: A001848 - STATISTICAL MODELS FOR LARGE DATASETS ------------------------------------------------------------ Observation Schemes, Censoring, and Likelihood Nonparametric and Graphical Procedures Inference Procedures for Parametric Models and for Log-Location-Scale Distributions Multivariate models Measurement errors Cross-classification and multiple membership structures. Complex variance structures Aggregate level analysis Meta-analysis Multiple choice categories templates Templates for the counts Discrete mixed models - continuous response Models for repeated measures data Multivariate data Latent normal models for multivariate data Multilevel factorial analysis, structural equations and mixture models Multilevel modeling in sample surveys Cross-classified data structures Missing Data, Partially Observed Data and Multiple Imputation Software for Multilevel Modelling

Testi di riferimento: ------------------------------------------------------------ Modulo: A001847 - MATHEMATICAL METHODS AND MODELS FOR DATA SCIENCE ------------------------------------------------------------ 1) Jeff M. Phillips. Mathematical foundations for data analysis, 2019. Disponibile online all'url http://www.cs.utah.edu/~jeffp/M4D/M4D.html 2) Gilbert Strang. Linear algebra and learning from data. Wellesey-Cambridge Press, 2019. ------------------------------------------------------------ Modulo: A001848 - STATISTICAL MODELS FOR LARGE DATASETS ------------------------------------------------------------ - Multilevel Statistical Models, 4th Edition. Harvey Goldstein. Wiley. - Statistical Models and Methods for Lifetime Data, Second Edition, Jerald F. Lawless, Wiley.

Elenco delle unità didattiche costituenti l'insegnamento

Docente: MATTEO GORGONE

Orario di Ricevimento - MATTEO GORGONE

Dato non disponibile

Docente: ROSSELLA LAUDANI

Orario di Ricevimento - ROSSELLA LAUDANI

Dato non disponibile
  • Segui Unime su:
  • istagram32x32.jpg
  • facebook
  • youtube
  • twitter
  • UnimeMobile
  • tutti