Offerta Didattica

ENGINEERING AND COMPUTER SCIENCE

BIG DATA

Classe di corso: LM-32, 18 - Classe delle lauree magistrali in Ingegneria informatica

AA: 2021/2022

Sedi: MESSINA

SSD	TAF	tipologia	frequenza	moduli
INF/01	A scelta dello studente	Libera	Libera	No

CFU	CFU LEZ	CFU LAB	CFU ESE	ORE	ORE LEZ	ORE LAB	ORE ESE
6	4	0	2	48	24	0	24

Legenda
CFU: n. crediti dell’insegnamento
CFU LEZ: n. cfu di lezione in aula
CFU LAB: n. cfu di laboratorio
CFU ESE: n. cfu di esercitazione
FREQUENZA:Libera/Obbligatoria
MODULI:SI - L'insegnamento prevede la suddivisione in moduli, NO - non sono previsti moduli
ORE: n. ore programmate
ORE LEZ: n. ore programmate di lezione in aula
ORE LAB: n. ore programmate di laboratorio
ORE ESE: n. ore programmate di esercitazione
SSD:sigla del settore scientifico disciplinare dell’insegnamento
TAF:sigla della tipologia di attività formativa
TIPOLOGIA:LEZ - lezioni frontali, ESE - esercitazioni, LAB - laboratorio

Obiettivi Formativi
Learning Goals

Obiettivi Formativi

Conoscenza e capacità di comprensione: Far conoscere come cambia il modo di gestire le informazioni nel panorama dei Big Data. Far conoscere la gestione dei Big Data mediante DBMS NoSQL e NewSQL. Far conoscere le principali architetture parallele e distribuite per l’analisi dei Big Data. Conoscenza e capacità di comprensione applicate: Far progettare data model e implementare DBMS e sistemi distribuiti per l’analisi dei Big Data. Autonomia di giudizio: Far individuare la migliore soluzione DBMS e sistema distribuito per l’analisi dei Big Data in base ad un determinato caso di studio. Abilità comunicative: Far esprimere gli studenti con il linguaggio specifico della disciplina. Capacità di apprendere: Far acquisire un metodo di studio adeguato all'analisi di problemi specifici nell’ambito dei Big Data.

Metodi didattici

Lezioni frontali e lezioni di laboratorio informatico.

Teaching Methods

Prerequisiti
Prerequisites

Prerequisiti

Conoscenze di sistemi operativi (struttura dei sistemi operativi, gestione dei processi, sincronizzazione dei processi, gestione della memori, il file system, sicurezza e protezione ), database (modello relazionale, algebra relazionale, normalizzazione, DDL e DML, SQL, Triggers) e programmazione (programmazione procedurale e ad oggetti, interazione con database).

Prerequisites

Verifiche dell'apprendimento
Assessment

Verifiche dell'apprendimento

Esame orale con discussione di un progetto.

Assessment

Programma del Corso
Course Syllabus

Programma del Corso

Fondamenti di Big Data. Tipi di Big Data. Calcolo distribuito. Fondamenti tecnologici per i Big Data. Componenti della tecnologia Big Data. Virtualizzazione e come essa supporta il calcolo distribuito. Big data nel Cloud. Gestione dei Big Data. Database NoSQL paralleli e distribuiti. Database operativi. Fondamenti di MapReduce. Il framework Hadoop. Apache Spark. Analisi di Big Data. Approcci personalizzati per l'analisi dei Big Data. Implementazione di applicazioni per Big Data. Integrazione di sorgenti dati eterogenee.

Course Syllabus

Testi di riferimento: Judith S. Hurwitz, Alan Nugent, Fern Halper, Marcia Kaufman. Big Data For Dummies. Wiley, 2013 Tom White. Hadoop - The Definitive Guide (4th edition). O'Reilly, 2015 Jules S. Damji, Brooke Wenig, Tathagata Das, Denny Lee. Learning Spark, 2nd Edition. O'Reilly, 2020 Andrew G. Psaltis. Streaming Data - Understanding the real-time pipeline. Manning, 2017 Ian Foster, Dennis Gannon. Cloud Computing for Science and Engineering. MIT Press, 2017 Slides fornite dal docente

Esami: Elenco degli appelli

Elenco delle unità didattiche costituenti l'insegnamento

Docente: ANTONIO CELESTI

Orario di Ricevimento - ANTONIO CELESTI

Giorno	Ora inizio	Ora fine	Luogo
Martedì	17:00	18:00	Dipartimente di Ingegneria, blocco B, piano 7.

Note: Si consiglia di contattare il docente tramite e-mail all'indirizzo acelesti@unime.it per conferme e per appuntamenti in altri giorni.