Offerta Didattica
ENGINEERING AND COMPUTER SCIENCE
BIG DATA
Classe di corso: LM-32, 18 - Classe delle lauree magistrali in Ingegneria informatica
AA: 2021/2022
Sedi: MESSINA
SSD | TAF | tipologia | frequenza | moduli |
---|---|---|---|---|
INF/01 | A scelta dello studente | Libera | Libera | No |
CFU | CFU LEZ | CFU LAB | CFU ESE | ORE | ORE LEZ | ORE LAB | ORE ESE |
---|---|---|---|---|---|---|---|
6 | 4 | 0 | 2 | 48 | 24 | 0 | 24 |
LegendaCFU: n. crediti dell’insegnamento CFU LEZ: n. cfu di lezione in aula CFU LAB: n. cfu di laboratorio CFU ESE: n. cfu di esercitazione FREQUENZA:Libera/Obbligatoria MODULI:SI - L'insegnamento prevede la suddivisione in moduli, NO - non sono previsti moduli ORE: n. ore programmate ORE LEZ: n. ore programmate di lezione in aula ORE LAB: n. ore programmate di laboratorio ORE ESE: n. ore programmate di esercitazione SSD:sigla del settore scientifico disciplinare dell’insegnamento TAF:sigla della tipologia di attività formativa TIPOLOGIA:LEZ - lezioni frontali, ESE - esercitazioni, LAB - laboratorio
Obiettivi Formativi
Conoscenza e capacità di comprensione: Far conoscere come cambia il modo di gestire le informazioni nel panorama dei Big Data. Far conoscere la gestione dei Big Data mediante DBMS NoSQL e NewSQL. Far conoscere le principali architetture parallele e distribuite per l’analisi dei Big Data. Conoscenza e capacità di comprensione applicate: Far progettare data model e implementare DBMS e sistemi distribuiti per l’analisi dei Big Data. Autonomia di giudizio: Far individuare la migliore soluzione DBMS e sistema distribuito per l’analisi dei Big Data in base ad un determinato caso di studio. Abilità comunicative: Far esprimere gli studenti con il linguaggio specifico della disciplina. Capacità di apprendere: Far acquisire un metodo di studio adeguato all'analisi di problemi specifici nell’ambito dei Big Data.Learning Goals
Metodi didattici
Lezioni frontali e lezioni di laboratorio informatico.Teaching Methods
Prerequisiti
Conoscenze di sistemi operativi (struttura dei sistemi operativi, gestione dei processi, sincronizzazione dei processi, gestione della memori, il file system, sicurezza e protezione ), database (modello relazionale, algebra relazionale, normalizzazione, DDL e DML, SQL, Triggers) e programmazione (programmazione procedurale e ad oggetti, interazione con database).Prerequisites
Verifiche dell'apprendimento
Esame orale con discussione di un progetto.Assessment
Programma del Corso
Fondamenti di Big Data. Tipi di Big Data. Calcolo distribuito. Fondamenti tecnologici per i Big Data. Componenti della tecnologia Big Data. Virtualizzazione e come essa supporta il calcolo distribuito. Big data nel Cloud. Gestione dei Big Data. Database NoSQL paralleli e distribuiti. Database operativi. Fondamenti di MapReduce. Il framework Hadoop. Apache Spark. Analisi di Big Data. Approcci personalizzati per l'analisi dei Big Data. Implementazione di applicazioni per Big Data. Integrazione di sorgenti dati eterogenee.Course Syllabus
Testi di riferimento:
Judith S. Hurwitz, Alan Nugent, Fern Halper, Marcia Kaufman. Big Data For Dummies. Wiley, 2013
Tom White. Hadoop - The Definitive Guide (4th edition). O'Reilly, 2015
Jules S. Damji, Brooke Wenig, Tathagata Das, Denny Lee. Learning Spark, 2nd Edition. O'Reilly, 2020
Andrew G. Psaltis. Streaming Data - Understanding the real-time pipeline. Manning, 2017
Ian Foster, Dennis Gannon. Cloud Computing for Science and Engineering. MIT Press, 2017
Slides fornite dal docente
Esami: Elenco degli appelli
Elenco delle unità didattiche costituenti l'insegnamento
Docente: ANTONIO CELESTI
Orario di Ricevimento - ANTONIO CELESTI
Giorno | Ora inizio | Ora fine | Luogo |
---|---|---|---|
Martedì | 17:00 | 18:00 | Dipartimente di Ingegneria, blocco B, piano 7. |
Note: Si consiglia di contattare il docente tramite e-mail all'indirizzo acelesti@unime.it per conferme e per appuntamenti in altri giorni.