Offerta Didattica
ENGINEERING AND COMPUTER SCIENCE
BIG DATA
Classe di corso: LM-32, 18 - Classe delle lauree magistrali in Ingegneria informatica
AA: 2021/2022
Sedi: MESSINA
SSD | TAF | tipologia | frequenza | moduli |
---|---|---|---|---|
INF/01 | A scelta dello studente | Libera | Libera | No |
CFU | CFU LEZ | CFU LAB | CFU ESE | ORE | ORE LEZ | ORE LAB | ORE ESE |
---|---|---|---|---|---|---|---|
6 | 4 | 0 | 2 | 48 | 24 | 0 | 24 |
LegendaCFU: n. crediti dell’insegnamento CFU LEZ: n. cfu di lezione in aula CFU LAB: n. cfu di laboratorio CFU ESE: n. cfu di esercitazione FREQUENZA:Libera/Obbligatoria MODULI:SI - L'insegnamento prevede la suddivisione in moduli, NO - non sono previsti moduli ORE: n. ore programmate ORE LEZ: n. ore programmate di lezione in aula ORE LAB: n. ore programmate di laboratorio ORE ESE: n. ore programmate di esercitazione SSD:sigla del settore scientifico disciplinare dell’insegnamento TAF:sigla della tipologia di attività formativa TIPOLOGIA:LEZ - lezioni frontali, ESE - esercitazioni, LAB - laboratorio
Obiettivi Formativi
Conoscenza e capacità di comprensione: Far conoscere come cambia il modo di gestire le informazioni nel panorama dei Big Data. Far conoscere la gestione dei Big Data mediante DBMS NoSQL e NewSQL. Far conoscere le principali architetture parallele e distribuite per l’analisi dei Big Data. Conoscenza e capacità di comprensione applicate: Far progettare data model e implementare DBMS e sistemi distribuiti per l’analisi dei Big Data. Autonomia di giudizio: Far individuare la migliore soluzione DBMS e sistema distribuito per l’analisi dei Big Data in base ad un determinato caso di studio. Abilità comunicative: Far esprimere gli studenti con il linguaggio specifico della disciplina. Capacità di apprendere: Far acquisire un metodo di studio adeguato all'analisi di problemi specifici nell’ambito dei Big Data.Learning Goals
Knowledge and understanding: Let people know how the way of managing information changes in the Big Data landscape. Introducing the management of Big Data through NoSQL and NewSQL DBMS. Introduce the main parallel and distributed architectures for Big Data analysis. Applying knowledge and understanding: Let students designing data models and implementing DBMS and distributed systems for Big Data analysis. Making judgements: Let students identifying the best DBMS solution and distributed system for Big Data analysis based on a specific case study. Communication skills:Â Have students able to express themselves in the specific language of the discipline. Learning skills: Let students acquiring a method of study suitable for the analysis of problems related to the Big Data area.Metodi didattici
Lezioni frontali e lezioni di laboratorio informatico.Teaching Methods
Frontal Lessons and Practice in the Lab.Prerequisiti
Conoscenze di sistemi operativi (struttura dei sistemi operativi, gestione dei processi, sincronizzazione dei processi, gestione della memori, il file system, sicurezza e protezione ), database (modello relazionale, algebra relazionale, normalizzazione, DDL e DML, SQL, Triggers) e programmazione (programmazione procedurale e ad oggetti, interazione con database).Prerequisites
Knowledge of operating systems (structure of operating systems, process management, process synchronization, memory management, file system, security and protection), database (relational model, relational algebra, normalization, DDL and DML, SQL, Triggers) and programming (procedural and object-oriented programming, interaction with databases).Verifiche dell'apprendimento
Esame orale con discussione di un progetto.Assessment
Oral exam with discussion of a project.Programma del Corso
Fondamenti di Big Data. Tipi di Big Data. Calcolo distribuito. Fondamenti tecnologici per i Big Data. Componenti della tecnologia Big Data. Virtualizzazione e come essa supporta il calcolo distribuito. Big data nel Cloud. Gestione dei Big Data. Database NoSQL paralleli e distribuiti. Database operativi. Fondamenti di MapReduce. Il framework Hadoop. Apache Spark. Analisi di Big Data. Approcci personalizzati per l'analisi dei Big Data. Implementazione di applicazioni per Big Data. Integrazione di sorgenti dati eterogenee.Course Syllabus
Fundamentals of Big Data. Types of Big Data. Distributed computing. Technological foundations for Big Data. Big Data technology components. Virtualization and how it supports distributed computing. Big data in the Cloud. Big Data Management. Parallel and distributed NoSQL databases. Operational databases. Fundamentals of MapReduce. The Hadoop framework. Apache Spark. Big Data Analysis. Custom approaches for Big Data analysis. Implementation of Big Data applications. Integration of heterogeneous data sources.Testi di riferimento:
Judith S. Hurwitz, Alan Nugent, Fern Halper, Marcia Kaufman. Big Data For Dummies. Wiley, 2013
Tom White. Hadoop - The Definitive Guide (4th edition). O'Reilly, 2015
Jules S. Damji, Brooke Wenig, Tathagata Das, Denny Lee. Learning Spark, 2nd Edition. O'Reilly, 2020
Andrew G. Psaltis. Streaming Data - Understanding the real-time pipeline. Manning, 2017
Ian Foster, Dennis Gannon. Cloud Computing for Science and Engineering. MIT Press, 2017
Slides fornite dal docente
Esami: Elenco degli appelli
Elenco delle unità didattiche costituenti l'insegnamento
Docente: ANTONIO CELESTI
Orario di Ricevimento - ANTONIO CELESTI
Giorno | Ora inizio | Ora fine | Luogo |
---|---|---|---|
Martedì | 17:00 | 18:00 | Dipartimente di Ingegneria, blocco B, piano 7. |
Note: Si consiglia di contattare il docente tramite e-mail all'indirizzo acelesti@unime.it per conferme e per appuntamenti in altri giorni.