Offerta Didattica

ENGINEERING AND COMPUTER SCIENCE

BIG DATA

Classe di corso: LM-32, 18 - Classe delle lauree magistrali in Ingegneria informatica

AA: 2021/2022

Sedi: MESSINA

SSD	TAF	tipologia	frequenza	moduli
INF/01	A scelta dello studente	Libera	Libera	No

CFU	CFU LEZ	CFU LAB	CFU ESE	ORE	ORE LEZ	ORE LAB	ORE ESE
6	4	0	2	48	24	0	24

Legenda
CFU: n. crediti dell’insegnamento
CFU LEZ: n. cfu di lezione in aula
CFU LAB: n. cfu di laboratorio
CFU ESE: n. cfu di esercitazione
FREQUENZA:Libera/Obbligatoria
MODULI:SI - L'insegnamento prevede la suddivisione in moduli, NO - non sono previsti moduli
ORE: n. ore programmate
ORE LEZ: n. ore programmate di lezione in aula
ORE LAB: n. ore programmate di laboratorio
ORE ESE: n. ore programmate di esercitazione
SSD:sigla del settore scientifico disciplinare dell’insegnamento
TAF:sigla della tipologia di attività formativa
TIPOLOGIA:LEZ - lezioni frontali, ESE - esercitazioni, LAB - laboratorio

Obiettivi Formativi
Learning Goals

Obiettivi Formativi

Conoscenza e capacità di comprensione: Far conoscere come cambia il modo di gestire le informazioni nel panorama dei Big Data. Far conoscere la gestione dei Big Data mediante DBMS NoSQL e NewSQL. Far conoscere le principali architetture parallele e distribuite per l’analisi dei Big Data. Conoscenza e capacità di comprensione applicate: Far progettare data model e implementare DBMS e sistemi distribuiti per l’analisi dei Big Data. Autonomia di giudizio: Far individuare la migliore soluzione DBMS e sistema distribuito per l’analisi dei Big Data in base ad un determinato caso di studio. Abilità comunicative: Far esprimere gli studenti con il linguaggio specifico della disciplina. Capacità di apprendere: Far acquisire un metodo di studio adeguato all'analisi di problemi specifici nell’ambito dei Big Data.

Learning Goals

Knowledge and understanding: Let people know how the way of managing information changes in the Big Data landscape. Introducing the management of Big Data through NoSQL and NewSQL DBMS. Introduce the main parallel and distributed architectures for Big Data analysis. Applying knowledge and understanding: Let students designing data models and implementing DBMS and distributed systems for Big Data analysis. Making judgements: Let students identifying the best DBMS solution and distributed system for Big Data analysis based on a specific case study. Communication skills:Â Have students able to express themselves in the specific language of the discipline. Learning skills: Let students acquiring a method of study suitable for the analysis of problems related to the Big Data area.

Metodi didattici
Teaching Methods

Metodi didattici

Lezioni frontali e lezioni di laboratorio informatico.

Teaching Methods

Frontal Lessons and Practice in the Lab.

Prerequisiti
Prerequisites

Prerequisiti

Conoscenze di sistemi operativi (struttura dei sistemi operativi, gestione dei processi, sincronizzazione dei processi, gestione della memori, il file system, sicurezza e protezione ), database (modello relazionale, algebra relazionale, normalizzazione, DDL e DML, SQL, Triggers) e programmazione (programmazione procedurale e ad oggetti, interazione con database).

Prerequisites

Knowledge of operating systems (structure of operating systems, process management, process synchronization, memory management, file system, security and protection), database (relational model, relational algebra, normalization, DDL and DML, SQL, Triggers) and programming (procedural and object-oriented programming, interaction with databases).

Verifiche dell'apprendimento
Assessment

Verifiche dell'apprendimento

Esame orale con discussione di un progetto.

Assessment

Oral exam with discussion of a project.

Programma del Corso
Course Syllabus

Programma del Corso

Fondamenti di Big Data. Tipi di Big Data. Calcolo distribuito. Fondamenti tecnologici per i Big Data. Componenti della tecnologia Big Data. Virtualizzazione e come essa supporta il calcolo distribuito. Big data nel Cloud. Gestione dei Big Data. Database NoSQL paralleli e distribuiti. Database operativi. Fondamenti di MapReduce. Il framework Hadoop. Apache Spark. Analisi di Big Data. Approcci personalizzati per l'analisi dei Big Data. Implementazione di applicazioni per Big Data. Integrazione di sorgenti dati eterogenee.

Course Syllabus

Fundamentals of Big Data. Types of Big Data. Distributed computing. Technological foundations for Big Data. Big Data technology components. Virtualization and how it supports distributed computing. Big data in the Cloud. Big Data Management. Parallel and distributed NoSQL databases. Operational databases. Fundamentals of MapReduce. The Hadoop framework. Apache Spark. Big Data Analysis. Custom approaches for Big Data analysis. Implementation of Big Data applications. Integration of heterogeneous data sources.

Testi di riferimento: Judith S. Hurwitz, Alan Nugent, Fern Halper, Marcia Kaufman. Big Data For Dummies. Wiley, 2013 Tom White. Hadoop - The Definitive Guide (4th edition). O'Reilly, 2015 Jules S. Damji, Brooke Wenig, Tathagata Das, Denny Lee. Learning Spark, 2nd Edition. O'Reilly, 2020 Andrew G. Psaltis. Streaming Data - Understanding the real-time pipeline. Manning, 2017 Ian Foster, Dennis Gannon. Cloud Computing for Science and Engineering. MIT Press, 2017 Slides fornite dal docente

Esami: Elenco degli appelli

Elenco delle unità didattiche costituenti l'insegnamento

Docente: ANTONIO CELESTI

Orario di Ricevimento - ANTONIO CELESTI

Giorno	Ora inizio	Ora fine	Luogo
Martedì	17:00	18:00	Dipartimente di Ingegneria, blocco B, piano 7.

Note: Si consiglia di contattare il docente tramite e-mail all'indirizzo acelesti@unime.it per conferme e per appuntamenti in altri giorni.