Offerta Didattica

 

CHIMICA

CHEMIOMETRIA

Classe di corso: L-27 - Scienze e tecnologie chimiche
AA: 2021/2022
Sedi: MESSINA
SSDTAFtipologiafrequenzamoduli
CHIM/01Affine/IntegrativaLiberaLiberaNo
CFUCFU LEZCFU LABCFU ESEOREORE LEZORE LABORE ESE
6600606000
Legenda
CFU: n. crediti dell’insegnamento
CFU LEZ: n. cfu di lezione in aula
CFU LAB: n. cfu di laboratorio
CFU ESE: n. cfu di esercitazione
FREQUENZA:Libera/Obbligatoria
MODULI:SI - L'insegnamento prevede la suddivisione in moduli, NO - non sono previsti moduli
ORE: n. ore programmate
ORE LEZ: n. ore programmate di lezione in aula
ORE LAB: n. ore programmate di laboratorio
ORE ESE: n. ore programmate di esercitazione
SSD:sigla del settore scientifico disciplinare dell’insegnamento
TAF:sigla della tipologia di attività formativa
TIPOLOGIA:LEZ - lezioni frontali, ESE - esercitazioni, LAB - laboratorio

Obiettivi Formativi

Il corso si propone di fornire le basi teoriche e pratiche della Chemiometria per la Chimica Analitica. In particolare, lo studente imparerà ad applicare i principali test statistici e ad elaborare matrici di dati multivariati.

Learning Goals

The course aims to provide the theoretical and practical bases of Chemometrics for Analytical Chemistry. In particular, the students will learn how to apply the main statistical tests and to process multivariate data matrices

Metodi didattici

Il corso prevede lezioni frontali (30 h) ed esercitazioni in aula (12 h). Le lezioni frontali sono dedicate all'acquisizione dei concetti di base della Chemiometria ed all'acquisizione di strumenti informatici specifici (software per applicazioni matematiche e statistiche). Le esercitazioni nel laboratorio informatico hanno lo scopo di rendere lo studente autonomo nell'utilizzare gli strumenti della Chemiometria e capace di applicare nozioni e software alla soluzione di problemi reali di analisi chimica multivariata.

Teaching Methods

The course includes lectures (30 h) and classroom exercises (12 h). The lectures are devoted to the acquisition of the basic concepts of Chemometrics and the acquisition of specific tools (software for mathematical and statistical applications). The class exercises are designed to make the learner autonomous to use the tools of Chemometrics and able to apply knowledge and software to the real problems of multivariate chemical analysis solution.

Prerequisiti

Lo studente deve avere conoscenza di base di matematica e di chimica analitica

Prerequisites

The student must have basic knowledge of mathematic and classical analytical chemistry

Verifiche dell'apprendimento

L'esame consiste in un'interrogazione orale che verte sul programma spiegato in aula e sulle esercitazioni in aula (definizioni e dimostrazioni contenute nelle dispense di lezione). Il Docente assegna un voto all'esame orale compreso tra 18 e 30.

Assessment

The exam consists of an oral discussion which focuses on the program and classroom exercises (demonstrations and definitions contained in the lecture handouts). The teacher assigns a rating from 18 to 30 to the oral examination

Programma del Corso

CENNI DI STATISTICA DI BASE (2 h lezioni frontali) Introduzione: la natura dei dati, definizione di variabile, oggetto, frequenza, probabilità.Parametri di posizione: media, moda mediana, media mobile, quantili, distribuzione gaussiana di Poisson e geometrica. Errori e parametri di dispersione: errori casuali, errori sistematici, errore assoluto, errore relativo, deviazione standard, varianza, intervalli di fiducia. INFERENZA STATISTICA (4 ore lezioni frontali e 2 h di esercitazioni numeriche)Test di significatività: t-test per il confronto tra medie o tra una media ed un valore noto, F-test per il confronto tra deviazioni standard (e.g. tra metodi), Q-test per la verifica di outliers, chi2 -test per la verifica della normalità di una distribuzione Analisi della varianza:test ANOVA a una via ed a due vie Parametri di qualità: limiti di rivedibilità, selettività, esattezza, precisione, incertezza di misurazione, robustezza, recupero. ESERCITAZIONI NUMERICHE SU TEST DI SIGNIFICATIVITA ESPLORAZIONE DEI DATI (4 ore lezioni frontali e 6 ore di esercitazioni numeriche)Struttura multivariata dei dati. Matrici: dimensione, trasposizione, centratura, covarianza, correlazione. Pretrattamento dei dati. Trasformazione delle variabili. Gestione dei dati mancanti.Analisi delle componenti principali. Grafici dei loadings. Grafici degli scores. Scelta delle componenti principali (rank analysis), per via numerica e per via grafica mediante scree plot.Analisi multivariata di processo: uso dei modelli PCA per il controllo di processo. Carte di controllo multivariate. Processi continui. Processi in batch.Analisi dei clusters. Matrice delle distanze, matrice di similarità. Metodi gerarchici agglomerativi per l'analisi dei clusters. Dendrogrammi. ESERCITAZIONI NUMERICHE SU ESPLORAZIONE DEI DATI METODI DI VALIDAZIONE (2h lezioni frontali e 2 ore di esercitazioni numeriche):metodi di splitting dei set di dati per creare il sub-set di calibrazione e il sub-set di validazione. Test set esterno: Algortimo Kennard-Stone, Cross validazione con metodo venetian blind, metodo leave-one-out. METODI DI CLASSIFICAZIONE (4 h lezioni frontali e 4 h esercitazioni numeriche): Modelli. Ordine e linearità di un modello. Parametri di controllo. Validazione di un modello. Metodi di classificazione discriminante basati su modelli probabilistici: LDA, QDA, Matrice di confusione, Matrice delle perdite. Parametri di valutazione di metodi di classificazione discriminante, null model rate. Metodi di classificazione modellante di tipo bayesiano (probabilistici): UNEQ, parametri di valutazione di metodi modellanti (specificità, selettività, efficienza, Cooman plot) Metodi di classificazione basati sulle componenti principali: SIMCA Metodi di classificazione non lineari: K-NN, scelta del valore di K Cenni su altri metodi di classificazione (CART, PLS-DA). ESERCITAZIONI NUMERICHE SU METODI DI CLASSIFICAZIONE METODI DI REGRESSIONE (4 h lezioni frontali e 4 h esercitazioni numeriche): Calibrazione: modelli quantitativi. Concetto di Leverages (effetto leva). Coefficienti di regressione. Parametri di valutazione di un modello di regressione. Coefficiente di correlazione. Coefficiente di predizione. Errore standard della stima. Metodi diagnostici per un modello di regressione. Metodi di regressione: Multilinear regression (MLR) Metodi di regressione biased: principal component regression (PCR), partial least square (PLS e PLS2). Esempi pratici di calibrazione mediante regressione PLS: spettrofotometria, voltammetria pulsata di ridissoluzione, cromatografia-spettrometria di massa. ESERCITAZIONI NUMERICHE SU METODI DI REGRESSIONE PROGETTAZIONE DI ESPERIMENTI “DOE” (4 h di lezioni frontali e 6 ore di esercitazioni numeriche): Concetto di experimental design. Parametri di valutazione di disegni sperimentali. Strategie di ottimizzazione. ° Metodi presi in considerazione: Full factorial design, screening Plackett-Burman, fractional factorial design, central composite design, Dohelert design, D-Optimal designs, miscele. ° ESERCITAZIONI NUMERICHE SU METODI DI DISEGNO SPERIMENTALE

Course Syllabus

BASIC STATISTICS (2 h lectures) Introduction: the nature of the data, definition of variable, object, frequency and probability. Position parameters: mean, median, mode, moving average, quantiles, Poisson, geometric and Gaussian distribution. Errors and dispersion parameters: random errors, systematic errors, absolute error, relative error, standard deviation, variance, confidence intervals. STATISTICAL INFERENCE (4 hours lectures and 2 hours of numerical exercises) ° Significance test: t-test for the comparison between means or between a mean and a known value, F-test for the comparison between standard deviations (eg between methods), Q-test for the verification of outliers, chi2 -test for the verification of the normality of a distribution ° Analysis of variance: one-way and two-way ANOVA tests ° Quality parameters: limits of review, selectivity, accuracy, accuracy, measurement uncertainty, robustness, recovery. ° NUMERICAL EXERCISES ON SIGNIFICANCE TEST DATA EXPLORATION (4 hours of lectures and 6 hours of numerical exercises) Multivariate data structure. Matrices: dimension, transposition, centering, covariance, correlation. Data pretreatment. Transformation of variables. Missing data management. ° Principal component analysis. loading and score plots. Choice of the optimal number of components, scree plot. ° Multivariate process analysis: use of PCA models for process control. Multivariate control charts. Continuous processes. Batch processes. ° Cluster analysis. Distance matrix, similarity matrix. Agglomerative hierarchical methods for cluster analysis. Dendrograms. ° NUMERICAL EXERCISES ON DATA EXPLORATION VALIDATION METHODS (2h lectures and 2 h numerical exercises): methods of splitting the data sets to create the calibration and the validation sub-sets. External test set: Kennard-Stone algorithm, Cross validation base on the Venetian blind method, leave-one-out. CLASSIFICATION METHODS (4 h lectures and 4 h numerical exercises): Models. Order and linearity of a model. Control parameters. Validation of a model. ° Discriminant classification Bayesian methods (probabilistic): LDA, QDA, Confusion matrix. Evaluation parameters of discriminant classification methods, null model rate ° Class-modeling Bayesian methods (probabilistic): UNEQ, evaluation parameters of modeling methods (specificity, selectivity, efficiency, Cooman plot) ° Classification methods based on principal components: SIMCA ° Non-linear classification methods: K-NN, choice of the K value ° Other classification methods (CART, PLS-DA). ° NUMERICAL EXERCISES ON CLASSIFICATION METHODS REGRESSION METHODS (4 h lectures and 4 h numerical exercises): Calibration: quantitative models. Leverages concept. Regression coefficients. Evaluation parameters of a regression model. Correlation coefficient. Coefficient of prediction. Standard error of the estimate. Diagnostic methods for a regression model. ° Regression methods: Multilinear regression (MLR) ° Biased regression methods: principal component regression (PCR), partial least squares (PLS and PLS2). ° Practical examples of calibration by PLS regression: spectrophotometry, pulsed redissolution voltammetry, chromatography-mass spectrometry. ° NUMERICAL EXERCISES ON REGRESSION METHODS DESIGN OF "DOE" EXPERIMENTS (4 hours of lectures and 6 hours of numerical exercises): Experimental design concept. Evaluation parameters of experimental designs. Optimization strategies. ° Methods considered: full factorial design, Plackett-Burman screening, fractional factorial design, central composite design, Dohelert design, D-Optimal designs, mixtures. ° NUMERICAL EXERCISES ON EXPERIMENTAL DESIGN METHODS

Testi di riferimento: - Appunti delle lezioni - Roberto Todeschini, Introduzione alla chemiometria, Edises, 1998. - Michele Forina, Fondamenta per la chimica analitica. ISBN 9788890406461 - J.C. Miller, J.N. Miller, Statistics and Chemometrics for Analytical Chemistry, Pearson Education, 2010. - Richard G. Brereton, Applied Chemometrics for Scientists, Wiley, 2007. - Richard Kramer, Chemometric techniques for quantitative analysis, Marcel Dekker, 1998. - Software: Origin, Excel, PLS toolbox, CAT su R.

Elenco delle unità didattiche costituenti l'insegnamento

Docente: GABRIELE LANDO

Orario di Ricevimento - GABRIELE LANDO

Dato non disponibile
  • Segui Unime su:
  • istagram32x32.jpg
  • facebook
  • youtube
  • twitter
  • UnimeMobile
  • tutti