MODELLI STATISTICI CORSO AVANZATO

Obiettivi formativi

Obiettivi formativi. Lo scopo dell’insegnamento è ampliare la conoscenza dei modelli statistici multivariati volti all’analisi e la comprensione di matrici di dati complesse (spesso di grandi dimensioni). Gli studenti devono inoltre saper formalizzare i problemi reali in termini dei modelli discussi durante il corso e saperne interpretare i risultati ottenuti. Infine, gli studenti devono aver la capacità di programmare ed applicare tali metodologie mediante software statistici (in particolare R/Matlab). Conoscenza e capacità di comprensione. Dopo aver frequentato l’insegnamento, gli studenti conoscono e comprendono i principali modelli statistici multivariati per far fronte alle diverse problematiche connesse allo studio di fenomeni complessi. Capacità di applicare conoscenza e comprensione. Al termine dell’insegnamento, gli studenti sono in grado di utilizzare e selezionare i diversi modelli statistici multivariati studiati per affrontare le problematiche relative a diverse discipline. Gli studenti sono infine in grado di interpretare in modo critico i risultati ottenuti dall’applicazione su dati reali mediante l’uso di software statistici (in particolare R/Matlab). Autonomia di giudizio. Gli studenti sviluppano capacità critiche attraverso l’applicazione dei modelli statistici a dati reali e il confronto tra soluzioni ottenute da modelli diversi volti ad affrontare lo stesso problema. Abilità comunicativa. Gli studenti, attraverso lo svolgimento di esercizi pratici, lettura e valutazione critica di testi scientifici ed attività di gruppo, acquisiscono una capacità tecnico-scientifica per comunicare in modo critico i risultati ottenuti su problemi reali. Capacità di apprendimento. Al termine dell’esame gli studenti hanno una conoscenza più ampia dei modelli statistici multivariati che gli permette di realizzare strategie complesse di analisi per saper estrarre le informazioni rilevanti dai dati osservati, spesso di grandi dimensioni. Tale prerogativa, unita alla conoscenza di programmazione di software statistici, risponde alle sempre più frequenti richieste nell’ambito lavorativo (aziende, enti di ricerca, etc.).

Canale 1
FRANCESCA MARTELLA Scheda docente

Programmi - Frequenza - Esami

Programma
Le lezioni si articolano nei seguenti nuclei tematici: PARTE 1 (18 ore circa) • Richiami di algebra matriciale • Metodologie di classificazione: o Richiami alle metodologie basate sulla distanza o Metodologie basate su modello ed in particolare sui modelli a mistura finita PARTE 2 (30 ore circa) • Estensioni dei modelli a mistura finita • Metodologie di classificazione delle unità e riduzione dimensionale delle variabili • Metodologie di classificazione delle unità e classificazione delle variabili PARTE 3 (24 ore circa) Applicazioni su dati reali mediante software statistici (R/Matlab) e discussione di articoli scientifici.
Prerequisiti
Per affrontare i contenuti dell’insegnamento è indispensabile possedere le conoscenze elementari di algebra delle matrici, teoria dell’inferenza statistica, modello di regressione lineare e analisi matematica.
Testi di riferimento
- Dispense ed articoli scientifici forniti dal docente durante l’erogazione del corso - An introduction to clustering with R, Springer. Giordani P., Ferraro M.B., Martella F. (2020) - Finite Mixture Models, Wiley Series in Probability and Statistics. McLachlan G. and Peel D. (2000) - Methods of Multivariate Analysis, Wiley Series in Probability and Statistics (2nd edition). Rencher A.C. (2002)
Modalità insegnamento
Le lezioni frontali (a meno di emergenze sanitarie) prevedono alternanza tra lezioni teoriche, utilizzo di software per applicazioni a dati reali e lavori di gruppo.
Frequenza
La frequenza del corso è fortemente consigliata. In caso di impossibilità a seguire le lezioni, si consiglia di contattare il docente.
Modalità di esame
Per superare l’esame gli studenti svolgono: (a) una prova di laboratorio in cui è necessario applicare i modelli statistici multivariati su uno o più data set reali utilizzando i software discussi durante il corso; (b) un lavoro di gruppo (da concordare con il docente): presentazione critica di un articolo scientifico fornito dal docente. Per non i frequentanti si consiglia di contattare il docente; (c) una prova orale per valutare la conoscenza e comprensione dei metodi discussi. Ciascuna parte dell’esame vale 1/3 del voto finale.
Bibliografia
- G. McLachlan, D. Peel, (2000). Finite Mixture Models, Wiley Series in Probability and Statistics. - A.C. Rencher, (2002). Methods of Multivariate Analysis, Wiley Series in Probability and Statistics; 2nd edition. - A.D. Gordon (1999). Classification, Chapman & Hall, 2nd edition. - P. Giordani, Ferraro M.B., Martella F. (2020) An Introduction to Clustering with R. Springer Singapore.
Modalità di erogazione
Le lezioni frontali (a meno di emergenze sanitarie) prevedono alternanza tra lezioni teoriche, utilizzo di software per applicazioni a dati reali e lavori di gruppo.
  • Codice insegnamento10589781
  • Anno accademico2024/2025
  • CorsoScienze statistiche - Statistical Sciences
  • CurriculumDemografico sociale
  • Anno2º anno
  • Semestre1º semestre
  • SSDSECS-S/01
  • CFU9
  • Ambito disciplinareStatistico