STATISTICA MULTIVARIATA

Obiettivi formativi

Obiettivi formativi. L’obiettivo principale dell’insegnamento è l’acquisizione degli strumenti statistici avanzati per l’analisi di dati multivariati e del loro utilizzo in situazioni reali. Nell'analisi di un caso di studio reale, lo studente deve essere in grado di formalizzare l’obiettivo statistico, elaborare una strategia di analisi, applicare autonomamente le metodologie apprese e interpretare i risultati producendo una relazione tecnica. Conoscenza e capacità di comprensione. Alla fine del corso gli studenti conoscono le problematiche e i temi principali di analisi multivariata e multidimensionale (dipendenza, riduzione dimensionale, classificazione) e le metodologie classiche per affrontare e gestire tali tematiche (ad esempio, la regressione lineare e i metodi di cluster analysis). Capacità di applicare conoscenza e comprensione. Al termine del corso gli studenti sono in grado di formalizzare un problema statistico in contesto multivariato e di selezionare le metodologie appropriate per affrontarlo e gestirlo. Inoltre possiedono la competenze di base per motivare scelte alternative e verificarne assunzioni e l’applicabilità. Infine, sono in grado di applicare i metodi ai dati e di interpretare i risultati. Autonomia di giudizio. Gli studenti sviluppano le capacità critiche tramite l’applicazione delle metodologie apprese dal punto vista teorico che sono in grado di applicare in autonomia utilizzando un software statistico. La capacità di elaborare dati reali in autonomia e di produrre il risultato riflette autonomia di analisi e sviluppo di senso e giudizio critico che deriva dalla necessità di operare scelte e confronti motivati e supportati dagli strumenti teorici appresi. In aggiunta, gli studenti imparano ad interpretare criticamente i risultati ottenuti sui dati reali. Abilità comunicativa. Gli studenti, attraverso l’elaborazione autonoma e la produzione di brevi rapporti tecnici, acquisiscono il linguaggio tecnico-scientifico della disciplina che deve essere opportunamente utilizzato sia nelle esercitazioni sia nella prova finale, dando particolare rilievo alla capacità di comunicare informazioni e risultati con un linguaggio rigoroso ma comprensibile anche ad interlocutori non specialisti. Capacità di apprendimento. Gli studenti che superano l’esame hanno appreso: a) gli strumenti teorici avanzati delle statistica e la capacità di affrontare un eventuale successivo corso di studio in area statistica o nei contesti applicativi in cui la statistica è impiegata; b) gli strumenti applicativi che permettono di sviluppare l’abilità a costruire una strategia di analisi di base in autonomia necessaria sia per proseguire gli studi sia per affrontare il mondo del lavoro al termine del ciclo di studi.

Canale 1
DONATELLA VICARI Scheda docente

Programmi - Frequenza - Esami

Programma
Le lezioni si articolano in quattro parti dedicate agli aspetti teorici e un modulo di laboratorio. Parte 1: Introduzione e richiami teorici (6 ore circa). Argomenti: Le matrici dei dati e le loro trasformazioni; Richiami di algebra delle matrici. Parte 2: Regressione lineare (14 ore circa). Argomenti: Stima dei minimi quadrati e di massima verosimiglianza; Validità del modello: coefficiente di determinazione, test di adattamento; Proprietà degli stimatori: correttezza, Teorema di Gauss-Markov; Stima della varianza, inferenza sui coefficienti, inferenza sulla variabile risposta; Multicollinearità; Selezione del modello; Analisi di influenza: misure e rimedi. Parte 3: Riduzione dimensionale (12 ore circa). Argomenti: Metodi di riduzione dimensionale; Analisi in componenti principali: determinazione analitica della soluzione; Valutazione delle bontà di rappresentazione: globale, delle variabili e delle unità; il cerchio delle correlazioni e le contribuzioni relative; il Biplot. Parte 4: Cluster Analysis (16 ore circa). Argomenti: Misure di relazione fra unità statistiche; Definizione di gruppo, distanza tra gruppi; Algoritmi gerarchici scissori: Metodo di Cavalli-Sforza; Algoritmi gerarchici aggregativi: Legame singolo, completo, medio, centroide, metodo di Ward; Formula di Lance and Williams; Gerarchia indicizzata e dendrogramma; Metodi non gerarchici; Metodo delle k-medie: modello, algoritmo, proprietà; Indici per la scelta del numero di gruppi e valutazione delle soluzioni ottenute. Laboratorio (24 ore circa) Argomenti: Applicazione a casi reali delle metodologie di statistica multivariata con il package statistico SAS; analisi ed interpretazione dell’output prodotto dalle procedure SAS relative alle metodologie studiate nella parte teorica.
Prerequisiti
Per la comprensione degli argomenti trattati e il superamento dell’esame è INDISPENSABILE possedere le nozioni di base della Statistica descrittiva (in particolare: tutti i concetti e gli strumenti analitici per l’analisi statistica di dati univariati e bivariati) e dell’Inferenza Statistica (in particolare: distribuzioni campionarie, teoria della stima puntuale, intervalli di confidenza e test di ipotesi). Nel corso di studio di cui fa parte il presente insegnamento tali nozioni vengono acquisite sostenendo gli esami degli insegnamenti curriculari di Statistica di base e Inferenza Statistica. E’ importante che lo studente possieda anche i fondamenti di algebra delle matrici che nel corso di studio di cui fa parte il presente insegnamento vengono impartiti nell'insegnamento di Matematica I.
Testi di riferimento
S. Zani, A. Cerioli – Analisi dei Dati Statistici e Data Mining per le Decisioni Aziendali – Giuffrè Editore, 2007. Vitali, O. – Statistica per le scienze applicate vol. I – Cacucci Editore, 1991. Documentazione SAS 9.4 disponibile anche online (http://support.sas.com/documentation/) Documentazione e codici SAS forniti dal docente.
Modalità insegnamento
Le lezioni frontali (a meno di emergenze sanitarie) prevedono la presentazione degli aspetti teorici delle metodologie di Statistica Multivariata con particolare attenzione ai risvolti applicativi. Le esperienze in laboratorio informatico alternano lezioni frontali e lavoro autonomo dello studente nelle applicazioni a casi reali per raccordare la teoria e la pratica in un processo di apprendimento autodiretto.
Frequenza
La frequenza del corso è fortemente consigliata. In caso di impossibilità a seguire le lezioni, si consiglia di contattare il docente.
Modalità di esame
Per superare l’esame gli studenti devono svolgere: (a) una prova scritta finale (durata: 1 ora circa) in cui si pongono dei quesiti sulla parte teorica; (b) una prova pratica (durata: 2 ora e mezzo circa) da svolgere nel laboratorio informatico in cui viene richiesto di produrre una breve relazione tecnica sull’analisi di un caso reale. Queste prove consentono di accertare l’acquisizione dei concetti teorici, la capacità di formalizzare l’obiettivo statistico, l’abilità di costruire una strategia di analisi per risolvere problemi concreti e l'impiego di un linguaggio appropriato. Ciascuna parte dell’esame vale 1/2 del voto finale.
Bibliografia
K.V. Mardia, J.T. Kent, J.M. Bibby– Multivariate Analysis – Academic Press, 1994. A.C. Rencher – Methods of Multivariate Analysis – Wiley, 2002. BOVE, G., OKADA, A., VICARI, D., Methods for the Analysis of Asymmetric Relationships, Series: Behaviormetrics: Quantitative Approaches to Human Behavior, Springer Nature, Singapore, 2021.
Modalità di erogazione
Le lezioni frontali (a meno di emergenze sanitarie) prevedono la presentazione degli aspetti teorici delle metodologie di Statistica Multivariata con particolare attenzione ai risvolti applicativi. Le esperienze in laboratorio informatico alternano lezioni frontali e lavoro autonomo dello studente nelle applicazioni a casi reali per raccordare la teoria e la pratica in un processo di apprendimento autodiretto.
  • Codice insegnamento1022894
  • Anno accademico2024/2025
  • CorsoStatistica, economia, finanza e assicurazioni
  • CurriculumFinanza e assicurazioni
  • Anno3º anno
  • Semestre1º semestre
  • SSDSECS-S/01
  • CFU9
  • Ambito disciplinareStatistico, statistico applicato, demografico