Programma
- Parte 1 (circa 18 ore)
1.1 Richiami di Algebra Vettoriale e Matriciale: Proprietà e operazioni con vettori e matrici, Rappresentazione geometrica di un vettore nello spazio, Scomposizione spettrale di una matrice simmetrica, Partizione della matrice di varianza-covarianza, Vettori e Matrici Casuali, Vettore media e matrice di varianza-covarianza di combinazioni lineari di v.a., Partizione del vettore media e della matrice di varianza-covarianza campionari.
1.2 Distribuzione Normale Multivariata: Definizione, Contorno della normale bivariata, Proprietà, Campionamento da distribuzione normale multivariata, Verosimiglianza multivariata, Stime di massima verosimiglianza del vettore media e della matrice di varianza-covarianza.
- Parte 2 (circa 18 ore)
2.1 Modello Lineare Generale: Ipotesi di base, Stima dei parametri con i minimi quadrati, Stima della varianza dell’errore, Teorema di Gauss-Markov, Coefficiente di determinazione campionario, Stimatori di massima verosimiglianza dei parametri, Intervalli di confidenza per i parametri, Test d’ipotesi su più parametri.
2.2 Modello Lineare Generalizzato: Aspetti generali, Assunzioni sulla distribuzione di probabilità delle osservazioni, Fondamenti teorici, Alcuni modelli lineari generalizzati, Modello logistico, Stima dei parametri con il metodo della massima verosimiglianza.
- Parte 3 (circa 36 ore)
3.1 Analisi in Componenti Principali: Aspetti generali, Proprietà descrittive di base, Aspetti campionari di base, Proprietà campionarie quando la v.a. è multinormale, Uso di variabili standardizzate, Interpretazione delle componenti principali, Scelta del numero dei componenti principali.
3.2 Analisi dei Fattori: Aspetti generali, Il modello di analisi dei fattori, Principali aspetti del modello, Stima dei parametri senza ipotesi di multinormalità, Stimatori di massima verosimiglianza dei parametri, Test d’ipotesi sul numero dei fattori, Rotazione dei fattori, Punteggi fattoriali.
3.3 Analisi dei Gruppi: Aspetti generali, Misure di distanze ed indici di dissimilarità, Metodi gerarchici, Metodi non-gerarchici, Scelta del numero di gruppi.
3.4 Alberi di Classificazione: Aspetti generali. Regole di classificazione. Fasi della procedura. Metodi di segmentazione. CART.
Prerequisiti
E' utile aver acquisito i concetti di base di Statistica di Base, Probabilità, Inferenza statistica e laboratorio.
Testi di riferimento
VITALI O. (1993). Statistica per le Scienze Applicate, Cacucci Editore, Bari, vol. II - Modello lineare Generale (Cap. 14, vol. I, esclusi paragrafi 12 e 13) - Modelli Lineari Generalizzati (Cap. 17, esclusi paragrafi 6,7,8,9) - Analisi in Componenti Principali (Cap. 27, esclusi paragrafi 7.2. 7.3, 7.4) - Analisi dei Fattori (Cap. 29, esclusi paragrafi 5.2, 5.3, 8.3).
ZANI S., CERIOLI, A. (2007). Analisi dei dati e data mining per le decisioni aziendali, Giuffrè Editore, Milano - Cluster Analysis (Cap. VIII, paragrafi 1, 2, 3, 4; Cap. IX, paragrafi 1, 2, 3, 4, 5, 6, 8, 11; Cap. XI, paragrafi 1, 2, 3, 4, 5).
APPUNTI distribuiti dal docente a lezione. - Richiami di Algebra Vettoriale e Matriciale (cfr. anche O. Vitali, App. A) - Normale Multivariata (cfr anche O. Vitali, Cap. 24, i primi 4 paragrafi).
Modalità insegnamento
Le lezioni frontali prevedono alternanza tra presentazione di aspetti teorici ed applicazioni ad esempi concreti mediante il software R.
Frequenza
La frequenza delle lezioni non è obbligatoria, ma fortemente consigliata.
Modalità di esame
Prova orale al termine dell'insegnamento volta ad accertare sia l'acquisizione degli aspetti teorici che le abilità di risoluzione di problemi concreti.
Bibliografia
Testi di statistica multivariata
Modalità di erogazione
Le lezioni frontali prevedono alternanza tra presentazione di aspetti teorici ed applicazioni ad esempi concreti mediante il software R.