Programma
Il corso è fondamentalmente diviso in tre parti, ciascuna corrispondente a circa 30 ore di didattica frontale.
1) Statistica descrittiva.
- Istogramma, distribuzione campionaria. Caratteristiche del I e del II ordine: valor medio, modo, mediana, varianza deviazione standard.
Caratteristiche del III e IV ordine: skewness, Curtosi. Regole per tracciare un istogramma;
- Richiami sul calcolo delle probabilità: media e varianza di trasformazione affine di una variabile aleatoria; caso vettoriale;
- Percentili di una distribuzione. Box Plot;
- Distribuzione gaussiana. Distribuzione chi2. Distribuzione t-Student. Distribuzione di Fisher. Teorema del limite centrale;
- Test statistici: errore di tipo 1 e 2; test più potente di livello epsilon, e test uniformemente più potente. Lemma di Neyman-Pearson. Q-Q Plot. Test di Pearson. Test di Kolmogorov-Smirnov. Test di Anderson-Darling.
2) Statistica inferenziale.
- Stima di punto, stima di intervallo, confronti tra statistiche.
- Campione casuale semplice e non indipendente. Stima campionaria del valor medio e della varianza di popolazione,
varianza delle stime nei due casi. Caso gaussiano, casi di asimmetria, distribuzione con code grasse;
- Intervallo di confidenza. Controllo statistico della qualità, fault detection;
- Test di confronto tra due gruppi: tra proporzioni, tra medie, tra varianze;
- Test di confronto tra più gruppi: test di Bartlett, test di Levene;
- Analisi della varianza (ANOVA). Test di Pearson ad 1 via, a due vie. Test di Kruskal-Wallis. Welch Anova;
- Cenni ai test non parametrici;
- Piano degli esperimenti. Campionamento stratificato.
3) Identificazione di Modelli.
3.1) Modello di regressione lineare. Modelli di descrizione, modelli di predizione. Significato del modello di regressione lineare;
- Parametri del modello: offset, sensibilità, correlazione parziale;
- Stima dei parametri: sistema normale di equazioni. Test R-quadro: varianza spiegata, varianza residua;
- Preelaborazione dei dati: standardizzazione, equalizzazione. Cenni PCA,
- Complessità del modello: criterio di Akaike. Significatività dei parametri;
- Intervallo di confidenza del modello di regressione.
3.2) Stima parametrica. Introduzione, nozioni generali.
- Proprietà delle stime: distorsione, efficienza. Consistenza della stima;
- Stima dei minimi quadrati (LSE): modello lineare con errore additivo. Condizioni necessarie e sufficienti di ottimo. Proprietà della stima e validazione del modello (R2). Stima dei minimi quadrati pesata;
- Cenni Stima di massima verosimiglianza (MLE), e stima Bayesiana;
- Stima di parametri variabili nel tempo. Minimi quadrati con pesi esponenziali, algoritmo ricorsivo.
3.3) Modelli di serie storiche. Analisi additiva, analisi moltiplicativa: Decomposizione in trend, stagionalità, residuo.
- Trend: modelli globali, parametrici e non parametrici (modello polinomiale con parametri costanti, filtro di Prescott-Hodrick); modelli locali, parametrici e non parametrici (modello polinomiale con parametri variabili nel tempo, media mobile semplice, SMA, media mobile esponenziale,EMA).
- Stagionalità: uso della funzione di correlazione, metodo di stima della componente stagionale;
- Componente residua: modelli AR, MA, ARMA, predittore ottimo. Identificazione dei modelli: stima parametrica e validazione (test di bianchezza).
Prerequisiti
I seguenti sono prerequisiti indispensabili:
1) Alcune nozioni di base di algebra lineare, quali:
- spazio lineare, vettori e le operazioni lineari tra vettori;
- dipendenza ed indipendenza lineare tra vettori;
- matrici ed operazioni tra matrici;
- rango di una matrice;
- determinante di una matrice quadrata;
- calcolo dell'inversa di una matrice quadrata;
- polinomio caratteristico di matrici quadrate;
- autovalori ed autovettori di una matrice quadrata
- sistemi di equazioni.
2)- alcune nozioni di base di geometria analitica, quali:
- rette e piani nello spazio Cartesiano;
3) alcune nozioni di base di analisi, quali:
- successioni e funzioni;
- serie di successioni;
- concetto di limite, continuità di una funzione e sua differenziabilità;
- derivate ed integrali di funzioni;
- massimi e minimi di una funzione;
- elementi di programmazione matematica.
4) Nozioni di Calcolo della Probabilità e Statistica, quali:
- eventi e probabilità degli eventi;
- distribuzione di probabilità e variabili aleatorie;
- momenti di una variabile aleatoria;
Testi di riferimento
- Dispense a cura del docente e collezione temi d'esame.
- http://www.itl.nist.gov/div898/handbook/
- http://stattrek.com/
Modalità insegnamento
L'insegnamento prevede la didattica frontale come metodo principale. Le lezioni sono tutte problem-oriented nel senso che l'importanza e la significatività della lezione
viene stimolata nello studente presentando casi di studio reali e guidandolo verso la soluzione del problema dapprima mediante euristiche, attingendo dal proprio intuito,
e quindi evidenziando la necessità di disporre di metodi statistici affidabili di valutazione che, a partire dalle euristiche soggettive, sviluppino tecniche decisionali oggettive
che rendano i risultati condivisibili. In tale contesto si può dire che il corso è praticamente una successione ragionata di esercitazioni in svariati campi economico-gestionali
che determinano il supporto applicativo in cui si innescano le nozioni di teoria. Parte integrante e altamente formativa del corso sono i ricevimenti settimanali in cui i discenti,
riuniti spontaneamente in piccoli gruppi di lavoro, discutono con il docente le soluzioni da essi proposte sui temi di una nutrita e variegata collezione di appelli d'esame su un arco
temporale di circa 15 anni.
In emergenza COVID sono state effettuate lezioni a distanza tramite piattaforma ZOOM.
Frequenza
La frequenza non è obbligatoria
Modalità di esame
Gli elementi presi in esame ai fini della valutazione sono l'acquisizione da parte dello studente degli strumenti di base introdotti nel corso e la capacità di ragionamento e
di utilizzo di tali strumenti per la risoluzione di problemi specifici.
La valutazione dell'effettivo apprendimento da parte dello studente avviene unicamente mediante una prova scritta obbligatoria.
La prova scritta è semistrutturata, a stimolo chiuso e risposta aperta. Essa consiste in 4 o 5 casi reali di studio presi dal web, in diversi ambiti conoscitivi.
Ogni tema viene decomposto in sottoproblemi per ognuno dei quali è assegnato un punteggio. Il voto su ciascun sottoproblema dipende dalla qualità ed efficacia della soluzione proposta
e dalla correttezza dei calcoli. Il voto per ciascun problema è ottenuto come somma dei voti ottenuti sui suoi sottoproblemi; la somma dei voti sull'insieme dei casi di studio
dell'elaborato ne determinano il voto finale.
Modalità di erogazione
Didattica forntale e a distanza con registrazione delle lezioni