Programma
Nozioni introduttive: collettivo statistico, unità statistica, caratteri e modalità. Distribuzione unitaria e di frequenze. Frequenze cumulate. Distribuzioni in classi.
Rappresentazioni grafiche. Funzione di ripartizione empirica e sua rappresentazione grafica.
Introduzione al concetto di media: medie analitiche e medie lasche. La media aritmetica e sue proprietà. Media aritmetica per distribuzioni di frequenze e in classi. Moda, mediana e quantili. Calcolo della moda, mediana e quantili per le distribuzioni di frequenza e in classi.
Indici di variabilità: scostamenti semplici medi, deviazione standard e varianza. Scomposizione della devianza. Calcolo della varianza per distribuzioni di frequenza e in classi. Differenza semplice media. Campo di variazione. Differenza interquartile. Coefficiente di variazione. La concentrazione e sue misure: curva di Lorenz e indice di Gini per distribuzioni unitarie. L’eterogeneità e sue misure.
La simmetria e misure di asimmetria.
Numeri indici semplici e complessi.
Distribuzioni doppie. Indipendenza assoluta, dipendenza perfetta e misure della dipendenza. Indipendenza in media e misura del grado di dipendenza in media. Indipendenza lineare e misure del grado di associazione lineare.
Introduzione alla regressione. Determinazione dei coefficienti della retta di regressione. Bontà di adattamento della retta ai dati e indice di determinazione lineare.
Introduzione alla probabilità. Eventi casuali e spazio degli eventi. Definizioni di Probabilità. Assegnazione delle probabilità agli eventi. Principali teoremi sulla probabilità. Probabilità condizionata e indipendenza. Teorema di Bayes.
Introduzione alle variabili aleatorie. Variabili aleatorie discrete e continue e funzione di ripartizione. Valore atteso e varianza di variabili aleatorie. Alcuni modelli probabilistici discreti: la distribuzione di Bernoulli, la distribuzione Binomiale, la distribuzione Poisson. La distribuzione normale e l’uso delle tavole.
La legge dei grandi numeri e il teorema del limite centrale.
Popolazione e campione: introduzione alle distribuzioni campionarie. La distribuzione della media campionaria.
Cenni di teoria della stima puntuale e proprietà degli stimatori.
Introduzione agli intervalli di confidenza. Intervalli di confidenza per la media di una popolazione Normale con varianza nota e incognita. Intervalli di confidenza per la media di una popolazione qualsiasi nel caso di grandi campioni. Intervalli di confidenza per una proporzione nel caso di grandi campioni.
Introduzione alla verifica di ipotesi e tipologie di errore. Verifica delle ipotesi per la media di una popolazione Normale con varianza nota e incognita. Verifica delle ipotesi per la media di una popolazione qualsiasi nel caso di grandi campioni. Verifica delle ipotesi per una proporzione nel caso di grandi campioni.
Test d’indipendenza Chi-quadrato.
Inferenza sul modello di regressione lineare semplice.
Il tempo dedicato alle varie parti del programma viene calibrato di volta in volta, in base al livello di ricettività degli studenti. Il programma effettivamente svolto durante le lezioni è consultabile al seguente indirizzo:
https://web.uniroma1.it/memotef/statistica-corso-base-g-guagnano
Prerequisiti
Conoscenza degli strumenti fondamentali di analisi matematica
Testi di riferimento
G. Cicchitelli, P. D’Urso, M. Minozzo, Statistica: principi e metodi, Pearson, 2022, esclusi i seguenti capitoli e paragrafi: 4.3, 4.4, 4.14, 5.3, 6.3, 14.7, 21, 24-26.
In alternativa: S. Borra e A. Di Ciaccio, Statistica, McGraw-Hill, IV ed. o precedenti, esclusi i capitoli e paragrafi 3.3, 3.4, 6.7, 10.7, 11.9, 13.7.1, 13.8, 14.5-14.7, 16, 18-21; i capitoli 7 e 17 non sono fondamentali ai fini della preparazione dell’esame, ma possono essere utili a scopo esercitativo.
Trattandosi di corso istituzionale, lo studente può in realtà fare riferimento a qualsiasi testo di statistica di base a livello universitario contenente tutti gli argomenti presenti nel programma.
Frequenza
La frequenza non è obbligatoria ed è prevista in presenza
Modalità di esame
L'accertamento è volto a valutare le conoscenze acquisite dallo studente, nonché le sue capacità di esposizione e di utilizzo di una terminologia appropriata, di analisi quantitativa di dati reali (mediante l'applicazione degli strumenti statistici più idonei) e di interpretazione critica dei risultati ottenuti.
Esso consiste in una prova scritta, della durata di due ore, comprendente esercizi numerici e quesiti a risposta multipla o a risposta aperta.
In particolare, le domande a risposta multipla e a risposta aperta sono maggiormente finalizzate a verificare la conoscenza degli aspetti teorici degli argomenti del programma e la capacità di interpretazione e di valutazione critica dei risultati provenienti dall'applicazione degli strumenti statistici; gli esercizi numerici sono finalizzati a verificare la capacità di utilizzo degli strumenti statistici in una analisi quantitativa.
A ciascun quesito è assegnato un punteggio specifico e la valutazione globale della prova scritta è espressa in trentesimi.
In alcuni casi - ad esempio quando uno studente non raggiunga la piena sufficienza, oppure risulti dubbia la provenienza delle risposte fornite - la docente si riserva la possibilità di integrare la prova scritta con una verifica orale. La prova orale è facoltativa in tutti gli altri casi. Tuttavia, per coloro che nella prova scritta conseguano un punteggio superiore a 23/30, la prova orale diventa necessaria per l'eventuale conferma di tale valutazione; in assenza di questa ulteriore verifica, verrà verbalizzato il voto 23/30, a prescindere dalla valutazione ottenuta nella prova scritta. In tutti i casi, il voto finale è ottenuto come media dei voti ottenuti nelle due prove (scritta e orale).
Modalità di erogazione
L'attività didattica consiste principalmente in lezioni frontali di tipo tradizionale, ma può prevedere anche lavori di gruppo e la predisposizione di elaborati (tesine) con analisi su dati reali.