DATA SCIENCE PER LA RICERCA SOCIALE
Canale 1
LAURA BOCCI
Scheda docente
Programmi - Frequenza - Esami
Programma
Campionamento statistico e tecniche per la raccolta dei dati nelle ricerche in ambito sociale ed economico.
Rappresentazioni matriciali di dati multidimensionali: matrice dei dati, data cleaning; data pre-processing; matrici di covarianza e di correlazione; matrici di prossimità.
Rappresentazioni grafiche di dati multidimensionali.
Apprendimento non supervisionato. Tecniche statistiche multivariate: Cluster Analysis (gerarchica, non gerarchica) e Segmentazione; Analisi in Componenti Principali.
Apprendimento supervisionato. Modello di Regressione lineare multipla ed estensioni, Regressione Logistica.
Applicazioni a dati reali con il software statistico Matòab.
Casi di studio.
Prerequisiti
Conoscenze di base di Statistica.
Testi di riferimento
Gareth James, Daniela Witten, Trevor Hastie, Robert Tibshirani. Introduzione all'apprendimento statistico. Con applicazioni in R. Piccin-Nuova Libraria, 2020.
- Versione in inglese disponibile online: https://www.statlearning.com/
Appunti delle lezioni
Frequenza
Data l’impostazione del corso orientata al know how, la frequenza, pur non essendo obbligatoria, è fortemente raccomandata.
Modalità di esame
La valutazione viene effettuata mediante una prova finale scritta svolta durante gli appelli previsti dal calendario didattico (3 appelli nella sessione Giugno/Luglio; 1 appello nella sessione di Settembre; 2 appelli nella sessione di Gennaio/Febbraio).
La prova scritta è composta da 15 domande, con quesiti sia teorici che pratici, atti a verificare conoscenza e comprensione e la capacità di applicare conoscenza e comprensione. Lo studente dovrà rispondere alle domande riportando lo svolgimento e i calcoli necessari ad ottenere il risultato indicato. Per lo svolgimento della prova scritta gli studenti avranno a disposizione 120 minuti e potranno avvalersi di una calcolatrice e delle tavole statistiche.
Durante il corso é previsto un esonero e un project work. L’esonero relativo alla Statistica Descrittiva univariata e bivariata è composto da 9 domande con quesiti sia teorici che pratici. Il Project Work consiste nell’applicazione delle tecniche apprese a dati reali.
Nella valutazione della prova d’esame e dell’esonero, la determinazione del voto finale tiene conto dei seguenti elementi:
- la logica seguita dallo studente nella risoluzione dei quesiti proposti;
- la correttezza della procedura individuata per ogni soluzione;
- l'adeguatezza di ogni soluzione proposta in relazione al tipo di quesito e alle competenze che lo studente si presuppone abbia acquisito;
- l'impiego di un linguaggio corretto ed appropriato.
Per superare l'esame occorre conseguire un voto non inferiore a 18/30. Lo studente deve dimostrare di aver acquisito una conoscenza sufficiente degli argomenti trattati nel corso e di essere in grado di individuare tecniche e strumenti statistici semplici ma adeguati alla soluzione di problemi applicativi in cui sono richiesti. Per conseguire un punteggio pari a 30/30 e lode, lo studente deve invece dimostrare di aver acquisito una conoscenza eccellente di tutti gli argomenti trattati durante il corso, essendo in grado di raccordarli in modo logico e coerente con riferimento ad esempi di applicazione. Deve inoltre dimostrare di essere in grado di individuare le tecniche e gli strumenti statistici più adeguati alla soluzione di problemi applicativi in cui sono richiesti.
Modalità di erogazione
Il modello didattico prevalente si basa su lezioni frontali ed esercitazioni improntate a sollecitare l'interazione con gli studenti e a stimolare la loro capacità di problem solving.
Ogni argomento trattato sarà pertanto integrato da esempi di applicazione ed esercizi al fine di agevolare la comprensione degli strumenti statistici e le loro possibilità di utilizzo nell'ambito di problematiche sociali.
- Codice insegnamento10606404
- Anno accademico2025/2026
- CorsoSociologia
- CurriculumCittà e Sostenibilità
- Anno3º anno
- Semestre2º semestre
- SSDSECS-S/01
- CFU6