NEURAL NETWORKS FOR DATA SCIENCE APPLICATIONS

Obiettivi formativi

General objectives: The course provides an overview on the use of deep neural networks in the context of data science and data science applications. The course is split into a methodological part (introducing basic concepts and tools for building neural networks), and a practical part with several hands-on coding sessions, followed by one homework, one final project, and an oral examination. Specific objectives: The first part of the course will (briefly) reintroduce the mathematical skills required for the course, including linear algebra and numerical optimization. Then, we will survey basic neural network components ranging from linear models to fully-connected ones layers. We will then move to a selection of advanced models (convolutive networks, transformers, graph neural networks, autoregressive models), and a series of selected advanced topics (fairness, robustness, deployment of the models). Knowledge and understanding: At the end of the course, the students will have a broad knowledge of state-of-the-art tools and techniques for implementing deep neural networks in several fields, as long as practical hands-on ability to translate conceptual designs into practical coding. Critical and judgment skills: The students will learn to tackle a complex data science project, decomposing it into blocks that are solvable through one or more neural network models. Communication skills: The students will learn to effectively communicate their knowledge along three major axes, (i) via suitably describing their final projects with a final report, (ii) orally for the final exam, and (iii) through careful code documentation and restructuring. Learning ability: The students will be able to autonomously read and reimplement state-of-the-art papers and models going beyond the basic topics of the course, thanks to a selection of papers and tools that will be discussed during the lectures.

Canale 1
SIMONE SCARDAPANE Scheda docente

Programmi - Frequenza - Esami

Programma
1. Prerequisiti (algebra lineare, ottimizzazione). 2. Apprendimento supervisionato con regressione lineare e regressione logistica (+ laboratorio in TensorFlow). 3. Reti fully-connected per dati vettoriali e differenziazione automatica (+ laboratorio in TensorFlow). 4. Reti convolutive per immagini e sequenze (+ laboratorio in TensorFlow). 5. Reti per grafi (+ laboratorio in TensorFlow). 6. Reti basate su attenzione per sequenze ed insiemi (+ laboratorio in TensorFlow). 7. Continual e multi-task learning. 8. Cenni su robustezza, interpretabilità, deployment dei modelli.
Prerequisiti
- Basi di algebra lineare (calcolo con matrici). - Analisi (differenziazione di funzioni multi-variate). - Ottimizzazione (discesa al gradiente di funzioni continue). - Programmazione ad oggetti in Python. - Cenni di apprendimento supervisionato.
Testi di riferimento
- Libro del docente: https://www.sscardapane.it/alice-book/ - Slide e materiali aggiuntivi rilasciati sul sito.
Frequenza
Lezioni in aula, non obbligatorie.
Modalità di esame
L'esame si compone di un homework conclusivo, ed un orale sugli argomenti del corso. Entrambi posso essere svolti in qualsiasi momento dell'anno accademico.
Bibliografia
Per ogni sezione, viene riportata nelle slide di riferimento.
Modalità di erogazione
Lezioni in aula con didattica frontale, con eventuale didattica da remoto che dipenderà dall'attrezzatura audio-video presente in aula. Tutte le informazioni sulla didattica saranno rilasciate su una pagina Google Classroom.
  • Codice insegnamento10589627
  • Anno accademico2025/2026
  • CorsoData Science
  • CurriculumCurriculum unico
  • Anno2º anno
  • Semestre1º semestre
  • SSDING-IND/31
  • CFU6