STOCHASTIC PROCESSES FOR DATA SCIENCE

Obiettivi formativi

GENERAL DESCRIPTION The goal of this course is to provide an overview of stochastic processes, with applications to Data Science in mind. Stochastic processes and probability are important in data science because they can be used to model and analyze a wide range of data sets, from financial data to sensor data. The course will cover three parts: a gentle introduction to combinatorial stochastic processes, Gaussian processes, and probabilistic causality. Programming in R, Matlab or Python is useful, but it is not essential. Programs in R will be used. SPECIFIC OBJECTIVES: 1. Knowledge and understanding: Understand the basics of combinatorial stochastic processes and Gaussian processes, and their applications in data science. Understand the fundamentals of probabilistic causality and be able to apply these concepts to real-world data science problems. 2. Application: Apply stochastic process to real-world data sets, using programming languages such as R, Matlab, or Python. 3. Autonomy of judgement: Analyze the benefits and limitations of different stochastic process models and determine the best model to use for a given data set. 4. Communication: Communicate effectively about stochastic processes, including design constraints, solutions, and potential applications. 5. Learning skills: Develop studies in the field of stochastic processes for data science, including the ability to undertake research in this area.

Canale 1
ENRICO SCALAS Scheda docente

Programmi - Frequenza - Esami

Programma
Questo corso consiste di tre parti. Sulla base della formazione e degli interessi del gruppo di studenti e studentesse, ciascuna parte puo' essere estesa e trattata in maggiore dettaglio a scapito di altre parti. La programmazione in R, Matlab o Python e' utile, ma non essenziale. Si useranno programmi in R. Parte I: Un'introduzione essenziale ai processi stocastici combinatori Parte II: Processi Gaussiani Parte III: Causalita' probabilistica
Prerequisiti
Concetti base di analisi matematica e probabilità.
Testi di riferimento
GARIBALDI U., SCALAS E., Finitary Probabilistic Methods in Econophysics (2010), CAMBRIDGE UNIVERSITY PRESS VERSHYNIN R., High-Dimensional Probability, An Introduction with Applications in Data Science (2018), CAMBRIDGE UNIVERSITY PRESS PEARL J., Causality (Second edition) (2009), CAMBRIDGE UNIVERSITY PRESS
Frequenza
Frequenza libera.
Modalità di esame
Prova scritta e orale. La prova scritta potrà consistere di una serie di esercizi da svolgere “a casa” (take-home exercises) e inviare al docente entro una scadenza precisa oppure una serie di esercizi da svolgere in aula con consultazione di testi permessa. La prova orale sarà facoltativa a richiesta.
Bibliografia
Si veda il sito classroom del corso
  • Codice insegnamento10615930
  • Anno accademico2025/2026
  • CorsoData Science
  • CurriculumCurriculum unico
  • Anno1º anno
  • Semestre2º semestre
  • SSDMAT/06
  • CFU6