COMPUTER VISION

Obiettivi formativi

Obiettivi generali: Il corso si propone di esporre gli studenti ad un'ampia panoramica della Computer Vision. Obiettivi specifici: Il corso si propone di fornire i principi, le metodologie di base e gli algoritmi fondamentali usati per la progettazione e l'applicazione di sistemi di visione artificiale Conoscenza e comprensione: Introduzioni dei principi fondamentali e delle diverse aree della Computer Vision e conoscenze su risoluzione di problemi quali estrazioni delle caratteristi, tracking , analisi della scena, riconoscimento di oggetti, analisi di eventi, analisi delle emozioni. Applicare conoscenza e comprensione: Saper applicare il portafoglio di tecniche e gli approcci illustrati per la progettazione e realizzazione di sistemi di visione artificiale. Capacità  critiche e di giudizio: Gli studenti apprenderanno tecniche che si sono rivelate utili per esperienza diretta e una vasta gamma di metodi matematici nella progettazione del sistema di visione. Capacità  comunicative: Gli studenti saranno in grado di interagire in modo proficuo con altri ricercatori in Computer Vision su un'ampia gamma di argomenti. Capacità  di apprendimento: Gli studenti saranno in grado di ampliare le loro conoscenze in modo autonomo consultando, secondo necessità, la letteratura scientifica basato sulla Computer Vision.

Canale 1
MARCO RAOUL MARINI Scheda docente

Programmi - Frequenza - Esami

Programma
Il corso prevede l'esplorazione delle tecniche base di image processing, dai fondamenti fisici della luce fino all'apprendimento automatico per l'estrazione di features utili al riconoscimento di azioni compiute da soggetti in scena. Il programma didattico segue il filo logico proposto nel libro di testo adottato nel corso e per ogni anno subisce modifiche soprattutto nella parte finale per mostrare nuove e più competitive tecniche per risolvere specifici problemi legati al mondo reale.
Prerequisiti
Sono richiesti solo pochi prerequisiti: Esperienza di programmazione in C/C++, Python (principalmente) o linguaggi simili. Fondamenti matematici di algebra lineare, calcolo e statistica.
Testi di riferimento
Libro di testo primario: Computer Vision: A Modern Approach, 2nd Edition – David Forsyth and Jean Ponce. Libri di testo opzionali: Computer Vision: Algorithms and Applications – Richard Szeliski. *Introductory Techniques for 3-D Computer Vision* – E. Trucco and A. Verri. Digital Image Processing – R.C. Gonzalez and R.E. Woods. Risorse aggiuntive: Vision Science: Photons to Phenomenology – Stephen E. Palmer (for color and perception). Research papers from conferences like CVPR, ICCV, and journals like IEEE TPAMI.
Frequenza
Frequenza non obbligatoria ma fortemente suggerita.
Modalità di esame
L'esame consiste in due parti: una presentazione con slide su un argomento selezionato e la dimostrazione di un progetto in linea con l'argomento dell'elaborato, con relativa relazione. La durata massima di ciascuna parte è di 10 minuti (10 minuti per l'elaborato e 10 minuti per il progetto). È consentito il lavoro di gruppo, con un massimo di 4 studenti per gruppo. Gli argomenti possono essere assegnati proponendo un argomento o un problema specifico nell'ambito di un campo di interesse prescelto (richiesta diretta) o richiedendo un argomento suggerito in assenza di un'idea specifica (richiesta indiretta). Il progetto richiede competenze di programmazione di base ed è possibile utilizzare codice preesistente, ma deve essere adattato per allinearlo all'argomento dell'elaborato e al problema da affrontare. Lo sviluppo di un sistema originale non è obbligatorio. Il codice e i materiali di presentazione devono essere consegnati due giorni prima della data d'esame. Il voto finale è determinato dalla frequenza al corso (5%), dalla presentazione finale (40%) e dal progetto finale (55%). Ulteriori considerazioni, come la creatività, la presentazione di un elaborato supplementare e la complessità del compito, possono contribuire fino a circa il 10%. I voti finali riflettono l'impegno e il rigore dimostrati durante l'intero processo d'esame.
Bibliografia
Computer Vision: A Modern Approach, 2nd Edition – David Forsyth and Jean Ponce. Slides presentate durante il corso.
Modalità di erogazione
Le lezioni si svolgono in presenza e richiedono spesso l'utilizzo del proprio laptop.
MARCO RAOUL MARINI Scheda docente

Programmi - Frequenza - Esami

Programma
Il corso prevede l'esplorazione delle tecniche base di image processing, dai fondamenti fisici della luce fino all'apprendimento automatico per l'estrazione di features utili al riconoscimento di azioni compiute da soggetti in scena. Il programma didattico segue il filo logico proposto nel libro di testo adottato nel corso e per ogni anno subisce modifiche soprattutto nella parte finale per mostrare nuove e più competitive tecniche per risolvere specifici problemi legati al mondo reale.
Prerequisiti
Sono richiesti solo pochi prerequisiti: Esperienza di programmazione in C/C++, Python (principalmente) o linguaggi simili. Fondamenti matematici di algebra lineare, calcolo e statistica.
Testi di riferimento
Libro di testo primario: Computer Vision: A Modern Approach, 2nd Edition – David Forsyth and Jean Ponce. Libri di testo opzionali: Computer Vision: Algorithms and Applications – Richard Szeliski. *Introductory Techniques for 3-D Computer Vision* – E. Trucco and A. Verri. Digital Image Processing – R.C. Gonzalez and R.E. Woods. Risorse aggiuntive: Vision Science: Photons to Phenomenology – Stephen E. Palmer (for color and perception). Research papers from conferences like CVPR, ICCV, and journals like IEEE TPAMI.
Frequenza
Frequenza non obbligatoria ma fortemente suggerita.
Modalità di esame
L'esame consiste in due parti: una presentazione con slide su un argomento selezionato e la dimostrazione di un progetto in linea con l'argomento dell'elaborato, con relativa relazione. La durata massima di ciascuna parte è di 10 minuti (10 minuti per l'elaborato e 10 minuti per il progetto). È consentito il lavoro di gruppo, con un massimo di 4 studenti per gruppo. Gli argomenti possono essere assegnati proponendo un argomento o un problema specifico nell'ambito di un campo di interesse prescelto (richiesta diretta) o richiedendo un argomento suggerito in assenza di un'idea specifica (richiesta indiretta). Il progetto richiede competenze di programmazione di base ed è possibile utilizzare codice preesistente, ma deve essere adattato per allinearlo all'argomento dell'elaborato e al problema da affrontare. Lo sviluppo di un sistema originale non è obbligatorio. Il codice e i materiali di presentazione devono essere consegnati due giorni prima della data d'esame. Il voto finale è determinato dalla frequenza al corso (5%), dalla presentazione finale (40%) e dal progetto finale (55%). Ulteriori considerazioni, come la creatività, la presentazione di un elaborato supplementare e la complessità del compito, possono contribuire fino a circa il 10%. I voti finali riflettono l'impegno e il rigore dimostrati durante l'intero processo d'esame.
Bibliografia
Computer Vision: A Modern Approach, 2nd Edition – David Forsyth and Jean Ponce. Slides presentate durante il corso.
Modalità di erogazione
Le lezioni si svolgono in presenza e richiedono spesso l'utilizzo del proprio laptop.
  • Codice insegnamento1047618
  • Anno accademico2025/2026
  • CorsoComputer Science - Informatica
  • CurriculumCurriculum unico
  • Anno2º anno
  • Semestre1º semestre
  • SSDINF/01
  • CFU6