BIG DATA COMPUTING
Obiettivi formativi
Obiettivi generali Il corso si propone di introdurre le principali tecniche algoritmiche e di programmazione nell’analisi di big data, affrontando una varietà di problemi di data mining in modelli di calcolo adatti alla gestione di grandi quantità di dati. Obiettivi specifici Capacità di analisi, modellazione, e risoluzione di problemi tipici dell'area "Big Data" attraverso l'implementazione di "pipeline" di machine learning su ambienti distribuiti tramite PySpark. Conoscenza e comprensione: Al termine del corso gli studenti avranno una comprensione dettagliata dei modelli di programmazione per l'analisi di dati distribuiti su cluster di computer, nonché di modelli computazionali avanzati per l'elaborazione di enormi quantità di dati (ad esempio, streaming di dati, parallelismo in stile MapReduce e algoritmi efficienti in memoria secondaria). Applicare conoscenza e comprensione: gli studenti saranno in grado di progettare e analizzare algoritmi per l’analisi di big data in diversi scenari, sapranno scrivere codice efficiente e scalabile tenendo conto delle caratteristiche architetturali delle moderne piattaforme di calcolo (inclusi i sistemi distribuiti), e sapranno lavorare sfruttando una varietà di sistemi software adatti al processamento di big data (tra cui Hadoop). Capacità critiche e di giudizio: gli studenti saranno in grado di capire i paradigmi di calcolo più adatti in scenari differenti, valutando vantaggi e svantaggi di ciascun modello computazionale e affrontando le sfide che si presentano nella progettazione e implementazione di una varietà di applicazioni. Capacità di comuniczione: gli studenti saranno in grado di comunicare in modo efficace, riassumendo in modo chiaro le idee principali nella progettazione di sistemi e algoritmi per l’analisi di big data e presentando informazioni tecniche accurate. Capacità di apprendimento successivo: obiettivo del corso è quello di toccare una varietà di tecniche il più possibile ampia, introducendo pratiche standard e argomenti di ricerca all'avanguardia in questo settore e consentendo quindi agli studenti di estendere le conoscenze acquisite in modo indipendente, anche in base all’evoluzione tecnologica.
Programmi - Frequenza - Esami
Programma
Prerequisiti
Testi di riferimento
Frequenza
Modalità di esame
Bibliografia
Programmi - Frequenza - Esami
Programma
Prerequisiti
Testi di riferimento
Frequenza
Modalità di esame
Bibliografia
Programmi - Frequenza - Esami
Programma
Prerequisiti
Testi di riferimento
Modalità insegnamento
Frequenza
Modalità di esame
Bibliografia
Modalità di erogazione
Programmi - Frequenza - Esami
Programma
Prerequisiti
Testi di riferimento
Modalità insegnamento
Frequenza
Modalità di esame
Bibliografia
Modalità di erogazione
- Codice insegnamento1041764
- Anno accademico2025/2026
- CorsoComputer Science - Informatica
- CurriculumCurriculum unico
- Anno2º anno
- Semestre1º semestre
- SSDINF/01
- CFU6