DATA MINING

Obiettivi formativi

L'obiettivo del corso è duplice. In primo luogo, esso presenterà la teoria principale dietro l'analisi dei dati. In secondo luogo, sarà hands-on e alla fine gli studenti potranno acquisire familiarità con varie state-of-the-art strumenti e tecniche per l'analisi dei dati. Useremo Python per scaricare i dati così come le ricche biblioteche machine-learning, l'ambiente R per l'elaborazione statistica, e il quadro MapReduce per l'estrazione di dati su larga scala.

Canale 1
ARISTIDIS ANAGNOSTOPOULOS Scheda docente

Programmi - Frequenza - Esami

Programma
- Distance measures - Text mining - Clustering - Generative models - PCA - Graph mining - NNs - Explainability
Prerequisiti
- Knowledge of basic algorithms - Python programming
Testi di riferimento
"Mining of Massive Datasets," by J. Leskovec, A. Rajaraman, and J. D. Ullman. Other material distributed online
Frequenza
Classes are in person.
Modalità di esame
Homeworks and/or project and oral exam or written exam
Modalità di erogazione
The course is based on in-class theoretical lectures and sometimes in-class labs.
  • Codice insegnamento1038138
  • Anno accademico2024/2025
  • CorsoEngineering in Computer Science - Ingegneria Informatica
  • CurriculumCurriculum unico
  • Anno2º anno
  • Semestre1º semestre
  • SSDING-INF/05
  • CFU6
  • Ambito disciplinareIngegneria informatica