BIOLOGIA COMPUTAZIONALE E DINAMICA MOLECOLARE III

Obiettivi formativi

Il corso si propone di fornire agli studenti conoscenze teoriche e pratiche relative all’applicazione di metodologie computazionali allo studio di sistemi biologici complessi, con particolare riferimento all’analisi di big data omici, all’utilizzo di strumenti bioinformatici e all'impiego di tecniche di dinamica molecolare e machine learning. Modulo 1 – Big Data e Scienze Omiche Conoscenza e comprensione Conoscere i comandi fondamentali della shell Unix/Linux per la gestione del filesystem. Acquisire familiarità con i concetti base della genomica e trascrittomica e le principali tecnologie di sequenziamento (prima, seconda e terza generazione). Comprendere l’organizzazione e il contenuto delle principali banche dati biologiche. Capacità di applicare conoscenza e comprensione Utilizzare comandi shell per manipolare file, cartelle, flussi di dati e filtri (es. grep) in ambienti di big data. Applicare strumenti bioinformatici per analisi di espressione genica, annotazioni funzionali e visualizzazione genomica (es. UCSC Genome Browser). Sfruttare web tools per analisi differenziali ed enrichment funzionale. Autonomia di giudizio Valutare criticamente strumenti, metodi e risorse bioinformatiche utilizzate per l’analisi di dati omici. Selezionare le strategie più appropriate per interrogare, integrare e analizzare grandi dataset biologici. Abilità comunicative Presentare e discutere in modo efficace i risultati di analisi bioinformatiche, utilizzando una terminologia scientifica corretta e strumenti digitali di comunicazione. Capacità di apprendimento Sviluppare un approccio autonomo e proattivo all'apprendimento continuo nell’ambito della bioinformatica e delle scienze omiche, con particolare attenzione all’aggiornamento delle risorse digitali e dei database. Modulo 2 – Introduzione al Machine Learning per Big Data Biologici Illustrare i concetti fondamentali del ML, con particolare attenzione alle principali tipologie di apprendimento (supervisionato, non supervisionato e reinforcement learning), e a nozioni chiave come feature, class label, selezione delle features, training, validazione e test di un modello. Descrivere e discutere le fasi principali di un processo di ML, tra cui: il pre- processamento dei dati, la suddivisione in dataset di training e di test, l’addestramento e la valutazione del modello, nonché il miglioramento delle prestazioni attraverso la regolazione degli iperparametri. Modulo 3 – Computational Biology and Molecular Dynamics Conoscenza e comprensione Acquisire conoscenze aggiornate sulle metodologie computazionali per l’analisi strutturale delle biomolecole, incluso il docking molecolare, la modellazione proteica e la dinamica molecolare. Comprendere le relazioni tra struttura, dinamica e funzione delle proteine. Capacità di applicare conoscenza e comprensione Utilizzare strumenti per sessioni computazionali scientifiche e per l’analisi strutturale di proteine. Modellare la struttura tridimensionale di proteine e simulare la dinamica molecolare di proteine solubili e di membrana, oltre a interazioni ligando/proteina. Accedere a banche dati per completare, validare e analizzare modelli strutturali. Interpretare criticamente i risultati delle simulazioni e stimarne la rilevanza biofisica. Autonomia di giudizio Valutare in modo indipendente la qualità dei dati computazionali e sperimentali. Formulare giudizi informati sull’affidabilità di modelli biologici ottenuti da simulazioni o predizioni. Abilità comunicative Comunicare efficacemente metodi, risultati e conclusioni a interlocutori specialisti e non, anche in ambiti interdisciplinari. Capacità di apprendimento Condurre indagini computazionali autonome, anche in contesti di ricerca avanzata, mantenendo aggiornate le proprie competenze tecniche e scientifiche.

Canale 1
ALLEGRA VIA Scheda docente

Programmi - Frequenza - Esami

Programma
Diversi tipi di apprendimento automatico. Concetti chiave: apprendimento supervisionato e non supervisionato, problemi di classificazione, regressione e clustering, classi ed etichette, addestramento, validazione e test. Costruire buoni dataset di addestramento - Preelaborazione dei dati Dataset di addestramento e di test KNN Creazione di un modello Convalida del modello (k-fold cross validation) Regolazione degli iperparametri Valutazione delle prestazioni
Prerequisiti
Un background biologico o biomedico. Conoscenza di una varietà di dati e domande biologiche. Per il modulo di programmazione non è necessaria alcuna esperienza precedente. È richiesta la familiarità con almeno uno dei principali sistemi operativi (Linux, Mac OSX, Windows 10). Familiarità con la Google Suite non è un prerequisito, ma è consigliata.
Testi di riferimento
Sebastian Raschka - Introduction to Machine Learning https://sebastianraschka.com/resources/ml-lectures-1/ Ulteriori materiali didattici (tra cui slide, esercitazioni, video, appunti, estratti di libri di testo, esempi, script) saranno forniti dalla docente prima e durante il corso.
Frequenza
Il corso si svolgerà in presenza e farà uso di approcci di apprendimento attivi e interattivi per facilitare l'apprendimento.
Modalità di esame
- Illustrare i concetti fondamentali del ML, con particolare attenzione alle principali tipologie di apprendimento (supervisionato, non supervisionato e reinforcement learning), e a nozioni chiave come feature, class label, selezione delle features, training, validazione e test di un modello. - Descrivere e discutere le fasi principali di un processo di ML, tra cui: il pre-processamento dei dati, la suddivisione in dataset di training e di test, l’addestramento e la valutazione del modello, nonché il miglioramento delle prestazioni attraverso la regolazione degli iperparametri.
Modalità di erogazione
I risultati dell'apprendimento guideranno la progettazione delle esperienze di apprendimento). Per il raggiungimento di ogni risultato di apprendimento, verranno identificate e pianificate le esperienze didattiche più appropriate.
  • Anno accademico2025/2026
  • CorsoBiotecnologie mediche
  • CurriculumBiomolecolare
  • Anno1º anno
  • Semestre2º semestre
  • SSDBIO/10
  • CFU1