Metodi Numerici per il Datamining

Metodi Numerici per il Datamining

Crediti

6

Propedeuticità

Nessuna.

Settore scientifico-disciplinare

MAT/08 Analisi Numerica.

Modalità dell’esame

Valutazione di un progetto sviluppato su temi introdotti nel corso, discussione e prova orale.

Obiettivi
formativi

Il corso intende fornire strumenti e metodologie numeriche per l’analisi di grandi moli di dati (Big data analytics) e l’estrazione di informazioni da essi (datamining). Un aspetto centrale del corso è lo studio di modelli matematici ed di algoritmi numerici per il trattamento dei dati, la classificazione ed il clustering.

Programma

Analisi di dati attraverso la fattorizzazione SVD della matrice di covarianza (Principal Component Analysis – PCA) e algoritmo PCA. Clustering e principali algoritmi di clustering: k-means e k-medoids. Metodi numerici per il datamining e il machine learning, la metodologia del linear discriminant analysis. Cenni alle reti neurali artificiali: le self-organization maps. Algoritmi numerici di classificazione, le Support Vector Machine, il metodo di Nearest Neighbors, algoritmo di Learning Vector Quantization. Metodi numerici per problemi di identificazione. Rappresentazione dei dati nel caso di problemi di regressione lineare statica, lineare dinamica e nel caso non lineare delle reti neurali. Il filtro di Kalman. Cenni ad algoritmi basati su metodi Monte Carlo (particle filter).

Risultati dell’apprendimento
attesi

Al termine dell’insegnamento, lo studente deve dimostrare di

  • conoscere e comprendere le principali tecniche di analisi di banche dati di grandi dimensioni e di inferenza della conoscenza;
  • saper applicare le conoscenze acquisite per l’analisi predittiva di fenomeni e al miglioramento dell’efficacia ed efficienza dei modelli;
  • saper comunicare in maniera chiara, rigorosa ed efficace idee e soluzioni a interlocutori specialisti e non specialisti;
  • saper individuare i metodi più appropriati per analizzare e risolvere un problema inerente gli argomenti del corso e interpretare correttamente i risultati.

Risultati di apprendimento
che si intende verificare

Padronanza delle conoscenze, chiarezza nell’esposizione, rigore nell’uso del linguaggio, familiarità con le nozioni acquisite.