Ricerca
Le aree di ricerca
Il Datalab è un’importante infrastruttura di ricerca per i progetti del DEMS, di altri dipartimenti dell’ateneo e anche di altri gruppi di ricerca italiani e internazionali. Queste sono le principali aree di ricerca.
Analisi serie storiche
Le serie storiche, cioè misurazioni collezionate nel tempo, costituiscono una delle forme di dati più frequenti. L’analisi delle serie storiche è la disciplina che permette di prevedere, ricostruire e, in generale, estrarre informazione da dati in questo particolare formato. Gli ambiti di applicazione sono molteplici: economia e finanza, energia, manutenzione predittiva, medicina e salute pubblica, turismo, ecc.
Neuroscienza computazionale
La neuroscienza computazionale è un campo multidisciplinare che combina biologia, medicina, biofisica, psicologia, informatica e statistica per lo studio del cervello utilizzando approcci computazionali. I dati misurati sono molto rumorosi e ad elevata dimensionalità, e per trarre conclusioni inferenziali solide risulta necessario l’utilizzo di metodologie avanzate e risorse computazionali adeguate.
Credit risk modeling
Una delle attività più frequenti per un’istituzione finanziaria è quella di valutare il rischio che l’istituzione stessa corre nel prestare soldi a un privato o a un’azienda. Modellare il rischio di credito consiste nell’utilizzare le informazioni disponibili per derivare la probabilità di restituzione di un debito da parte di una persona fisica o un’azienda.
Data management per l'intelligenza artificiale
L'esplosione del machine learning e dell'intelligenza artificiale nelle organizzazioni pubbliche e private solleva diversi problemi nell'intero processo, dall'acquisizione dei dati all'esplorazione, alla modellazione e all'analisi dei risultati. L'uso di strumenti metodologici di data management come la qualità dei dati, l'annotazione dei dati, la provenienza e l'esplorazione automatica dei dati sono alcune delle possibili soluzioni necessarie per un apprendimento automatico a livello industriale che sia completo, efficace ed efficiente.
Statistica bayesiana nonparametrica
Lo sviluppo di strumenti automatizzati per l'analisi di dati complessi è un ambito in rapida evoluzione. Tuttavia, i metodi esistenti spesso mancano di un'interpretazione trasparente, di una precisa quantificazione dell'incertezza e sono difficilmente applicabili ad insiemi di dati con numerosità campionaria limitata. In questi contesti, la statistica bayesiana nonparametrica rappresenta invece una scelta naturale, poiché permette di modellare in maniera flessibile dati ad alta complessità pur mantenendo ottime proprietà inferenziali.
Apprendimento con rinforzo per sistemi decisionali
Reinforcement Learning (RL), o apprendimento con rinforzo, rappresenta un insieme di tecniche utili alla creazione di agenti artificiali in grado di scegliere autonomamente azioni ottimali con l’obiettivo di raggiungere determinati obiettivi interagente con l’ambiente in cui agiscono. Possibili applicazioni possono variare dalla definizioni di agenti per la guida autonoma a agenti in grado di supportare le decisioni in un contesto di medicina personalizzata.
Machine learning automatizzato e ottimizzazione bayesiana
Il machine lelarning automatizzato (AutoML) è il processo di automazione dell'applicazione end-to-end di ML a problemi del mondo reale, coprendo l'intera pipeline dal set di dati non elaborati al modello ML distribuibile. L'autoML "democratizza" il machine learning consentendone l'uso ai non esperti , identificando modelli e pipeline più accurati e più velocemente rispetto ad un processo manuale. I recenti progressi includono anche la Neural Architecture Search (NAS), mirata alla ricerca efficiente delle architetture di reti neurali profonde. L'ottimizzazione bayesiana è uno degli approcci maggiormente basati sui principi per implementare AutoML e NAS, nonché per supportare il processo decisionale nell'ottimizzazione della simulazione e nel controllo ottimale dei sistemi cyber-fisici.
Energia
Le aziende energetiche, siano esse produttori, trader o retailer, le reti di distribuzione e i regolatori pubblici producono e utilizzano un’enorme quantità di dati. Le finalità di tali aziende ed enti possono essere pienamente raggiunte solamente con le migliori tecniche di analisi dei dati a disposizione.