Tesi di Laurea

Di seguito sono elencati i progetti di tesi attualmente disponibili. Progetti aggiuntivi possono inoltre essere discussi e concordati.
Sono disponibili anche progetti per percorsi di eccellenza, che includono sia attività di ricerca (su tematiche affini a quelle dei progetti di tesi di sotto descritti) sia attività di raccolta di dati e costruzione di dataset (esempio, registrazione tracce audio con tecniche microfoniche e organizzazione tracce in dataset).
Ulteriori informazioni sui progetti possono essere chiesti via mail o prendendo un appuntamento.


MACHINE LEARNING PER L'ANALISI DI AUDIO E MUSICA
  • Reti Neurali Quaternioniche per l’Analisi di Audio 3D
  • Questo progetto di tesi si occupa dello studio di una classe di algoritmi di deep learning per l’analisi di segnali audio 3D per applicazioni audio in ambienti immersivi. A tal fine, verrà studiata una nuova generazione di reti neurali per modellare e apprendere segnali in domini ipercomplessi (ad esempio quaternionico). Le possibili applicazioni includono: localizzazione del suono immersiva, miglioramento dell'audio, riconoscimento della scena acustica e super-risoluzione audio.
    Linguaggio di programmazione: MATLAB/Pyhton
  • Metodi di Machine Learning nel Dominio Ipercomplesso per la Stima di Dati Mancanti
  • L'algebra ipercomplessa può essere utilizzata per sviluppare un apprendimento automatico efficiente per applicazioni di elaborazione del segnale più ampie, come la stima dei dati mancanti. Le possibili applicazioni possono comprendere tra le altre, la separazione della sorgente audio, il text mining, il separazione di immagini iperspettrali, il miglioramento qualitativo del parlato.
    Linguaggio di programmazione: MATLAB/Pyhton
  • Algoritmi di Apprendimento End-to-End per il Riconoscimento Vocale
  • Gli assistenti vocali personali stanno diventando sempre più popolari. Una delle applicazioni fondamentali per tali dispositivi è il riconoscimento vocale, che deve essere molto robusto e indipendente dall'ambiente. Il beamforming adattativo neurale consiste in algoritmi di miglioramento qualitativo del segnale per condizioni ambientali sconosciute o mutevoli nel tempo. Tali modelli possono essere utilizzati per il miglioramento multicanale, la modellazione acustica e il riconoscimento vocale.
    Linguaggio di programmazione: Pyhton
  • Metodi Generativi per la Separazione di Sorgenti
  • La separazione di sorgenti a singolo canale rappresenta un problema da sempre molto esplorato nel campo dell'elaborazione del segnale. Questo progetto di tesi esplora nuovi metodi per BSS utilizzando metodi contraddittori, basandosi sul presupposto di una densità di probabilità di uscita. Tali metodi possono essere applicati a diversi problemi, dalle immagini ai segnali vocali. Particolare attenzione può essere data alle applicazioni audio, come il miglioramento del parlato, il riconoscimento vocale automatico, la super-risoluzione audio.
    Linguaggio di programmazione: Pyhton
  • Deep Learning per la Super-Risoluzione di Segnali Audio
  • L'obiettivo della super risoluzione audio, o espansione della larghezza di banda audio, è quello di generare le componenti ad alta frequenza mancanti per un dato segnale a bassa risoluzione. Ciò porta ad un miglioramento della qualità percepita dell'audio. Questo progetto di tesi esplorerà metodi innovativi di deep learning per la super risoluzione audio. I risultati sperimentali coinvolgeranno sia metriche oggettive di qualità dell’audio che test percettivi soggettivi.
    Linguaggio di programmazione: Pyhton
  • Trasferimento Neurale di Stile in Musica
  • Il trasferimento neurale di stile (TNS) si riferisce a una classe di modelli neurali che elaborano un segnale e lo modificano in modo tale da trasferirgli l'aspetto o lo stile di un altro segnale. Guidati dal successo del TNS nelle arti visive, recentemente c'è stata una tendenza crescente a sviluppare modelli TNS in musica. Lo scopo di questa tesi è di definire nuovi modelli generativi TNS per lo stile musicale.
    Linguaggio di programmazione: Pyhton

ELABORAZIONE DI SEGNALI AUDIO E ACUSTICI
  • Algoritmi Adattativi Quaternionici per Interfacce Acustiche Intelligenti 3D
  • Recentemente, le applicazioni audio 3D sono diventate molto diffuse, ad esempio in assistenti vocali, robot, realtà virtuale, giochi e intrattenimento. Ciò favorisce lo sviluppo di nuovi algoritmi che elaborano i segnali audio preservando il campo sonoro spaziale. Questo progetto di tesi affronta una classe di algoritmi quaternionici di filtraggio adattivo nel dominio della frequenza per l'elaborazione di segnali audio 3D. Le applicazioni tipiche possono includere, tra gli altri, la riduzione del rumore, il miglioramento del segnale vocale e l'equalizzazione acustica.
    Linguaggio di programmazione: MATLAB/Pyhton
  • Algebre Ipercomplesse per l’Elaborazione di Segnali Microfonici
  • Questo progetto di tesi mira a studiare l'utilità e i benefici della rappresentazione di sistemi multicanale mediante strutture matematiche, e i criteri di scelta tra diverse algebre. I confronti tra algebre ipercomplesse (ad es., quaternioni) saranno presi in considerazione per l'elaborazione di segnali tramite interfacce acustiche di microfoni.
    Linguaggio di programmazione: MATLAB/Pyhton
  • Algoritmi di Filtraggio Spazio-Temporale per Schiere di Microfoni Differenziali e Coincidenti
  • Questo progetto di tesi tratta le configurazioni geometriche di schiere di sensori coincidenti che mirano a isolare un segnale sonoro utile in uno scenario rumoroso. I problemi tipici possono essere la cancellazione dell'eco acustica e la riduzione del rumore nelle applicazioni vivavoce (ad esempio, comandi vocali per dispositivi di assistenza domestica e teleconferenze, tra gli altri). Diverse configurazioni possono essere studiate da array di microfoni differenziali a Ambisonics di primo ordine e di ordine superiore.
    Linguaggio di programmazione: MATLAB/Pyhton
  • Combinazione di Filtri Adattativi per il Miglioramento Qualitativo di Segnali Vocali
  • Questo progetto di tesi è finalizzato all'analisi delle prestazioni di tracciamento di un sistema di filtri multicanale in combinazione adattiva che ha la proprietà di ottimizzare l’operazione di filtraggio in scenari non stazionari con sorgenti mobili. È inoltre possibile prendere in esame l'estensione ai filtri del dominio di frequenza. Possono essere prese in considerazione diverse applicazioni, come scenari di robot/assistenti domestici con parlatore in movimento o schiere di microfoni in movimento (ad esempio microfoni installati su robot mobili).
    Linguaggio di programmazione: MATLAB

INTELLIGENZA ARTIFICIALE E MACHINE LEARNING PER L'ELABORAZIONE DI SEGNALI BIOMEDICI
  • Architetture di Deep Learning per la Risonanza Magnetica Veloce
  • Questo progetto di tesi studia l'uso di architetture di reti neurali deep per velocizzare i tempi di indagine della risonanza magnetica ricostruendo i dati del k-spazio sottocampionato. I possibili sviluppi includono nuove architetture neurali, strategie ottimali di sottocampionamento, applicazione a risonanza magnetica e risonanza magnetica funzionale.
    Linguaggio di programmazione: Python
  • Architetture Multimodali di Deep Learning per la Ricostruzioni di Immagini Mediche
  • Questo progetto di tesi indaga sull'uso di architetture neurali multimodali per la ricostruzione di immagini biomediche (ad es., risonanza magnetica). La ricostruzione dell'immagine viene eseguita mantenendo un'alta qualità dell'immagine che può consentire una diagnosi medica accurata. Tali metodi sfruttano l'approccio multimodale delle reti neurali e si concentrano sulle fasi di acquisizione ed elaborazione dei dati. I possibili sviluppi possono includere nuove architetture neurali, funzioni di attivazione, applicazione a diversi tipi di immagini mediche.
    Linguaggio di programmazione: Python
  • Metodi Generativi per l’Aumento di Dati per la Ricostruzione di Immagini Mediche
  • Questo progetto di tesi indaga sull'uso di architetture neurali multimodali per la ricostruzione di immagini biomediche (ad es., risonanza magnetica). La ricostruzione dell'immagine viene eseguita mantenendo un'alta qualità dell'immagine che può consentire una diagnosi medica accurata. Tali metodi sfruttano l'approccio multimodale delle reti neurali e si concentrano sulle fasi di acquisizione ed elaborazione dei dati. I possibili sviluppi possono includere nuove architetture neurali, funzioni di attivazione, applicazione a diversi tipi di immagini mediche.
    Linguaggio di programmazione: Python
  • Deep Learning per la Segmentazione e l’Individuazione di Lesioni in Immagini Mediche
  • Questo progetto di tesi affronta il problema del rilevamento, della localizzazione e della segmentazione delle lesioni nelle immagini di risonanza magnetica. Verranno studiate e sviluppate architetture di deep learning per segmentare contemporaneamente la zona di interesse nell'immagine e rilevare eventuali lesioni. Saranno prese in considerazione anche le informazioni 3D. La ricostruzione dell'immagine viene eseguita mantenendo un'alta qualità dell'immagine che può consentire una diagnosi accurata. I possibili sviluppi possono includere nuove architetture neurali, applicazione a diversi tipi di immagini e malattie mediche, ad esempio sclerosi multipla, rilevazione del carcinoma prostatico, segmentazione delle vertebre.
    Linguaggio di programmazione: Python

ELABORAZIONE NON LINEARE DI SEGNALI
  • Regolarizzazione Sparsa per Filtri Adattativi Non Lineari
  • Questo progetto di tesi si focalizza sullo studio di filtri adattativi non lineari con diverse regole di regolarizzazione che possono essere combinati in modo adattativo per fornire sempre le migliori prestazioni indipendentemente dal grado di non linearità che influenza il segnale desiderato. Le possibili applicazioni includono: cancellazione dell'eco acustica non lineare (NAEC) nei sistemi di comunicazione vocale a mani libere, equalizzazione dei canali non lineari (audio o telecomunicazioni), previsione della qualità dell'aria, previsione del carico di energia, identificazione del sistema multicanale.
    Linguaggio di programmazione: MATLAB
  • Stima ed Equalizzazione Non Lineare di Canale per Sistemi di Comunicazione
  • Questo progetto di tesi indaga su una classe di algoritmi adattativi non lineari nel dominio a valore complesso per problemi come l'equalizzazione dei canali di telecomunicazione distorti. Una particolare attenzione può essere data ai sistemi di comunicazione 5G. Tuttavia, altre applicazioni possono eventualmente essere esplorate, coinvolgendo diversi tipi di segnali di ingresso.
    Linguaggio di programmazione: MATLAB
  • Reti Neurali per la Predizione di Serie Temporali
  • La predizione di serie temporali è il processo in grado di stimare eventi futuri basati su dati storici. Questo progetto di tesi indaga su modelli predittivi basati su reti neurali per la predizione di serie temporali tra cui indici finanziari, qualità dell'aria, previsioni meteorologiche e manutenzione predittiva in contesti industriali.
    Linguaggio di programmazione: Python
  • Reti Neurali per il Rilevamento 3D di Oggetti
  • Il rilevamento di oggetti è un compito chiave nella guida autonoma. Le auto autonome sono solitamente dotate di più sensori come fotocamera o LiDAR. In questo progetto di tesi, si vogliono studiare e definire le reti basate su sensori LiDAR. Inoltre, varrà esplorata l’estensione dei modelli neurali sviluppati nel dominio ipercomplesso.
    Linguaggio di programmazione: Python
  • Reti Neurali Efficienti con Pesi e Attivazioni a Bassa Precisione
  • Questo progetto di tesi si occupa di reti neurali con pesi e attivazioni a precisione estremamente bassa (ad es., 1 bit) in fase di esecuzione. Durante il training, i pesi e le attivazioni quantizzati vengono utilizzati per calcolare i gradienti dei parametri. Nella fase forward, le reti neurali a bassa precisione riducono drasticamente le dimensioni della memoria e gli accessi e sostituiscono la maggior parte delle operazioni aritmetiche con operazioni a bit. Di conseguenza, il consumo energetico dovrebbe essere drasticamente ridotto.
    Linguaggio di programmazione: Python