Abstract
Della enorme quantità di dati attualmente disponibile per un’organizzazione (impresa, ente ecc.) solo il 20% è rappresentato da dati strutturati, l’altro 80% è solitamente disponibile in forma di testo libero. Uno dei metodi per estrarre valore da questi dati è utilizzare tecniche di Text Mining con il fine di migliorare ricerca, elaborazione e analisi. Obiettivo del progetto INTERROGATE è definire un’architettura Big Data, basata su soluzioni open source, che consenta di applicare complessi modelli di Text Mining a grandi quantità di dati in modo scalabile. Tali modelli, basati sulle più avanzate tecniche di AI (deep learning), arricchiranno le risorse testuali con nuove informazioni strutturate, allo scopo di abilitare inedite e potenti funzionalità di ricerca, aggregazione ed analisi. Gli obiettivi operativi del progetto sono 2: (i) Progettazione e implementazione dell’Architettura Big Data; (ii) Studio e implementazione dei modelli di Text Mining. Nello specifico la portata innovativa del progetto, dal punto di vista scientifico e tecnologico, risiede sia nella implementazione di nuovi modelli di Authorship Attribution, Zero-Shot Learning e Named Entity Recognition & Disambiguation, sia nella sfida tecnologica rappresentata dal dover fare agire questi modelli con grandi volumi di dati (Big Data). A questo scopo, la piattaforma sarà sviluppata con standard aperti e componenti open source secondo uno schema modulare che permetta una facile evoluzione e adattamento a diversi scenari.
L’architettura sarà costituita da layer quali ingestion, processing, storage e presentation, ognuno indipendente, adattabile ed estendibile a seconda delle esigenze, seguendo il paradigma di sviluppo a microservizi e cloud-native.
I modelli saranno applicabili a una vasta gamma di scenari a garanzia di replicabilità della soluzione tecnologica proposta e dell’alto valore delle competenze offerte agli assegnisti che saranno reclutati per il progetto (maggior occupabilità).
I due assegnisti impegnati nello svolgimento di queste attività costituiranno un gruppo di lavoro con sufficiente autonomia e saranno coinvolti in un percorso formativo-lavorativo che prevede periodi di lavoro in azienda alternati a momenti di confronto e formazione di tipo accademico. Tra gli output del progetto sono previsti Report tecnici, Tool di tipo software e articoli scientifici a garanzia della qualità della ricerca, parte integrante del percorso formativo-lavorativo.
Ambito Applicativo
Ambiente, Territorio e Energia, Cultura e beni culturali, Imprese intelligenti e sostenibili, Salute, Smart agrifood
Anno di Pubblicazione
2021
Bando
Progetti di Alta Formazione attraverso l’attivazione di Assegni di Ricerca (Bando assegni di ricerca anno 2021)
Descrizione Bando
Progetti di ricerca in collaborazione fra Università/Enti di ricerca e altri soggetti pubblici o privati con l’obbiettivo di sostenere percorsi di alta formazione che integrino le conoscenze teoriche con le competenze realizzate in specifici contesti d’esperienza.
Università, Ente o Capofila Progetto
Consiglio Nazionale delle Ricerche
Acronimo
INTERROGATE
Numero Assegni / Borse
2
Contributo Erogato
60.000,00 €
Cofinanziamento %
50%
Durata in mesi
24 mesi