ToscanaOpenResearch (TOR) è il portale della Regione Toscana ideato per comunicare e valorizzare l'ecosistema della ricerca, dell’innovazione e dell’alta formazione regionale.
Il progetto nasce nell’ambito della Conferenza regionale per la ricerca e innovazione (istituita con la Legge Regionale 20/2009) e, nello specifico, come strumento operativo del suo Osservatorio Regionale, volto favorire una governance trasparente e inclusiva dell’ecosistema ed a supportare le politiche della Giunta regionale.
ToscanaOpenResearch, rappresenta uno strumento avanzato di policy intelligence che permette di disporre di una base di conoscenza qualificata sul sistema della ricerca, dell’innovazione e dell’alta formazione, di condividere scenari informativi con gli stakeholder e di programmare politiche basate sull’evidenza (evidence-based policies).
Tecnicamente, il portale integra diverse fonti informative, in prevalenza Linked Open Data, rese interoperabili attraverso una specifica ontologia ed appositi vocabolari. . I dati, organizzati in cruscotti informativi dinamici, sono resi accessibili e scaricabili per consentirne l'esplorazione e il riutilizzo da parte di operatori economici, ricercatori e cittadini.
In linea con questi obiettivi, la Regione Toscana ha aderito nel 2024 alla “Barcelona Declaration on Open Research Information” per testimoniare il proprio impegno nel promuovere pratiche di policy fondate su open data, allo scopo di favorire processi decisionali basati su informazioni trasparenti e inclusive.
Il progetto e l’Osservatorio
Metodologia
ToscanaOpenResearch si basa su una piattaforma per l’integrazione e l’accesso a dati eterogenei relativi all’ecosistema della ricerca e dell’innovazione, costruita su un database relazionale.
Per favorire l’utilizzo e l’interoperabilità dei dati e facilitare la possibilità di estrarre e analizzare informazioni provenienti da diversi sistemi di classificazione, ToscanaOpenResearch utilizza un approccio che combina:
- Raccordi tra classificazioni native delle fonti — mappature che armonizzano sistemi di classificazione eterogenei, sia nazionali (“Settori Scientifico-Disciplinari”, “Aree CUN”, attività economiche “ATECO”) sia internazionali (“International Patent Classification”), permettendo interrogazioni incrociate indipendentemente dalla tassonomia di origine;
- Sistemi di classificazione esterni implementati mediante l’applicazione di tecniche automatiche di elaborazione del linguaggio naturale sugli abstract di progetti e pubblicazioni.
L’attività di sviluppo della nuova relase di TOR è il risultato di un processo guidato da Regione Toscana , affiancata dal partner tecnico SIRIS Academic.
Dati
Ad oggi TOR integra principalmente dati aperti provenienti da banche dati open nazionali, europee e a scala mondiale. Nello specifico le principali banche date integrate sono:
- CORDIS: piattaforma dell'Unione Europea sui progetti di ricerca finanziati nell'ambito dei programmi quadro europei (Horizon 2020, Horizon Europe, ecc.).
- OpenCoesione: portale italiano sui progetti finanziati con le politiche di coesione, per il monitoraggio della spesa dei fondi strutturali europei sul territorio nazionale.
- OpenAlex: banca dati bibliometrica aperta su pubblicazioni scientifiche, autori, istituzioni e relative affiliazioni.
- PATSTAT: banca dati dell'European Patent Office contenente informazioni sui brevetti a livello mondiale, incluse classificazioni tematiche, inventori e richiedenti.
- USTAT (Ufficio di Statistica del MUR): dati statistici sul sistema universitario italiano, inclusi studenti, laureati, personale docente, dottorati e classificazioni disciplinari.
- Cerca Università: fonte informativa sugli atenei italiani e sulla relativa offerta formativa.
- Excelsior (Unioncamere): sistema informativo sui fabbisogni occupazionali e formativi delle imprese italiane, con dati su professioni richieste, settori economici e competenze.
- Registro Imprese: fonte ufficiale sulle imprese italiane, con informazioni su settore di attività economica, valore di produzione e sede legale.
Come dati eterogenei dialogano tra loro
Per consentire analisi trasversali tra fonti eterogenee, sono stati realizzati raccordi tra sistemi di classificazione e interventi di arricchimento dei dati. In particolare:
● Corrispondenza SSD-GSD: mappatura tra i Settori Scientifico-Disciplinari (SSD 2015 e 2024) e i nuovi Gruppi Scientifico-Disciplinari (GSD), organizzata secondo le 14 aree disciplinari del Consiglio Universitario Nazionale (CUN). La corrispondenza è definita dal MIUR (D.M. 639/2025).
● Disambiguazione delle organizzazioni: È stata creata una tabella di armonizzazione che riconduce le diverse varianti di denominazione delle università italiane (presenti nelle fonti USTAT e CercaUniversità) a identificativi univoci, attraverso normalizzazione automatica e validazione manuale.
● Geolocalizzazione dei titolari di brevetti: È stata sviluppata e implementata una metodologia per integrare l'informazione geografica (a livello provinciale e regionale) dei titolari di brevetti, largamente incompleta nella fonte PATSTAT.
● Sviluppo e implementazione di classificatori testuali per l’etichettatura automatica di documenti della ricerca mediante analisi del contenuto testuale.
Approfondimento 1 – Analisi semantica
Gli abstract delle pubblicazioni, dei brevetti, dei progetti di R&I, ecc. contengono una ricchezza di informazioni testuali che descrivono in dettaglio le sfide correnti, i progressi proposti o dimostrati e l’impatto previsto del processo innovativo.
Per valorizzare tale ricchezza semantica, tecniche di elaborazione del linguaggio naturale (NLP dall’inglese Natural Language Processing) e Deep Learning sono state utilizzate per analizzare l’allineamento degli output delle attività di ricerca con particolari tassonomie definite d’interesse per il contesto regionale — in particolare la classificazione ERC (risultato del progetto TOR) e la tassonomia della Strategia di Specializzazione Intelligente (S3) della Toscana (quest'ultima attualmente in fase di implementazione). L'approccio si basa su un classificatore automatico che analizza ogni documento individualmente, assegnando categorie tassonomiche sulla base del contenuto testuale anziché di metadati dichiarati o attribuzioni manuali. Questo consente maggiore coerenza e confrontabilità tra fonti eterogenee.
Approfondimento 2 – Classificazione ERC: sviluppo e prima applicazione
Nell'ambito del progetto TOR è stato disegnato e sviluppato, in via sperimentale, un framework per la classificazione automatica dei testi, finalizzato all'assegnazione dei documenti di ricerca ai panel dell'European Research Council (ERC 2024).
L'adozione della classificazione ERC risponde all'esigenza di disporre di un riferimento disciplinare condiviso a livello europeo, che consenta di:
- confrontare in modo omogeneo le attività di ricerca degli attori toscani con quelle di altre regioni e Paesi, superando i limiti delle sole classificazioni nazionali
- utilizzare le classificazioni più comunemente diffuse nel contesto delle politiche europee della ricerca, rispetto a classificazioni native delle fonti utilizzate, che però hanno un carattere più tecnico(ad esempio, i topics adottati da OpenAlex)
- categorizzare documenti da fonti eterogenee sotto un unico sistema “trasversale”.
Si evidenzia la natura sperimentale di questa attività: il classificatore automatico non è solo uno strumento funzionale alle visualizzazioni, ma costituisce esso stesso un output metodologico del progetto, sviluppato congiuntamente da SIRIS Academic e i diversi Settori di Regione Toscana coinvolti nel progetto. .
I risultati presentati nelle visualizzazioni derivano da una prima applicazione del classificatore. Le prestazioni sono già affidabili per analisi esplorative e comparazioni di massima, ma potranno essere affinate con successive iterazioni del modello.
Il classificatore sviluppato è stato reso disponibile pubblicamente sulla piattaforma HuggingFace. Si tratta di un modello addestrato per la classificazione multi-etichetta: a partire dal titolo e dall'abstract di una pubblicazione scientifica, il sistema può assegnare simultaneamente più categorie ERC, riflettendo la natura spesso interdisciplinare della ricerca.
Partner
Lo sviluppo di Toscana Open Research è il risultato della collaborazione e impegno congiunto di diversi assessorati e direzioni della Regione Toscana impegnate sul fronte del supporto alla ricerca e all’innovazione, della Direzione Sistemi Informativi, Infrastrutture Tecnologiche e Innovazione, dell’IRPET (Istituto Regionale per la Programmazione Economica della Toscana), di FST (Fondazione Sistema Toscana) e di URTT (Ufficio regionale di trasferimento tecnologico).
Collaborazioni scientifiche e co-disegno
L’impostazione metodologica di TOR deriva da un lungo percorso di co-disegno partecipato . Questo processo ha coinvolto:
- Università e Centri di Ricerca con sede in Toscana,
- Rappresentanti delle imprese territoriali, per allineare lo strumento ai fabbisogni del sistema produttivo.
- Agenzie nazionali e internazionali di riferimento, tra cui AlmaLaurea, OpenAire, UIBM e Cineca.
Tale metodologia è stata ufficialmente riconosciuta come buona pratica nazionale nell’ambito dell’iniziativa PON Governance (Open Community PA 2020).
Sviluppo tecnico e comunicazione
La nuova versione di TOR - che mira a superare alcuni limiti della precedente relase - è attualmente sviluppata attraverso una collaborazione fra la Regione Toscana (Direzione Istruzione, Formazione Ricerca e Lavoro; Direzione Sistemi Informativi, Infrastrutture Tecnologiche e Innovazione), Siris Academic (esperto di dominio), TAI e Netseven (realizzazione dell’infrastruttura informativa e del sito web). La cura delle attività di comunicazione e del profilo YouTube dedicato è affidata alla Fondazione Sistema Toscana (FST).
Link utili
Questa sezione raccoglie una selezione ragionata di link per presentare i diversi attori che all'interno della Regione Toscana si occupano di Alta formazione, Ricerca e Innovazione:
Giovanisì, il progetto della Regione Toscana per l’autonomia dei giovani, è un sistema di opportunità rivolte ai giovani fino a 40 anni e finanziate attraverso risorse regionali, nazionali ed europee (programmazione dei fondi FSE+, FESR e FEASR), distinte in 5 aree: Studio e mi formo, Lavoro, Faccio impresa, Partecipo e Cultura;
DSU Toscana è l’Azienda della Regione Toscana per il Diritto allo Studio Universitario, realizza servizi ed interventi di sostegno allo studio per gli studenti universitari iscritti a corsi di laurea, laurea specialistica, dottorato di ricerca e scuole di specializzazione sul territorio regionale;
URTT (Ufficio Regionale di Trasferimento Tecnologico), è attivo dal 2020 con l'obbiettivo di creare un coordinamento interuniversitario a supporto delle strutture di ricerca e degli Uffici di Trasferimento Tecnologico degli Atenei e degli enti partner, favorendo una visione condivisa e un approccio integrato alla valorizzazione della ricerca;
TOUR4EU è un’associazione di diritto belga che raggruppa la Regione Toscana e i sette Atenei del territorio con l'obbiettivo di promuovere l’internazionalizzazione della ricerca universitaria e la partecipazione dei gruppi di ricerca toscani alle call Horizon e ad altri programmi UE;
La pagina Università e Ricerca del sito della Regione Toscana raccoglie tutte le informazioni che riguardano i progetti che attuano le politiche della Giunta regionale in tema di diritto allo studio universitario, alta formazione, sostegno e promozione della ricerca, gestiti dal Settore Diritto allo studio Universitario e Sostegno alla Ricerca;
Sviluppo Toscana S.p.A. è una società in house della Regione Toscana ed opera prevalentemente a supporto di quest’ultima e degli enti dipendenti, nel quadro delle politiche di programmazione regionale. È il braccio operativo della Regione Toscana, una società interamente controllata, che si occupa di gestire i progetti finanziati con i fondi europei (SIE); promuove il trasferimento tecnologico e la valorizzazione della ricerca; gestisce incubatori d'impresa e infrastrutture produttive; aiuta le imprese ad accedere ai bandi e alle opportunità di finanziamento.
IRPET (Istituto Regionale per la Programmazione Economica della Toscana) è un Ente Pubblico che svolge attività di ricerca in ambito economico, sociale e territoriale, finalizzata alla programmazione, analisi e valutazione delle politiche pubbliche. L’attività è rivolta al supporto di Giunta e Consiglio regionale, ma più in generale l’IRPET conduce attività di ricerca in collaborazione e per operatori pubblici e privati, istituzioni ed enti, altri istituti di ricerca e università.
Invest in Tuscany è un ufficio di collegamento tra il territorio toscano e la comunità economica e finanziaria internazionale, che si propone come punto di riferimento per supportare i potenziali investitori a costruire e sviluppare il loro business in Toscana.
Sportello imprese Unlock è un progetto di Regione Toscana a cui collaborano le Associazioni di categoria extra-agricole per offrire alle micro, piccole e medie imprese un presidio permanente in grado di dare informazioni in materia di finanziamenti pubblici e orientare bisogni e progettualità verso soluzioni concrete.