© Adobe Stock

Innovazione

Trascrivere il passato

Manoscritti e testi a stampa antichi senza più segreti con l’intelligenza artificiale. L’opera degli amanuensi diventa digitale

30 gennaio 2025
Versione stampabile
Paola Siano
Ufficio Stampa e Relazioni esterne

Fino a pochi anni fa era impensabile, per chi si occupa di filologia, anche solo immaginare di avere un sistema di trascrizione automatico di testi antichi, manoscritti e a stampa, pubblicati diversi secoli fa. Un patrimonio culturale, di cui l’Europa è ricca, non sempre di facile consultazione. Basti considerare che gli amanuensi, prima dell’invenzione della stampa, trascrivevano a mano i libri, con grafie, caratteri e lingue diverse. Oggi il campo della trascrizione automatica dei manoscritti ha registrato una rapida evoluzione, diventando un alleato indispensabile per chi si occupa di discipline umanistiche. Grazie anche a sistemi di intelligenza artificiale e processi di apprendimento automatico. Il tema è al centro di un incontro in calendario il 13 febbraio a Palazzo Prodi nell’ambito del seminario di Digital Humanities promosso dal Dipartimento di Lettere e Filosofia.

Considerati un tempo non così distante inaffidabili e poco utili, oggi i sistemi di trascrizione automatica rappresentano una delle frontiere più promettenti della cosiddetta “informatica umanistica”. Non hanno dubbi Marco Presotto, docente di Letteratura spagnola al Dipartimento di Lettere e Filosofia dell’Università di Trento, dove è delegato per le Digital Humanities e Stefano Bazzaco, ricercatore di Letteratura spagnola all’Università di Verona, anche lui interessato allo studio delle Digital Humanities, relatore dell’evento del 13 febbraio. «I filologi sino a pochi anni fa erano reticenti ad impiegare strumenti di trascrizione automatica dei testi antichi nelle proprie ricerche. Il nostro lavoro ha un approccio critico e approfondito su contenuti affidabili. L’esatto opposto di quello che faceva la trascrizione automatica. Oggi invece queste piattaforme offrono un supporto importante per i nostri studi», dice Presotto. Al momento sono due le piattaforme più aggiornate di libero utilizzo: Transkribus ed eScriptorium. Uno dei principali vantaggi della Handwritten Text Recognition (HTR) è la velocità. I programmi permettono di trascrivere in pochi giorni volumi di testi che avrebbero richiesto mesi di lavoro manuale. Per capire la portata innovativa di queste tecnologie basta l’esempio che porta Stefano Bazzaco: «Con il mio gruppo di ricerca ci occupiamo di romanzi cavallereschi spagnoli del Cinquecento. Libri molto lunghi composti da circa cinquecento fogli per un totale di mille pagine ciascuno. Provi a immaginare quanto tempo richiedeva il lavoro di trascrizione manuale per creare una biblioteca digitale del nostro corpus. L'impiego di queste tecnologie ha reso possibile la pubblicazione di più edizioni digitali in tempi relativamente brevi». Il lavoro si svolge su immagini digitalizzate in alta risoluzione, scansionate da biblioteche e archivi di tutto il mondo. Facile intuire che dietro questo impegno si intrecciano competenze e professionalità trasversali e multidisciplinari, necessarie per “allenare” l’algoritmo al riconoscimento e all’elaborazione dei segni grafici. La figura dell’umanista resta però centrale per istruire il software su dataset specifici, spesso relativi a determinati periodi storici o stili di scrittura, come per esempio quella gotica, corsiva, onciale o italica. L’utilizzo appare abbastanza semplice: l'utente carica le immagini, effettua una trascrizione manuale di alcune pagine e poi attraverso la trascrizione di quelle stesse pagine addestra la macchina per insegnarle a trascrivere le restanti pagine dello stesso testo o di opere simili. Man mano che il software impara a riconoscere i segni diventa sempre più preciso. Tuttavia, permangono delle sfide. «Per i testi a stampa antichi – spiega Bazzaco – il margine di errore è spesso inferiore all'1 per cento mentre per i manoscritti si aggira tra il 3 e l'8 per cento. Questo significa che il lavoro di revisione da parte di esperti ed esperte rimane fondamentale». «È indispensabile sviluppare un atteggiamento critico nei confronti di questi strumenti – gli fa eco Presotto – evitando di affidarsi ciecamente ai risultati e considerando sempre i limiti intrinseci della tecnologia». Il futuro della trascrizione automatica appare ricco di possibilità. Oltre alla trascrizione, si stanno esplorando altre applicazioni avanzate, come il riconoscimento della grafia per identificare autori di manoscritti anonimi o attribuire testi a figure storiche. Immaginate cosa potrebbe significare per chi si occupa di filologia ritrovarsi tra le mani un testo attribuibile a William Shakespeare, di cui si hanno pochissime tracce scritte di suo pugno. E visto che il futuro è già qui, anche l’interpretazione semantica dei contenuti potrebbe non apparire poi così utopistica.