BabelNet, nuove frontiere nella traduzione

L’arte antica della traduzione oggi si deve confrontare con l’innovazione. Vediamolo insieme a Roberto Navigli, creatore di BabelNet
La traduzione è un’arte antica, come ha scritto il Financial Times, che oggi si confronta con l’innovazione. Ultimamente il Natural Language Processing (NLP) ha impressionato il grande pubblico con l’introduzione di sistemi di IA basati su grandi modelli generativi del linguaggio (Large Language Model o LLM) pre-addestrati, come ChatGPT e Bard, senza contare gli importanti miglioramenti dei sistemi di traduzione più avanzati come DeepL.
Il tema è stato affrontato dal Festival Informatici Senza Frontiere a Rovereto con Roberto Navigli, professore di Intelligenza artificiale e Natural Language Processing all’Università Sapienza di Roma, autore di oltre 200 pubblicazioni sulla comprensione del linguaggio naturale multilingue e ideatore di BabelNet, un progetto raccontato anche dal Guardian e dalla rivista Time e attualmente utilizzato da migliaia di università ed enti di ricerca.
Roberto Navigli, com’è nata l’idea di BabelNet?
«BabelNet è nata grazie agli ingenti finanziamenti dell’European Research Council (ERC) che ci ha permesso di svolgere per dieci anni una ricerca mirata a creare un dizionario enciclopedico multilingue, computazionale, con caratteristiche innovative dal punto di vista del dato e della sua struttura.
A differenza dei dizionari tradizionali organizzati per lemmi in ordine alfabetico, BabelNet è organizzato per concetti, ciò significa che l’organizzazione si basa sulla semantica, passando dalla parola al significato. La struttura è costruita su un grafo di conoscenza, una rete semantica in cui ogni concetto è collegato ad altri concetti tramite relazioni semantiche, grazie all’uso di algoritmi innovativi.
Questa organizzazione permette di produrre traduzioni più accurate e di interpretare il significato di una frase in modo simile a quanto fa l’essere umano, andando oltre la traduzione automatica tradizionale».
Un’area in cui l’intelligenza artificiale si è dimostrata promettente è la traduzione linguistica. Quali sono i punti di debolezza e le aree di miglioramento dell’IA applicata ai sistemi di traduzione?
«L’intelligenza artificiale applicata alla traduzione linguistica ha mostrato promesse significative, evidenziate dai miglioramenti sostanziali in termini di qualità, scorrevolezza e precisione dei più utilizzati traduttori automatici.
Tuttavia, nonostante tali progressi, esistono ancora sfide rilevanti da affrontare. Un ostacolo è rappresentato dalle parole ambigue utilizzate in contesti meno frequenti. Nel 2022 abbiamo presentato un benchmark che ha evidenziato che, nonostante i miglioramenti, i traduttori faticano a scegliere la traduzione corretta per tali parole.
Questo problema è in parte attribuibile alla mancanza di dati di addestramento che coprano in modo esaustivo gli utilizzi meno comuni delle parole. Inoltre, c’è una mancanza di consapevolezza contestuale da parte degli attuali sistemi.
Spesso questi traduttori automatici effettuano scelte casuali e inappropriate quando si trovano di fronte a parole ambigue, senza riconoscere se una particolare scelta ha senso o meno in un determinato contesto.
La mancanza di una comprensione semantica approfondita contribuisce a questo problema, con traduttori che tendono a ottimizzare le probabilità senza una considerazione completa del significato nel contesto. C’è, quindi, una mancanza di contestualizzazione e interpretazione semantica.
Gli attuali sistemi spesso non considerano informazioni esterne al testo tradotto, come la conoscenza del mondo o il senso comune, limitando così la qualità delle traduzioni. Nonostante i notevoli progressi, questi punti di debolezza indicano che l’IA nella traduzione linguistica ha ancora spazio per miglioramenti, specialmente nella consapevolezza del contesto, nella comprensione semantica e nell’adattamento alle sfumature linguistiche».
Come stanno evolvendo le tecniche per migliorare la qualità delle traduzioni automatiche?
«Le tecniche per migliorare la qualità delle traduzioni automatiche hanno subito un notevole sviluppo nel corso degli anni.
Sono quattro i principali passaggi evolutivi: siamo passati da un approccio basato sulle regole, a quello statistico degli anni Novanta che prevedeva la traduzione parola per parola, poi a metà degli anni Duemila all’approccio statistico basato su espressioni che ha contribuito a migliorare la scorrevolezza delle traduzioni, traducendo blocchi di parole anziché singole unità, fino ad arrivare alla traduzione neurale degli ultimi anni.
L’introduzione delle reti neurali consente di considerare il contesto e la relazione tra le parole, migliorando notevolmente la qualità delle traduzioni. Nonostante questi progressi, rimane però una sfida valutare oggettivamente la qualità di un testo tradotto, perché la percezione della qualità è complessa e spesso soggettiva».
In che modo l’innovazione nei sistemi di traduzione sta influenzando la comunicazione interculturale? La traduzione può migliorare la comprensione e la collaborazione tra persone di diverse culture e lingue?
«Da una parte, l’innovazione nei sistemi di traduzione offre notevoli vantaggi, aumentando l’interazione tra individui di diverse lingue. La possibilità di effettuare telefonate con traduzione istantanea, ad esempio, consente una comunicazione senza la necessità di conoscere la lingua dell’interlocutore. Ciò si traduce in un aumento esponenziale della capacità di interagire con persone di diverse lingue, facilitando la collaborazione.
Tuttavia, dall’altra, la traduzione automatica potrebbe appiattire il background culturale del parlante. Quando si traduce da una lingua all’altra è infatti essenziale tener conto delle differenze culturali sia nella lingua di partenza che in quella di arrivo. Un’errata interpretazione di termini culturalmente specifici potrebbe danneggiare la comunicazione, rendendola inefficace o persino portando a fraintendimenti».
Quante lingue conosce?
«Conosco tre lingue: italiano, inglese e francese, le ultime due studiate e scuola, l’inglese utilizzato professionalmente mentre il francese è più una passione amatoriale. Conosco poi le caratteristiche di altre 5 o 6 lingue però non le parlo».

Leggi altro su Economia – I Protagonisti