La UOC col·labora amb l'Hospital Vall d'Hebron en la traducció d'articles científics sobre la COVID-19

  hospital

Foto: Javier Matheu / unsplash.com

Els investigadors han desenvolupat un sistema de traducció automàtica neuronal entrenat per al domini mèdic

En la iniciativa hi participen investigadors de Mèxic i Suïssa per traduir els resums de més de 15.000 articles científics sobre el coronavirus

La comunitat científica dedica una bona part dels seus esforços a combatre el coronavirus i a trobar l'anhelada vacuna per tallar la pandèmia. Com a mostra, en la base de dades de recerques sobre la COVID-19 de l'Organització Mundial de la Salut hi ha recollides unes 40.000 investigacions. Per tractar l'elevat volum de literatura científica sobre la malaltia, un equip d'investigadors de la Universitat Oberta de Catalunya (UOC) ha desenvolupat una tecnologia per traduir els resums de 15.000 articles científics a l'espanyol. L'objectiu és facilitar l'accés a aquesta informació al personal mèdic de l'Hospital Universitari Vall d'Hebron de Barcelona, entre altres professionals.

 

Entrenar la tecnologia per a la traducció

«Volem posar a disposició del personal mèdic la informació rellevant sobre la COVID-19, ja que no tots aquests professionals tenen un nivell elevat d'anglès. La nostra tecnologia els facilita així l'accés a aquesta informació», assenyala Antoni Oliver, que és membre del Grup de Recerca Interuniversitari en Aplicacions Lingüístiques (GRIAL), dels Estudis d'Arts i Humanitats de la UOC. La tecnologia traduirà abstracts —tal com s'anomenen els resums en la literatura científica— i articles científics sobre la COVID-19, de l'anglès a l'espanyol. La col·laboració de la Universitat se centra en l'entrenament i l'ús d'un sistema de traducció automàtica neuronal, específicament entrenat per al domini mèdic i adaptat a les temàtiques relacionades amb el coronavirus. A més, l'equip de la UOC dona suport tecnològic en la configuració i la posada en marxa d'un sistema de traducció assistida en línia.

El temps que triga el sistema a traduir automàticament depèn de l'ordinador en què s'executi el motor de traducció, però pot anar de 100 a 10.000 paraules per segon, segons afirma Oliver. Ara bé, el que és rellevant és el temps total amb la intervenció humana. «El procés de traducció automàtica, més l'edició posterior, pot arribar a ser entre quatre i cinc vegades més ràpid que la traducció humana, i assolir nivells de qualitat molt semblants», relata l'investigador de la UOC.

 

Detectar els articles rellevants

Per a aquest projecte, altres equips de recerca participants fan servir tècniques d'intel·ligència artificial per detectar els articles científics que són rellevants sobre la COVID-19. «Primer van fer una classificació manual d'un gran conjunt de documents i, a partir d'aquesta categorització, el sistema ha après a classificar els documents», explica Antoni Oliver. El seu sistema recupera els articles científics de la compilació de Science Direct d'Elsevier, una editorial neerlandesa de publicacions científiques, i també de fons com LitCOVID, un portal de recursos oberts de la Biblioteca Nacional de Medicina dels Estats Units, que dona accés a una de les col·leccions més completes de treballs de recerca de tot el món sobre la nova malaltia, amb més de 28.000 publicacions actualment.

 

Col·laboració internacional

Aquest projecte va sorgir en plena pandèmia. «Els primers dies del confinament hi va haver diversos contactes per veure com es podria col·laborar amb les tecnologies de la traducció», apunta Oliver. Així, l'investigador confirma que la intenció és mantenir aquesta col·laboració mentre la COVID-19 sigui una qüestió prou activa en l'àmbit de recerca.

La iniciativa no solament té caràcter local, ja que compta amb col·laboracions internacionals i entre els seus objectius s'inclou l'impuls d'un repositori d'articles científics sobre la malaltia a la Universitat Nacional Autònoma de Mèxic (UNAM), així com una plataforma similar hostatjada al Vall d'Hebron. A més de la UOC i l'Hospital, hi participen l'Agència de Qualitat i Avaluació Sanitàries de Catalunya (AQUAS), el Centre de Ciències Genòmiques de la UNAM, i una investigadora de l'Institut Nacional de Malalties Respiratòries de Mèxic i una altra del suís Istituto Dalle Molle di Studi sull'Intelligenza Artificiale (Dalle Molle Institute for Artificial Intelligence Research), a més d'un doctorand de la Universitat Politècnica de Catalunya (UPC).

Antoni Oliver destaca que no és una iniciativa de caràcter institucional i que «el treball més gran és el que fan els voluntaris». A més, la UOC facilita la participació en el projecte d'alumnes en pràctiques del grau de Traducció, Interpretació i Llengües Aplicades i del màster universitari de Traducció i Tecnologies.

 

Article relacionat

Antoni Oliver (2020), «MTUOC: easy and free integration of NMT systems in professional translation environments», Proceedings of the 22nd Annual Conference of the European Association for Machine Translation (http://hdl.handle.net/10609/119706).  

 

UOC R&I

La recerca i la innovació (R+I) de la UOC contribueixen a solucionar els reptes a què s'enfronten les societats globals del segle xxi, mitjançant l'estudi de la interacció de les TIC amb l'activitat humana, amb un focus específic en l'ensenyament en línia i la salut digital. Els més de 400 investigadors i 48 grups de recerca s'articulen entorn dels set estudis de la UOC i tres centres de recerca: l'Internet Interdisciplinary Institute (IN3), l'eLearn Center (eLC) i l'eHealth Center (eHC).

Els objectius de l'Agenda 2030 de desenvolupament sostenible de les Nacions Unides i el coneixement obert són eixos estratègics de la docència, la recerca i la innovació de la UOC. Més informació: research.uoc.edu.

#expertsUOC

Foto del professor Antoni Oliver Gonzàlez

Antoni Oliver Gonzàlez

Expert/a en: Traducció automàtica, traducció assistida, extracció de terminologia i aprenentatge automàtic.

Àmbit de coneixement: Lingüística computacional.

Veure fitxa