Quinze anys de traducció automàtica a l'Estat espanyol
                                                                                                               

Quinze anys de traducció automàtica a l’Estat espanyol

Joseba Abaitua
Facultat de Filosofia i Lletres, Universidad de Deusto

Abstract

1. Màquines de rentar automàtiques | 2. El lustre daurat3. La ressaca de l’aniversari | 4. Un present esperançador
Bibliografia

 

4. Un present esperançador

El col·lapse de la recerca en TA no va tenir uns efectes tan devastadors com es podria pensar per al conjunt de la investigació en llenguatge natural a l’estat espanyol. La SEPLN ha continuat amb vigoria les seves activitats i la infrastructura humana d’especialistes ha llevat fruits importants, bé que circumscrits, quasi exclusivament, a la universitat. Una gran part de la dècada dels anys noranta, pràcticament fins al 1997, ha contemplat el desenvolupament de recursos bàsics, que fins aleshores no teníem entre nosaltres: lematitzadors i etiquetadors morfosintàctics, correctors gramaticals, analitzadors eficients, bases de dades lèxiques i terminològiques, entorns de desenvolupament gramatical, corpus de referència, memòries de traducció, etc. A més, els resultats dels investigadors de l’Estat espanyol han tingut un ressò internacional considerable. Des de 1992 llur presència en els principals fòrums mundials de l’especialitat (ACL, COLING, ANLP, etc.) ha crescut molt. Madrid fou la seu el 1997 del congrés mundial de la Association for Computational Linguistics (ACL), la primera vegada que se celebrava fora de Nord Amèrica. D’altra banda, la participació internacional en els congressos de la SEPLN s’ha anat enfortint any rera any (el setembre passat se celebrà a Lleida el quinzè congrés). Igualment, s’ha consolidat la participació espanyola en projectes europeus. Als ja esmentats (CRATER, CON-TEXT, TRADE, EAGLES, PAROLE), hem d’afegir-hi EUROWORDNET, EUROMAP, INTERVAL, entre d’altres.

babylon.bmp (76918 bytes)


Però ¿què passa amb la TA? Doncs que han canviat moltes coses amb la progressiva mundialització dels mercats. La documentació dels productes ha anat canviant de format i de suport. Internet ha entrat amb força a totes les fases de comercialització però, sobretot, ha esdevingut un mitjà poderós d’accés a masses cada cop més àmplies i heterogènies de clients. La demanda de traduccions de pàgines web ha crescut d’una manera espectacular. Aquesta demanda ha estat atesa per un sector emergent d’empreses especialitzades en l’adaptació i traducció (localització) de programes informàtics.

En temps recents hem vist com s’instal·laven a l’estat espanyol un grup nombrós d’empreses transnacionals que combinen el desenvolupament de recursos lingüístics (bases terminològiques, glossaris, etc.) amb serveis de traducció i localització: C&L, ITP, L&H, INK, entre d’altres. Alhora, dues empreses, que s’han donat a conèixer mundialment com a proveïdores de gestors de memòries de traducció, STAR i TRADOS, tenen presència activa aquí i competeixen en el desenvolupament d’aquesta tecnologia amb una empresa espanyola, DÉJÀ VU.

Al marge d’aquestes empreses, hem de deixar constància de l’esforç que ha fet en matèria de traducció un mitjà de premsa diària, El Periódico de Catalunya, que ha automatitzat gairebé totalment el bolcatge al català de les edicions originals en castellà. Una altra iniciativa industrial digna de menció és la de l’empresa basca GEINSA, que ha dedicat recursos importants a la TA i ha presentat prototips de disseny ambiciós.

Però aquestes aportacions recents de la indústria s’han produït a l’estat espanyol lluny de la comunitat acadèmica. El tipus de tecnologia que més s’usa avui dia té poc a veure amb la que es pretenia desenvolupar els anys setanta i vuitanta, de la mà de la intel·ligència artificial o la gramàtica generativa. Són mètodes que, amb objectius més modestos, permeten d’agilitar d’una manera notable les tasques més rutinàries i pesades dels traductors: recuperació i contrastació de textos traduïts, manteniment i consulta de bases terminològiques, ajudes per a la revisió i l’autoedició, etc. D’entre totes les eines desenvolupades els gestors de memòries de traducció són els que hores d’ara tenen més demanda al mercat. No és casual, doncs, que les dues empreses capdavanteres en aquesta mena d’aplicació, STAR i TRADOS, tinguin un origen comú a la Universitat de Sttutgart, a Alemanya, on a darreries dels vuitanta s’assajaren eines de traducció que incorporaven tècniques procedents del reconeixement de veu.

computr2.gif (2133 bytes)

Com a resultat, entre altres factors, de la proliferació de facultats de traducció, l’interès per la tecnologia de la traducció ocupa un lloc destacat en la universitat a l’Estat espanyol.

El grup JULIETTA de la Univesidad de Sevilla manté la TA entre les seves àrees d’interès. Encapçalat per Gabriel Amores i José Francisco Quesada, el grup ha elaborat analitzadors eficaços i entorns de desenvolupament gramatical (LEKTA, IRIS, EPISTEME). A més dels esmentats, el grup l’integren Teresa López, Gloria Álvarez, Gabriela Fernández, José Ángel Bernal.

A la Universitat Jaume I de Castelló hi ha un dels experts en TA de més prestigi, l’exmembre d’EUROTRA Juan Carlos Ruiz, que manté un paper destacat com a assessor i consultor entre els teòrics de la disciplina.

L’Institut Universitari de Lingüística Aplicada (IULA) de la Universitat Pompeu Fabra treballa des de fa anys en el desenvolupament d’eines per a la gestió terminològica i el processament de corpus multilingües. Pertanyen a l’Institut: M. Teresa Cabré, Toni Badia, Antoni Tuells, Marta Carulla, Rosa Estopà, Roser Saurí, Jorge Vivaldi, per dir-ne només alguns d’entre una llarga llista d’especialistes.

A la Universidad de Vigo hi ha des de fa un lustre un grup d’experts en tecnologia lingüística i traducció format per, entre d’altres, Javier Gómez Guinovart, Anxo M. Lorenzo i Alberto Álvarez.

A la Universitat d’Alacant, amb l’impuls d’Andrés Pedreño (rector) i de Manuel Marco (vicerrector), s’ha obert la Biblioteca Virtual Miguel de Cervantes (una col·lecció en SGML/XML de 2.000 clàssics que inclou originals i traduccions). A aquesta iniciativa se suma l’experiència en el desenvolupament de programari lingüístic del grup d’Antonio Ferrández i Manuel Palomar (DLSI).

babel.jpg (134780 bytes)

Entorn de la figura de Gloria Corpas Pastor s’ha format a la Universidad de Málaga un grup que investiga sobre l’automatització de la traducció en l’àrea del llenguatge jurídic.

A la Universidad Europea de Madrid els professors Antonio Argüeso i Celia Rico col·laboren amb l’especialista Antonio Sánchez en el desenvolupament d’ajuts diccionarials i en l’avaluació del programa DÉJÀ VU.

A la Universitat de Vic el professor Richard Samson ha organitzat un laboratori de proves per a eines de traducció, que és modèlic entre els d’aquest tipus.

A la Universitat de Deusto, dins el projecte de processament de textos jurídics en euskera i castellà, LEGEBIDUNA, s’han desenvolupat etiquetadors en SGML/XML que permeten automatitzar la segmentació i alineació de textos paral·lels en diferents nivells: secció, paràgraf, oració, fórmula lingüística, terme compost i nom propi. A més hom ha dissenyat generadors de documentació estructurada, d’edició assistida i de gestió de memòries de traducció. El grup està format per Raquel Martínez, de la Univesidad Complutense de Madrid, Arantza Casillas, de la Universidad de Alcalá de Henares, i per l’autor d’aquest article

En resum, podem dir que han estat quinze anys de recerca i desenvolupament de la TA a Espanya durant els quals hem passat per tres fases al compàs del ritme marcat per l’activitat internacional. Pels volts de 1985 hi hagué un auge d’interès que es traslladà a Espanya de la mà de tres empreses transnacionals i un projecte comunitari. 1992, l’any emblemàtic del centenari, va significar paradoxalment el final d’aquella etapa i l’inici d’una revisió d’objectius i de mètodes, alhora que una reducció dràstica de les inversions. En els darrers quatre anys l’interès es caracteritza per la mundialització creixent de l’economia, l’auge d’Internet i la localització de documentació electrònica i productes de programari. Les facultats de traducció han esdevingut usuàries, més que no productores, d’aquestes noves tecnologies, i només algunes tenen participació notòria en el desenvolupament de recursos.

Nota
L’autor ha procurat d’esmentar el major nombre d’activitats relacionades con la TA a Espanya, però segurament no ha aconseguit d’ésser exhaustiu. L’enumeració dels participants és a manera d’homenatge envers tots aquells que han dedicat tantes hores a una activitat generalment ingrata i que ha passat inadvertida. M’afanyo a excusar-me de tot cor amb aquells que, per error o omissió, resten encara en l’anonimat.

esq_a.gif (165 bytes) dre_a.gif (166 bytes)