Quinze anys de traducció automàtica a
l'Estat espanyol
Joseba Abaitua
Facultat de Filosofia i Lletres, Universidad de Deusto
1. Màquines de
rentar automàtiques | 2. El lustre daurat | 3. La ressaca de laniversari | 4. Un present esperançador
Bibliografia
4. Un present esperançador
El col·lapse de la recerca en TA no va tenir uns efectes tan devastadors com es podria pensar per al conjunt de la investigació en llenguatge natural a lestat espanyol. La SEPLN ha continuat amb vigoria les seves activitats i la infrastructura humana despecialistes ha llevat fruits importants, bé que circumscrits, quasi exclusivament, a la universitat. Una gran part de la dècada dels anys noranta, pràcticament fins al 1997, ha contemplat el desenvolupament de recursos bàsics, que fins aleshores no teníem entre nosaltres: lematitzadors i etiquetadors morfosintàctics, correctors gramaticals, analitzadors eficients, bases de dades lèxiques i terminològiques, entorns de desenvolupament gramatical, corpus de referència, memòries de traducció, etc. A més, els resultats dels investigadors de lEstat espanyol han tingut un ressò internacional considerable. Des de 1992 llur presència en els principals fòrums mundials de lespecialitat (ACL, COLING, ANLP, etc.) ha crescut molt. Madrid fou la seu el 1997 del congrés mundial de la Association for Computational Linguistics (ACL), la primera vegada que se celebrava fora de Nord Amèrica. Daltra banda, la participació internacional en els congressos de la SEPLN sha anat enfortint any rera any (el setembre passat se celebrà a Lleida el quinzè congrés). Igualment, sha consolidat la participació espanyola en projectes europeus. Als ja esmentats (CRATER, CON-TEXT, TRADE, EAGLES, PAROLE), hem dafegir-hi EUROWORDNET, EUROMAP, INTERVAL, entre daltres.
|
Però ¿què passa amb la TA? Doncs que han canviat moltes coses amb la progressiva
mundialització dels mercats. La documentació dels productes ha anat canviant de format i
de suport. Internet ha entrat amb força a totes les fases de comercialització però,
sobretot, ha esdevingut un mitjà poderós daccés a masses cada cop més àmplies i
heterogènies de clients. La demanda de traduccions de pàgines web ha crescut duna
manera espectacular. Aquesta demanda ha estat atesa per un sector emergent dempreses
especialitzades en ladaptació i traducció (localització) de programes
informàtics.
En temps recents hem vist com sinstal·laven a lestat espanyol un grup nombrós dempreses transnacionals que combinen el desenvolupament de recursos lingüístics (bases terminològiques, glossaris, etc.) amb serveis de traducció i localització: C&L, ITP, L&H, INK, entre daltres. Alhora, dues empreses, que shan donat a conèixer mundialment com a proveïdores de gestors de memòries de traducció, STAR i TRADOS, tenen presència activa aquí i competeixen en el desenvolupament daquesta tecnologia amb una empresa espanyola, DÉJÀ VU.
Al marge daquestes empreses, hem de deixar constància de lesforç que ha fet en matèria de traducció un mitjà de premsa diària, El Periódico de Catalunya, que ha automatitzat gairebé totalment el bolcatge al català de les edicions originals en castellà. Una altra iniciativa industrial digna de menció és la de lempresa basca GEINSA, que ha dedicat recursos importants a la TA i ha presentat prototips de disseny ambiciós.
Però aquestes aportacions recents de la indústria shan produït a lestat espanyol lluny de la comunitat acadèmica. El tipus de tecnologia que més susa avui dia té poc a veure amb la que es pretenia desenvolupar els anys setanta i vuitanta, de la mà de la intel·ligència artificial o la gramàtica generativa. Són mètodes que, amb objectius més modestos, permeten dagilitar duna manera notable les tasques més rutinàries i pesades dels traductors: recuperació i contrastació de textos traduïts, manteniment i consulta de bases terminològiques, ajudes per a la revisió i lautoedició, etc. Dentre totes les eines desenvolupades els gestors de memòries de traducció són els que hores dara tenen més demanda al mercat. No és casual, doncs, que les dues empreses capdavanteres en aquesta mena daplicació, STAR i TRADOS, tinguin un origen comú a la Universitat de Sttutgart, a Alemanya, on a darreries dels vuitanta sassajaren eines de traducció que incorporaven tècniques procedents del reconeixement de veu.
|
Com a resultat, entre altres factors, de la proliferació de facultats de traducció, linterès per la tecnologia de la traducció ocupa un lloc destacat en la universitat a lEstat espanyol.
El grup JULIETTA de la Univesidad de Sevilla manté la TA entre les seves àrees dinterès. Encapçalat per Gabriel Amores i José Francisco Quesada, el grup ha elaborat analitzadors eficaços i entorns de desenvolupament gramatical (LEKTA, IRIS, EPISTEME). A més dels esmentats, el grup lintegren Teresa López, Gloria Álvarez, Gabriela Fernández, José Ángel Bernal.
A la Universitat Jaume I de Castelló hi ha un dels experts en TA de més prestigi, lexmembre dEUROTRA Juan Carlos Ruiz, que manté un paper destacat com a assessor i consultor entre els teòrics de la disciplina.
LInstitut Universitari de Lingüística Aplicada (IULA) de la Universitat Pompeu Fabra treballa des de fa anys en el desenvolupament deines per a la gestió terminològica i el processament de corpus multilingües. Pertanyen a lInstitut: M. Teresa Cabré, Toni Badia, Antoni Tuells, Marta Carulla, Rosa Estopà, Roser Saurí, Jorge Vivaldi, per dir-ne només alguns dentre una llarga llista despecialistes.
A la Universidad de Vigo hi ha des de fa un lustre un grup dexperts en tecnologia lingüística i traducció format per, entre daltres, Javier Gómez Guinovart, Anxo M. Lorenzo i Alberto Álvarez.
A la Universitat dAlacant, amb limpuls dAndrés Pedreño (rector) i de Manuel Marco (vicerrector), sha obert la Biblioteca Virtual Miguel de Cervantes (una col·lecció en SGML/XML de 2.000 clàssics que inclou originals i traduccions). A aquesta iniciativa se suma lexperiència en el desenvolupament de programari lingüístic del grup dAntonio Ferrández i Manuel Palomar (DLSI).
Entorn de la figura de Gloria Corpas Pastor sha format a la Universidad de Málaga un grup que investiga sobre lautomatització de la traducció en làrea del llenguatge jurídic.
A la Universidad Europea de Madrid els professors Antonio Argüeso i Celia Rico col·laboren amb lespecialista Antonio Sánchez en el desenvolupament dajuts diccionarials i en lavaluació del programa DÉJÀ VU.
A la Universitat de Vic el professor Richard Samson ha organitzat un laboratori de proves per a eines de traducció, que és modèlic entre els daquest tipus.
A la Universitat de Deusto, dins el projecte de processament de textos jurídics en euskera i castellà, LEGEBIDUNA, shan desenvolupat etiquetadors en SGML/XML que permeten automatitzar la segmentació i alineació de textos paral·lels en diferents nivells: secció, paràgraf, oració, fórmula lingüística, terme compost i nom propi. A més hom ha dissenyat generadors de documentació estructurada, dedició assistida i de gestió de memòries de traducció. El grup està format per Raquel Martínez, de la Univesidad Complutense de Madrid, Arantza Casillas, de la Universidad de Alcalá de Henares, i per lautor daquest article
En resum, podem dir que han estat quinze anys de recerca i desenvolupament de la TA a Espanya durant els quals hem passat per tres fases al compàs del ritme marcat per lactivitat internacional. Pels volts de 1985 hi hagué un auge dinterès que es traslladà a Espanya de la mà de tres empreses transnacionals i un projecte comunitari. 1992, lany emblemàtic del centenari, va significar paradoxalment el final daquella etapa i linici duna revisió dobjectius i de mètodes, alhora que una reducció dràstica de les inversions. En els darrers quatre anys linterès es caracteritza per la mundialització creixent de leconomia, lauge dInternet i la localització de documentació electrònica i productes de programari. Les facultats de traducció han esdevingut usuàries, més que no productores, daquestes noves tecnologies, i només algunes tenen participació notòria en el desenvolupament de recursos.
Nota