Quinze anys de traducció automàtica a l'Estat espanyol
                                                                                                               

Quinze anys de traducció automàtica a l’Estat espanyol

Joseba Abaitua
Facultat de Filosofia i Lletres, Universidad de Deusto

1. Màquines de rentar automàtiques | 2. El lustre daurat |  3. La ressaca de l’aniversari | 4. Un present esperançador
Bibliografia

Abstract

2. El lustre daurat

Fa quinze anys, el 1985, es varen posar les bases del lustre daurat (1987-1991) de la recerca i el desenvolupament (R+D) en TA a l’Estat espanyol. L’entrada en la Comunitat econòmica europea (1986), així com la rellevància creixent del castellà com a llengua internacional va empènyer les grans empreses d’informàtica a incloure’l en llurs prototips de TA. De bracet amb tres empreses transnacionals i amb les institucions europees, van néixer quatre projectes importants que dugueren a la formació de grups de recerca a l’estat espanyol.

No sé si va ser primer IBM o SIEMENS, però totes dues van formar el 1985 sengles grups d'R+D en llurs laboratoris de Madrid i Barcelona, encapçalats per Luis de Sopeña i Montserrat Meya respectivament. IBM es va servir del Centro de Investigación en Inteligencia Artificial de la Universidad Autónoma de Madrid com a seu d’un equip especialitzat en llenguatge natural. Aquest equip va participar primer en el disseny del prototip MENTOR, junt amb un altre centre de IBM a Israel, més endavant en l’adaptació al castellà d'LMT, sistema dissenyat al T.J. Watson Research Center dels EUA. Si resseguim les publicacions del grup a la revista Procesamiento del lenguaje natural, veiem que entre els anys 1985 i 1992 varen treballar en els projectes d’IBM com a mínim els següents especialistes: Teo Redondo, Pilar Rodríguez, Isabel Zapata, Celia Villar, Alfonso Alcalá, Carmen Valladares, Enrique Torrejón, Begoña Carranza, Gerardo Arrarte i Chelo Rodríguez. Si la meva informació és correcta, de tots els esmentats avui dia únicament Chelo Rodríguez continua treballant per a IBM en el desenvolupament i ampliació d'LMT.

ROSETTA.jpg (4688 bytes)

SIEMENS al seu torn va decidir apropar a Barcelona el desenvolupament del mòdul espanyol del seu prestigiós sistema METAL. Montserrat Meya, que fins aleshores havia treballat als laboratoris centrals de SIEMENS a Munich, va entrar en contacte amb el filòleg i enginyer Juan Alberto Alonso i tots dos varen constituir el nucli d’un equip en el qual va acabar participant una nòmina inacabable de col·laboradors: Javier Gómez Guinovart, Juan Bosco Camón, Begoña Navarrete, Ramón Fanlo, Clair Corbishley, Begoña Vázquez (per esmentar-ne solament uns quants). Després del 1992 el grup dedicat a projectes lingüístics va constituir una empresa independent, INCYTA. Un cop signat el conveni amb la Generalitat de Catalunya i la Universitat Autònoma de Barcelona es va desenvolupar el mòdul català que hores d’ara és la principal línia d’activitat del grup.

A darreries de 1986 es van crear a Barcelona i Madrid dos grups més entre els quals es va repartir el desenvolupament dels mòduls del sistema EUROTRA, finançat per la Comissió europea. Ramon Cerdà va aplegar a la Universitat de Barcelona un grup ampli d’especialistes format per, entre d’altres, Jesús Vidal, Juan Carlos Ruiz, Toni Badia, Sergi Balari, Marta Carulla i Núria Bel. Mentre aquest grup s’ocupava de les qüestions de sintaxi i semàntica, un altre grup s’encarregava a Madrid dels aspectes de morfologia i lexicografia sota el comandament de Francisco Marcos Marín. Hi col·laboren entre d’altres Antonio Moreno, Pilar Salamanca y Fernando Sánchez-León.

Un any enllà, el 1987, es va formar als laboratoris d'R+D de l’empresa FUJITSU a Barcelona un cinquè grup per al desenvolupament dels mòduls de traducció al castellà del sistema japonès ATLAS. L’equip l’encapçalava l’enginyer Jorge Vivaldi i el filòleg Josep Soler, procedent d’EUROTRA. Junts havien de crear l’embrió d’un equip al qual jo mateix em vaig incorporar el 1988 i més endavant hi entraren Elisabet Cayuelas, Lluís Hernàndez, Xavier Lloré i Ana de Aguilar-Amat.

Coran.gif (10351 bytes)

Encara un altre grup dedicat a la TA en aquells anys era el que formaven Isabel Herrero i Elisabeth Nebot a la Universitat de Barcelona. Aquest, tutelat per Juan Alberto Alonso, va crear un prototip de traducció àrab-castellà en col·laboració amb la Universitat de Tunis.

El que és clar és que la TA fou el principal catalitzador del naixement de la lingüística computacional a l’estat espanyol. No és casual que la Sociedad Española para el Procesamiento del Lenguaje Natural (SEPLN) es creï el 1983. A més de Felisa Verdejo, dues persones més es varen significar en la seva fundació, els ja esmentats Montserrat Meya i Luis de Sopeña, que en aquell moment encapçalaven, com ja he dit, grups de TA. El tercer congrés de l’associació (aleshores encara sota el títol de "jornades tècniques") es va celebrar el juliol del 1987 a la Universitat Politècnica de Catalunya, amb dos plats forts sobre TA: una conferència de Sergei Nirenburg, llavors adscrit al Center for Machine Translation de la Universitat Carnegie Mellon, i una taula rodona amb la participació de Jesús Vidal i Juan Carlos Ruiz (d’EUROTRA), Luis de Sopeña (d’IBM), Juan Alberto Alonso (de SIEMENS) i el mateix Nirenburg.

Algunes dades estadístiques constaten la rellevància que va tenir la TA a la SEPLN entre le 1987 i el 1991. Durant aquest anys, dels 60 articles publicats a la revista de l’associació, Procesamiento del lenguaje natural, 23 (més d’una tercera part) tractaven sobre TA. El nivell de participació reflecteix la rellevància dels grups: 8 descriuen EUROTRA; 7 les recerques d’IBM; 4 METAL, de SIEMENS; i 3 ATLAS, de FUJITSU. Només un dels articles publicats, de tots 23, era aliè als quatre projectes estrella. Fou el presentat al congrés de 1990 per Gabriel Amores, amb els resultats de la seva investigació al Centre for Computational Linguistics d’UMIST. Hem esmentat 35 persones, xifra que fa adonar de l’activitat que es duia a terme. En una estimació aproximada, podem calcular que el 1989 la recerca en TA a l’Estat espanyol disposava d’un pressupost anual d’uns 200 milions de pessetes, una quantitat que, per més que sembli modesta, multiplica diverses vegades la de la dotació amb què treballem avui dia, deu anys després.

esq_a.gif (165 bytes) dre_a.gif (166 bytes)