Quinze anys de traducció automàtica a
l'Estat espanyol
Joseba Abaitua
Facultat de Filosofia i Lletres, Universidad de
Deusto
1. Màquines de
rentar automàtiques | 2. El lustre daurat | 3. La
ressaca de laniversari | 4. Un present esperançador
Bibliografia
2. El lustre daurat
Fa quinze anys, el 1985, es varen posar les bases del lustre daurat (1987-1991) de la recerca i el desenvolupament (R+D) en TA a lEstat espanyol. Lentrada en la Comunitat econòmica europea (1986), així com la rellevància creixent del castellà com a llengua internacional va empènyer les grans empreses dinformàtica a inclourel en llurs prototips de TA. De bracet amb tres empreses transnacionals i amb les institucions europees, van néixer quatre projectes importants que dugueren a la formació de grups de recerca a lestat espanyol.No sé si va ser primer IBM o SIEMENS, però totes dues van formar el 1985 sengles grups d'R+D en llurs laboratoris de Madrid i Barcelona, encapçalats per Luis de Sopeña i Montserrat Meya respectivament. IBM es va servir del Centro de Investigación en Inteligencia Artificial de la Universidad Autónoma de Madrid com a seu dun equip especialitzat en llenguatge natural. Aquest equip va participar primer en el disseny del prototip MENTOR, junt amb un altre centre de IBM a Israel, més endavant en ladaptació al castellà d'LMT, sistema dissenyat al T.J. Watson Research Center dels EUA. Si resseguim les publicacions del grup a la revista Procesamiento del lenguaje natural, veiem que entre els anys 1985 i 1992 varen treballar en els projectes dIBM com a mínim els següents especialistes: Teo Redondo, Pilar Rodríguez, Isabel Zapata, Celia Villar, Alfonso Alcalá, Carmen Valladares, Enrique Torrejón, Begoña Carranza, Gerardo Arrarte i Chelo Rodríguez. Si la meva informació és correcta, de tots els esmentats avui dia únicament Chelo Rodríguez continua treballant per a IBM en el desenvolupament i ampliació d'LMT.
|
SIEMENS al seu torn va decidir apropar a Barcelona el desenvolupament del mòdul espanyol del seu prestigiós sistema METAL. Montserrat Meya, que fins aleshores havia treballat als laboratoris centrals de SIEMENS a Munich, va entrar en contacte amb el filòleg i enginyer Juan Alberto Alonso i tots dos varen constituir el nucli dun equip en el qual va acabar participant una nòmina inacabable de col·laboradors: Javier Gómez Guinovart, Juan Bosco Camón, Begoña Navarrete, Ramón Fanlo, Clair Corbishley, Begoña Vázquez (per esmentar-ne solament uns quants). Després del 1992 el grup dedicat a projectes lingüístics va constituir una empresa independent, INCYTA. Un cop signat el conveni amb la Generalitat de Catalunya i la Universitat Autònoma de Barcelona es va desenvolupar el mòdul català que hores dara és la principal línia dactivitat del grup.
A darreries de 1986 es van crear a Barcelona i Madrid dos grups més entre els quals es va repartir el desenvolupament dels mòduls del sistema EUROTRA, finançat per la Comissió europea. Ramon Cerdà va aplegar a la Universitat de Barcelona un grup ampli despecialistes format per, entre daltres, Jesús Vidal, Juan Carlos Ruiz, Toni Badia, Sergi Balari, Marta Carulla i Núria Bel. Mentre aquest grup socupava de les qüestions de sintaxi i semàntica, un altre grup sencarregava a Madrid dels aspectes de morfologia i lexicografia sota el comandament de Francisco Marcos Marín. Hi col·laboren entre daltres Antonio Moreno, Pilar Salamanca y Fernando Sánchez-León.
Un any enllà, el 1987, es va formar als laboratoris d'R+D de lempresa FUJITSU a Barcelona un cinquè grup per al desenvolupament dels mòduls de traducció al castellà del sistema japonès ATLAS. Lequip lencapçalava lenginyer Jorge Vivaldi i el filòleg Josep Soler, procedent dEUROTRA. Junts havien de crear lembrió dun equip al qual jo mateix em vaig incorporar el 1988 i més endavant hi entraren Elisabet Cayuelas, Lluís Hernàndez, Xavier Lloré i Ana de Aguilar-Amat.
|
Encara un altre grup dedicat a la TA en aquells anys era el que formaven Isabel Herrero i Elisabeth Nebot a la Universitat de Barcelona. Aquest, tutelat per Juan Alberto Alonso, va crear un prototip de traducció àrab-castellà en col·laboració amb la Universitat de Tunis.
El que és clar és que la TA fou el principal catalitzador del naixement de la lingüística computacional a lestat espanyol. No és casual que la Sociedad Española para el Procesamiento del Lenguaje Natural (SEPLN) es creï el 1983. A més de Felisa Verdejo, dues persones més es varen significar en la seva fundació, els ja esmentats Montserrat Meya i Luis de Sopeña, que en aquell moment encapçalaven, com ja he dit, grups de TA. El tercer congrés de lassociació (aleshores encara sota el títol de "jornades tècniques") es va celebrar el juliol del 1987 a la Universitat Politècnica de Catalunya, amb dos plats forts sobre TA: una conferència de Sergei Nirenburg, llavors adscrit al Center for Machine Translation de la Universitat Carnegie Mellon, i una taula rodona amb la participació de Jesús Vidal i Juan Carlos Ruiz (dEUROTRA), Luis de Sopeña (dIBM), Juan Alberto Alonso (de SIEMENS) i el mateix Nirenburg.
Algunes dades estadístiques constaten la rellevància que va tenir la TA a la SEPLN entre le 1987 i el 1991. Durant aquest anys, dels 60 articles publicats a la revista de lassociació, Procesamiento del lenguaje natural, 23 (més duna tercera part) tractaven sobre TA. El nivell de participació reflecteix la rellevància dels grups: 8 descriuen EUROTRA; 7 les recerques dIBM; 4 METAL, de SIEMENS; i 3 ATLAS, de FUJITSU. Només un dels articles publicats, de tots 23, era aliè als quatre projectes estrella. Fou el presentat al congrés de 1990 per Gabriel Amores, amb els resultats de la seva investigació al Centre for Computational Linguistics dUMIST. Hem esmentat 35 persones, xifra que fa adonar de lactivitat que es duia a terme. En una estimació aproximada, podem calcular que el 1989 la recerca en TA a lEstat espanyol disposava dun pressupost anual duns 200 milions de pessetes, una quantitat que, per més que sembli modesta, multiplica diverses vegades la de la dotació amb què treballem avui dia, deu anys després.