L'enginyeria lingüística en la societat de la informació
                                                                                                               



1. Comunicació i llenguatge en el marc de la societat de la informació | 2. Les tecnologies lingüístiques

3. Les tecnologies del text escrit | 4. Les tecnologies de la parla

5. La societat de la informació en el context europeu | 6. Perspectives professionals | 7. Referències

 

5. La societat de la informació en el context europeu

Es podria dir que l'inici del V Programa Marc d'Investigació i Desenvolupament (1998-2002) va situar el concepte de Societat de la Informació en una posició central per al desenvolupament de la Unió Europea.

Prenent com a punts de referència documents com el Green Paper on Living and Working in the Information Society: People First, es va arribar, el gener de 1999,  a la decisió del Consell adoptant un nou programa denominat Tecnologies per a la Societat de la Informació (IST, Information Technologies Society . El programa s'estructura en diverses accions clau, entre les que se'n troba una dedicada a les eines i els continguts multimèdia; en aquesta acció s'emmarca una línia centrada en les tecnologies lingüístiques (HLT, Human Language Technologies), els continguts de la qual  descriurem molt breument a continuació.

Alhora, diversos països - entre ells Espanya - han desenvolupat programes que tenen com a objectiu promoure la Societat de la Informació, complementant en l'àmbit nacional les iniciatives europees. Catalunya té també un pla per fer més accessible a tothom la Societat de la Informació, gestionat per la Secretaria per a la Societat de la Informació del Departament d'Universitats, Recerca i Societat de la Informació.

La definició del paper de les tecnologies lingüístiques en la Societat de la Informació es va iniciar, en el context europeu, l'any 1997 and el document Human language technologies. Living and working together in the Information Society, en el qual es defineixen les grans línies que configuren el programa actual: multilingüisme, interacció natural i continguts actius. Com a resultat de consultes a diversos sectors, l'informe Human Language, Human Communication, Human Knowledge precisava d'una manera més detallada els continguts futurs d'aquesta línia d'acció, per arribar, finalment, a la publicació del programa de treball el 1999, actualitzat posteriorment per a l'any 2000; actualment, es troba en preparació el pla de treball de l'any 2001.

Un dels principals objectius del programa és ajudar a superar les barreres lingüístiques per poder accedir amb més facilitat als continguts i als serveis digitals com poden ser les transaccions a distància, la gestió distribuïda de coneixement corporatiu o els serveis d'informació en línia. Això requereix desenvolupar eines d'anàlisi, traducció, resum i generació de continguts lingüístics, i tecnologies - agents de cerca i de presentació de continguts - que permetin la recuperació i la presentació d'informació en diverses llengües. També es contempla en aquesta línia d'acció la transferència de tecnologies que semblen especialment interessants a una gamma més àmplia de llengües.

Des d'un punt de vista pràctic, el desenvolupament de projectes emmarcats en aquest àmbit ha de permetre l'automatització de les centraletes telefòniques i els serveis d'atenció al client, la indentificació automàtica de la llengua i la verificació de la identitat de l'usuari a partir de la seva veu, el filtratge, la traducció i la resposta de correu electrònic, la gestió de l'accés a catàlegs multilingües o l'oferta de serveis comercials a la web amb una interfície oral. En el terreny de la llengua escrita, l'autoria conjunta de documents, el desenvolupament d'eines de correcció per a parlants no natius, les eines de gestió de documents i de terminologia tècnica en diverses llengües o els programes d'ensenyament de llengües assistit per ordinador seran alguns desenvolupaments que farà possible el programa. Finalment, es planteja també la creació de serveis a Internet que tinguin en compte les preferències lingüístiques dels usuaris i que permetin crear continguts publicats simultàniament en més d'una llengua i adaptats a contextos culturals diferents.

La segona línia d'acció, denominada genèricament "interactivitat natural", es centra en aconseguir que els sistemes informàtics es puguin fer servir més fàcilment mitjançant l'ús espontani de la llengua parlada o escrita, superant les limitacions actuals en el nostre mode d'interacció amb els ordinadors. Es tracta, en conjunt, d'avançar cap al disseny d'interfícies més intuitives, multilingües i multimodals que permetin, per exemple, la navegació per la web, el control de sistemes o el diàleg persona-màquina, gràcies a la comprensió d'informació parlada, escrita o, fins i tot, gestual.

Les tecnologies que calen per fer possible aquestes aplicacions són, essencialment, el reconeixement i la síntesi de la parla d'alta qualitat, i la comprensió de la llengua oral en situacions d'interacció - podriem dir de conversa - entre un usuari i un sistema informàtic.

Finalment, una tercera línia d'actuació es centra en els continguts, especialment pel que fa a la gestió, cerca i recuperació d'informació multilingüe. Per a assolir aquest objectiu es contempla la utilització d'agents lingüístics intel.ligents i de tècniques que permetin identificar el tema dels textos, extreure'n dades i classificar-los automàticament, amb l'objectiu de crear, resumir, convertir i presentar informació en diverses llengües, tant en la seva representació escrita com oral, incloent diàlegs i components multimèdia.

Es pot veure, per tant, que les línies d'acció europees emmarquen les tecnologies lingüístiques en el context de la Societat de la Informació, insistint especialment en els nous reptes que hem volgut destacar en aquest treball, centrats en el processament multilingüe de la informació, tant escrita com oral.

 esq_a.gif (165 bytes)  dre_a.gif (166 bytes)