L'enginyeria lingüística en la societat
de la informació
1. Comunicació i llenguatge en el marc de la societat de la informació | 2. Les tecnologies lingüístiques |
3. Les tecnologies del text escrit | 4. Les tecnologies de la parla |
5. La societat de la informació en el context europeu | 6. Perspectives professionals | 7. Referències
5. La societat de la informació en el context europeu
Es
podria dir que l'inici del V
Programa Marc d'Investigació i Desenvolupament (1998-2002) va situar
el concepte de Societat de la Informació en una posició central per al
desenvolupament de la Unió Europea.
Prenent
com a punts de referència documents com el Green
Paper on Living and Working in the Information Society: People First,
es va arribar, el gener de 1999, a
la decisió del Consell adoptant un nou programa denominat Tecnologies per a la
Societat de la Informació (IST,
Information Technologies Society . El programa s'estructura en
diverses accions clau, entre les que se'n troba una dedicada a
les eines i els continguts multimèdia; en aquesta acció s'emmarca
una línia centrada en les tecnologies lingüístiques (HLT,
Human Language Technologies), els continguts de la qual
descriurem molt breument a continuació.
|
|
Alhora,
diversos països - entre ells Espanya
- han desenvolupat programes que tenen com a objectiu promoure la Societat de la
Informació, complementant en l'àmbit nacional les iniciatives europees.
Catalunya té també un pla per fer més accessible a tothom la Societat de la
Informació, gestionat per la Secretaria
per a la Societat de la Informació del Departament
d'Universitats, Recerca i Societat de la Informació.
La
definició del paper de les tecnologies lingüístiques en la Societat de la
Informació es va iniciar, en el context europeu, l'any 1997 and el document
Human
language technologies. Living and working together in the Information Society,
en el qual es defineixen les grans línies que configuren el programa actual:
multilingüisme, interacció natural i continguts actius. Com a resultat de
consultes a diversos sectors, l'informe Human
Language, Human Communication, Human Knowledge precisava d'una manera
més detallada els continguts futurs d'aquesta línia d'acció, per arribar,
finalment, a la publicació del programa de treball el 1999, actualitzat
posteriorment per a l'any
2000; actualment, es troba en preparació el pla de treball de l'any
2001.
Un
dels principals objectius del programa és ajudar a superar les barreres lingüístiques
per poder accedir amb més facilitat als continguts i als serveis digitals com
poden ser les transaccions a distància, la gestió distribuïda de coneixement
corporatiu o els serveis d'informació en línia. Això requereix desenvolupar
eines d'anàlisi, traducció, resum i generació de continguts lingüístics, i
tecnologies - agents de cerca i de presentació de continguts - que permetin la
recuperació i la presentació d'informació en diverses llengües. També es
contempla en aquesta línia d'acció la transferència de tecnologies que
semblen especialment interessants a una gamma més àmplia de llengües.
Des
d'un punt de vista pràctic, el desenvolupament de projectes emmarcats en aquest
àmbit ha de permetre l'automatització de les centraletes telefòniques i els
serveis d'atenció al client, la indentificació automàtica de la llengua i la
verificació de la identitat de l'usuari a partir de la seva veu, el filtratge,
la traducció i la resposta de correu electrònic, la gestió de l'accés a catàlegs
multilingües o l'oferta de serveis comercials a la web amb una interfície
oral. En el terreny de la llengua escrita, l'autoria conjunta de documents, el
desenvolupament d'eines de correcció per a parlants no natius, les eines de
gestió de documents i de terminologia tècnica en diverses llengües o els
programes d'ensenyament de llengües assistit per ordinador seran alguns
desenvolupaments que farà possible el programa. Finalment, es planteja també
la creació de serveis a Internet que tinguin en compte les preferències lingüístiques
dels usuaris i que permetin crear continguts publicats simultàniament en més
d'una llengua i adaptats a contextos culturals diferents.
La
segona línia d'acció, denominada genèricament "interactivitat
natural", es centra en aconseguir que els sistemes informàtics es puguin
fer servir més fàcilment mitjançant l'ús espontani de la llengua parlada o
escrita, superant les limitacions actuals en el nostre mode d'interacció amb
els ordinadors. Es tracta, en conjunt, d'avançar cap al disseny d'interfícies
més intuitives, multilingües i multimodals que permetin, per exemple, la
navegació per la web, el control de sistemes o el diàleg persona-màquina, gràcies
a la comprensió d'informació parlada, escrita o, fins i tot, gestual.
Les
tecnologies que calen per fer possible aquestes aplicacions són, essencialment,
el reconeixement i la síntesi de la parla d'alta qualitat, i la comprensió de
la llengua oral en situacions d'interacció - podriem dir de conversa - entre un
usuari i un sistema informàtic.
Finalment,
una tercera línia d'actuació es centra en els continguts, especialment pel que
fa a la gestió, cerca i recuperació d'informació multilingüe. Per a assolir
aquest objectiu es contempla la utilització d'agents lingüístics
intel.ligents i de tècniques que permetin identificar el tema dels textos,
extreure'n dades i classificar-los automàticament, amb l'objectiu de crear,
resumir, convertir i presentar informació en diverses llengües, tant en la
seva representació escrita com oral, incloent diàlegs i components multimèdia.
Es pot veure, per tant, que les línies d'acció europees emmarquen les tecnologies lingüístiques en el context de la Societat de la Informació, insistint especialment en els nous reptes que hem volgut destacar en aquest treball, centrats en el processament multilingüe de la informació, tant escrita com oral.