L'enginyeria lingüística en la societat
de la informació
1. Comunicació i llenguatge en el marc de la societat de la informació | 2. Les tecnologies lingüístiques |
3. Les tecnologies del text escrit | 4. Les tecnologies de la parla |
5. La societat de la informació en el context europeu | 6. Perspectives professionals | 7. Referències
4. Les tecnologies de la parla
L'ús de la llengua oral com a mode de comunicació amb els sistemes informàtics permet, en primer lloc, alliberar les mans i la vista, facilitant la recepció de la informació des de qualsevol punt i fent possible la mobilitat, de manera que es poden realitzar altres activitats simultànies. L'entrada de dades sobre productes en la gestió dels fons d'un magatzem, les operacions relacionades amb el manteniment i el control de la qualitat en entorns industrials, la recepció d'informació en entorns com cabines d'avió amb una gran quantitat de sistemes de comandament i indicadors, el control de la ràdio, del telèfon o de la climatització d'un cotxe i l'obtenció d'informació sobre itineraris - el prototip desenvolupat en el projecte Vodis (Advanced Speech Technologies for Voice-operated Driver Information Systems)ofereix aquestes possibilitats -, o el dictat de documents , són algunes de les aplicacions per a les quals s'ha demostrat que utilitzar la llengua parlada és un avantatge important.
|
|
En
segon lloc, emprar la parla per accedir a la informació emmagatzemada en un
sistema informàtic ens dóna la possibilitat d'utilitzar el telèfon en lloc de
la pantalla i el teclat tradicionals, amb tot el que això comporta en rapidesa;
cal pensar també en la independència de la distància i de la disponibilitat
d'un ordinador que proporciona aquest procediment. Algunes aplicacions en aquest
àmbit són els serveis d'informació sobre horaris
de transports públics, les consultes a planes grogues o altres
directoris, la informació
ciutadana, la banca telefònica o les centraletes automatizades.
Finalment,
cal no oblidar que guardar i rebre informació per mitjà de la parla és una
alternativa pràctica quan s'ha de prescindir, per raons de tamany, del teclat,
com és el cas de les agendes electròniques - productes com ArtCommander
faciliten l'entrada de dades per veu -
i els comunicadors personals. La veu, juntament amb els llàpissos electrònics
i les pantalles tàctils, és una modalitat viable per augmentar la
funcionalitat d'aquests aparells.
Avui
en dia disposem de programes comercials que fan possible el dictat automàtic
com ara els desenvolupats per Dragon
Systems, IBM
o Philips, la navegació per
Internet - el Free
Speech Browser n'és un
exemple - i la recuperació d'informació mitjançant la parla. També és
possible la lectura en veu alta d'un text en format electrònic com podria ser
un un missatge de correu (per exemple, el projecte EMU
o el contingut d'una base de
dades. És possible també, amb els sistemes de diàleg que incorporen síntesi,
reconeixement i un cert grau de comprensió, obtenir informació o realitzar
transaccions comercials a través del telèfon.
Segurament
són aquests darrers sistemes els que en l'actualitat desvetllen més interès,
i per aquest motiu esmentarem algunes de les seves aplicacions.
Un
dels sectors per als quals s'han desenvolupat sistemes de diàleg és el dels transports
públics, ja que sovint les centraletes telefòniques no poden atendre totes
les trucades dels usuaris, especialment pel que fa a la consulta d'horaris.
Projectes com Arise
(Automatic Railway Information Systems for Europe) han desenvolupat prototips per a donar
resposta a aquesta mena de peticions, concretament en el cas dels ferrocarrils,
mentre que, per exemple, ATIS
(Advanced Travel Information System) i Pegasus
proporcionen
informació sobre horaris de vols.
Existeixen
també sistemes de diàleg complementats amb informació multimodal, entre els
quals pot esmentar-se Waxholm,
que ofereix informació sobre
el transport marítim a l'arxipèlag d'Estocolm emprant la veu acompanyada d'un
rostre generat també mitjançant un ordinador, Mask, un quiosc
que proporciona dades sobre circulació de trens francesos tant
verbalment com a través d'una pantalla, i que permet també reservar bitllets,
o Toot, dissenyat per realitzar
consultes vocals a la web i obtenir horaris de trens.
La
informació ciutadana és un altre servei que
es pot oferir de manera automàtica a través del telèfon. Voyager, per
exemple, informa en anglès, francès i italià sobre adreces, números de telèfon
i localització de restaurants, hotels, oficines de correus, estacions de metro,
etc. a l'àrea de Boston. D'aquesta aquesta mateixa zona es pot rebre informació
sobre restaurants amb el sistema Dinex: un telèfon i
un ordinador connectats a Internet permeten conèixer la localització, el preu,
el tipus de tarjeta de crèdit acceptat i, en alguns casos, el menú, tot això
fent preguntes en llenguatge natural como ara "Quins restaurants xinesos hi
ha prop de l'hotel Plaza?". Hi ha també aplicacions com Movieline
- centrada en la cartellera dels
cinemes de Pittsburgh - que ofereixen informació parlada.
En
altres àmbits com el de la informació metereològica destaquen sistemes com Jupiter, que
proporciona de manera automàtica i a través del telèfon dades sobre el temps
de més de 500 ciutats del món.
Finalment,
cal assenyalar la importància que està adquirint la integració entre els
sistemes de diàleg i la web, tal com es fa patent a Dinex. Un dels
projectes més ambiciosos en aquest camp és WebGalaxy, orientat
a la recerca d'informació a Internet mitjançant preguntes lliures, tractades
per un reconeixedor de parla i per un sistema de comprensió del llenguatge
natural, complementats per un procediment de navegació.
Una
aplicació que està adquirint una importància cada vegada més gran són els
sistemes de traducció automàtica de converses, tant telefòniques com cara a
cara. Projectes com Verbmobil, Janus
o Nespole
(Negociating through Spoken Language in E-commerce), aquest darrer especialment orientat al comerç electrònic,
posen de manifest el futur d'un camp que requereix simultàniament tecnologies
pròpies del processament del llenguatge natural com la traducció automàtica i
tecnologies de la parla con el reconeixement, la síntesi i el diàleg.
La
combinació d'aquestes tecnologies és també indispensable en l'ensenyament de
llengües assistit per ordinador, tant en els sistemes presencials com en
l'ensenyament a distància. Entre els primers, poden esmentar-se
projectes com ISLE
(Interactive Spoken Language Education),
aplicacions com les
desenvolupades a SRI
International
o productes com
els que comercialitza Auralog, orientats a l'ensenyament de llengües
estrangeres; per als infants que aprenen la llengua materna,
eines com Listen
faciliten la pràctica de la lectura. En
l'ensenyament a distància, són útils, en el camp que ens ocupa, sistemes com WebGrader, que fan possible
avaluar la pronúncia a través de la web.
Cal
també referir-se al paper de les tecnologies lingüístiques com a ajuda als
col·lectius amb necessitats especials. Els conversors
de text a parla o els sistemes que combinen un escàner amb un conversor con ara el ja clàssic Kurzweil, fan possible la lectura als invidents. Les
persones amb dificultats d'audició troben en la conversió de parla a text
mitjançant tècniques de reconeixement un ajut important si disposen de telèfons
que incorporin pantalles, i també poden fer ús de la lectura labial mitjançant
un rostre generat artificialment, con mostra el projecte Teleface. Les limitacions en la producció de la
parla es poden resoldre amb sistemes de generació de missatges i, en el cas de
persones amb problemes de mobilitat, el control de l'entorn domèstic mitjançant
la veu augmenta notablement la seva independència.