L'enginyeria lingüística en la societat de la informació
                                                                                                               



1. Comunicació i llenguatge en el marc de la societat de la informació | 2. Les tecnologies lingüístiques

3. Les tecnologies del text escrit | 4. Les tecnologies de la parla | 

5. La societat de la informació en el context europeu | 6. Perspectives professionals | 7. Referències

 

4. Les tecnologies de la parla

L'ús de la llengua oral com a mode de comunicació amb els sistemes informàtics permet, en primer lloc, alliberar les mans i la vista, facilitant la recepció de la informació des de qualsevol punt i fent possible la mobilitat, de manera que es poden realitzar altres activitats simultànies. L'entrada de dades sobre productes en la gestió dels fons d'un magatzem, les operacions relacionades amb el manteniment i el control de la qualitat en entorns industrials, la recepció d'informació en entorns com cabines d'avió amb una gran quantitat de sistemes de comandament i indicadors, el control de la ràdio, del telèfon o de la climatització d'un cotxe i l'obtenció d'informació sobre itineraris - el prototip desenvolupat en el projecte Vodis (Advanced Speech Technologies for Voice-operated Driver Information Systems)ofereix aquestes possibilitats -, o el dictat de documents , són algunes de les aplicacions per a les quals s'ha demostrat que utilitzar la llengua parlada és un avantatge important.

En segon lloc, emprar la parla per accedir a la informació emmagatzemada en un sistema informàtic ens dóna la possibilitat d'utilitzar el telèfon en lloc de la pantalla i el teclat tradicionals, amb tot el que això comporta en rapidesa; cal pensar també en la independència de la distància i de la disponibilitat d'un ordinador que proporciona aquest procediment. Algunes aplicacions en aquest àmbit són els serveis d'informació sobre horaris de transports públics, les consultes a planes grogues o altres directoris, la informació ciutadana, la banca telefònica o les centraletes automatizades.

Finalment, cal no oblidar que guardar i rebre informació per mitjà de la parla és una alternativa pràctica quan s'ha de prescindir, per raons de tamany, del teclat, com és el cas de les agendes electròniques - productes com ArtCommander faciliten l'entrada de dades per veu -  i els comunicadors personals. La veu, juntament amb els llàpissos electrònics i les pantalles tàctils, és una modalitat viable per augmentar la funcionalitat d'aquests aparells.

Avui en dia disposem de programes comercials que fan possible el dictat automàtic com ara els desenvolupats per Dragon Systems, IBM o Philips, la navegació per Internet - el Free Speech Browser n'és un exemple - i la recuperació d'informació mitjançant la parla. També és possible la lectura en veu alta d'un text en format electrònic com podria ser un un missatge de correu (per exemple, el projecte EMU o el contingut d'una base de dades. És possible també, amb els sistemes de diàleg que incorporen síntesi, reconeixement i un cert grau de comprensió, obtenir informació o realitzar transaccions comercials a través del telèfon.

Segurament són aquests darrers sistemes els que en l'actualitat desvetllen més interès, i per aquest motiu esmentarem algunes de les seves aplicacions.

Un dels sectors per als quals s'han desenvolupat sistemes de diàleg és el dels transports públics, ja que sovint les centraletes telefòniques no poden atendre totes les trucades dels usuaris, especialment pel que fa a la consulta d'horaris. Projectes com Arise (Automatic Railway Information Systems for Europe) han desenvolupat prototips per a donar resposta a aquesta mena de peticions, concretament en el cas dels ferrocarrils, mentre que, per exemple, ATIS (Advanced Travel Information System) i Pegasus proporcionen informació sobre horaris de vols.

Existeixen també sistemes de diàleg complementats amb informació multimodal, entre els quals pot esmentar-se Waxholm, que ofereix informació sobre el transport marítim a l'arxipèlag d'Estocolm emprant la veu acompanyada d'un rostre generat també mitjançant un ordinador, Mask, un quiosc  que proporciona dades sobre circulació de trens francesos tant verbalment com a través d'una pantalla, i que permet també reservar bitllets, o Toot, dissenyat per realitzar consultes vocals a la web i obtenir horaris de trens.

La informació ciutadana és un altre servei que es pot oferir de manera automàtica a través del telèfon. Voyager, per exemple, informa en anglès, francès i italià sobre adreces, números de telèfon i localització de restaurants, hotels, oficines de correus, estacions de metro, etc. a l'àrea de Boston. D'aquesta aquesta mateixa zona es pot rebre informació sobre restaurants amb el sistema Dinex: un telèfon i un ordinador connectats a Internet permeten conèixer la localització, el preu, el tipus de tarjeta de crèdit acceptat i, en alguns casos, el menú, tot això fent preguntes en llenguatge natural como ara "Quins restaurants xinesos hi ha prop de l'hotel Plaza?". Hi ha també aplicacions com Movieline - centrada en la cartellera dels cinemes de Pittsburgh - que ofereixen informació parlada.

En altres àmbits com el de la informació metereològica destaquen sistemes com Jupiter, que proporciona de manera automàtica i a través del telèfon dades sobre el temps de més de 500 ciutats del món.

Finalment, cal assenyalar la importància que està adquirint la integració entre els sistemes de diàleg i la web, tal com es fa patent a Dinex. Un dels projectes més ambiciosos en aquest camp és WebGalaxy, orientat a la recerca d'informació a Internet mitjançant preguntes lliures, tractades per un reconeixedor de parla i per un sistema de comprensió del llenguatge natural, complementats per un procediment de navegació.

Una aplicació que està adquirint una importància cada vegada més gran són els sistemes de traducció automàtica de converses, tant telefòniques com cara a cara. Projectes com Verbmobil, Janus o Nespole (Negociating through Spoken Language in E-commerce), aquest darrer especialment orientat al comerç electrònic, posen de manifest el futur d'un camp que requereix simultàniament tecnologies pròpies del processament del llenguatge natural com la traducció automàtica i tecnologies de la parla con el reconeixement, la síntesi i el diàleg.

La combinació d'aquestes tecnologies és també indispensable en l'ensenyament de llengües assistit per ordinador, tant en els sistemes presencials com en l'ensenyament a distància. Entre els primers, poden esmentar-se  projectes com ISLE (Interactive Spoken Language Education),  aplicacions  com les desenvolupades a SRI International o productes com els que comercialitza Auralog, orientats a l'ensenyament de llengües estrangeres; per als infants que aprenen la llengua materna,  eines com Listen faciliten la pràctica de la lectura. En l'ensenyament a distància, són útils, en el camp que ens ocupa, sistemes com WebGrader, que fan possible avaluar la pronúncia a través de la web.

Cal també referir-se al paper de les tecnologies lingüístiques com a ajuda als col·lectius amb necessitats especials. Els conversors de text a parla o els sistemes que combinen un escàner amb un conversor con ara el ja clàssic Kurzweil, fan possible la lectura als invidents. Les persones amb dificultats d'audició troben en la conversió de parla a text mitjançant tècniques de reconeixement un ajut important si disposen de telèfons que incorporin pantalles, i també poden fer ús de la lectura labial mitjançant un rostre generat artificialment, con mostra el projecte Teleface. Les limitacions en la producció de la parla es poden resoldre amb sistemes de generació de missatges i, en el cas de persones amb problemes de mobilitat, el control de l'entorn domèstic mitjançant la veu augmenta notablement la seva independència.

 esq_a.gif (165 bytes)  dre_a.gif (166 bytes)