 |
Nom del projecte

 |
Desenvolupament, avaluació, experimentació i aplicació de tècniques per a la traducció automàtica no supervisada i el tractament de la informació textual.
|
Participants

|
Magí Almirall Hill
Salvador Climent Roca
Pilar Gispert-Saüch Viader
Xavier Lloré Nadal
Isidor Marí Mayans
Jaume Mateu Fontanals
Pedro Mingueza de la Villa
Joaquim Moré López
Antoni Oliver González
Míriam Salvatierra Mallarach
Imma Sánchez Sáiz
Mariona Taulé Delor
Lluïsa Vallmanya Cucurull
|
Plantejament inicial

|
La UOC és una universitat radicada a Internet, sense límits territorials, que actualment imparteix estudis en català i castellà, amb determinats àmbits de coexistència d'ambdues llengües, amb objectius futurs d'ampliació cap a altres àmbits lingüístics i amb necessitats de difusió multilingüe.
A més, en la nostra societat s'ha fet evident el problema afegit de la creixent minorització del català, un problema que s'agreuja en la comunicació a Internet. Si ja d'entrada resulta quasi bé utòpic viure en català, a Internet s'hi han detectat signes alarmants de retrocés, fins i tot en àmbits favorables a priori per a aquesta llengua, com en determinats espais de comunicació acadèmica de la mateixa UOC. Atesa aquesta situació, considerem que la UOC ha d'apostar per la recerca i el desenvolupament en les tecnologies de la traducció automàtica i els àmbits que s'hi relacionen.
Així doncs, hem centrat el projecte de recerca que presentem en la traducció automàtica en línia de missatges de correu electrònic entre el parell de llengües català/castellà, pel seu caràcter innovador, per la seva especial rellevància per a la comunicació dins la UOC i perquè a mitjà termini de la recerca se'n pot derivar una aplicació totalment operativa en el Campus Virtual. Aquest objectiu comporta -i se'n beneficia- la realització de treballs de recerca bàsica i aplicada en diverses línies relacionades, com l'adquisició semiautomàtica de coneixement lèxic o l'anàlisi comparativa d'estructures sintàctico-semàntiques en diferents llengües.
|

Objectius

|
- Implementar un entorn prototip de traducció automàtica no supervisada per al parell de llengües català/castellà en un espai del Campus Virtual.
- Desenvolupar estratègies per a millorar el resultat de la traducció automàtica en aquests entorns.
- Portar a terme estudis en l'àmbit de la lingüística i la lingüística computacional que condueixin a la millora dels sistemes de traducció automàtica i altres sistemes de processament del llenguatge.
|
Resultats

|
- Publicacions més destacades
Almirall, M.; Climent, S.; Mingueza, P.; Moré, J.; Oliver, A.; Salvatierra, M.; Sánchez, I.; Taulé, M.; Vallmanya, L. (2003). Machine Translation at the UOC Virtual Campus. Evaluation, Problems, Solutions and Prototype Implementation. INTERLINGUA WP 1.2.
Climent, S.; Moré, J.; Oliver, A. (2002). Building an environment for unsupervised automatic email translation. EAMT-CLAW 2003.
Climent, S.; Moré, J.; Oliver, A. (2002). Customizing an mt system for unsupervised automatic email translation. INTERLINGUA WP 1.1.
Climent, S.; Moré, J.; Oliver, A.; Salvatierra, M.; Sánchez, I.; Taulé, M.; Vallmanya, L. (2002). Bilingual Newsgroups in Catalonia: A Challenge for Machine Translation (en premsa). Document presentat a Journal of Computer-Mediated Communication.
Servei Lingüístic de la UOC (2003). Guia de l'usuari.
- Programari desenvolupat
| - |
Detector de llengua, obté una precisió del 94,6% sobre el corpus de missatges utilitzat per a l'avaluació del projecte.
|
| - |
Mòdul integrat de preedició automàtica de missatges, integra submòduls de recuperació d'accents, solució de problemes gràfics i de puntuació, resolució de les errades lèxiques i ortogràfiques estadísticament més comunes i normalització de lèxic innovador o errades típiques pròpies de l'oralitat o la interferència entre llengües.
|
| - |
Primer prototip d'entorn integrat de traducció de missatges, actualment en funcionament (no visible per als usuaris) en un fòrum del Campus Virtual de la UOC. |
|

|