Acords i estudis per impulsar les llengües minoritàries

La primera part del projecte es porta a terme fora dels laboratoris. Per disposar de les dades necessàries per entrenar els models d'intel·ligència artificial, cal recopilar tot el material que sigui possible de l'asturià, l'aragonès i l'aranès. "Per això, aquesta primera fase se centra a aconseguir acords amb governs autonòmics, universitats o editorials perquè ens facilitin el material per crear els corpus paral·lels mitjançant els quals puguem entrenar el sistema neuronal", assenyala Oliver.

En aquest sentit, en el marc d'aquest projecte s'ha arribat a un acord amb el govern del Principat d'Astúries per a la cessió de tot el corpus de textos traduïts del castellà a l'asturià que té la Dirección Xeneral de Política Llingüística. El conveni recull també que, si el Principat ho necessita, podrà disposar dels desenvolupaments tecnològics i lingüístics del projecte TAN-IBE per aprofitar-los en possibles projectes propis de traducció automàtica.

"En última instància, amb aquest projecte volem ajudar a fomentar l'ús de les llengües amb menys recursos i incrementar les publicacions en aquestes llengües", afegeix l'investigador de la UOC. "Per exemple, totes les lleis es podrien publicar en dues llengües de manera ràpida i eficient, invertint-hi menys recursos, tot i que sempre caldria una revisió humana. A més, les persones que no s'atreveixen a fer servir aquestes llengües perquè no se senten segures poden emprar aquestes eines per millorar els seus textos. Finalment, les llengües com l'asturià, l'aragonès o l'aranès han de formar part de les tecnologies digitals. Si no, poden anar desapareixent i ser oblidades", conclou Oliver.

Aquesta recerca de la UOC afavoreix l'objectiu de desenvolupament sostenible (ODS) de les Nacions Unides 4, garantir una educació inclusiva, equitativa i de qualitat i promoure oportunitats d'aprenentatge durant tota la vida per a tothom.

Projecte PID2021-124663OB-I00 finançat per MCIN /AEI /10.13039/501100011033 / FEDER, UE.

