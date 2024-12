Més enllà de la discriminació de gènere

LangBiTe es diferencia d'altres programes similars pel seu abast i, segons els investigadors, es tracta de l'eina "més completa i detallada" que hi ha actualment. "Anteriorment, la majoria dels experiments se centraven en la discriminació de gènere home-dona, sense considerar altres aspectes ètics importants o minories vulnerables. Amb LangBiTe hem comprovat fins a quin punt alguns models d'IA poden respondre a certes qüestions de manera racista, des d'un punt de vista polític clarament parcial, o amb connotacions homòfobes o trànsfobes", expliquen.

A més, els investigadors assenyalen que, tot i que en altres treballs s'han creat classificacions de models d'IA respecte a diverses dimensions, el seu enfocament ètic ha estat "massa superficial, sense detallar els aspectes específics avaluats".

Un programa flexible i adaptable

El nou programa permet analitzar si una aplicació o eina que incorpora funcions basades en models d'IA s'adapta als requisits ètics o comunitats d'usuaris concrets de cada institució o organisme. "LangBiTe no prescriu cap marc moral particular. El que és ètic i el que no ho és depèn sobretot del context i la cultura de l'organització que desenvolupa i incorpora característiques basades en models generatius d'IA en el seu producte. Per tant, el nostre enfocament permet als usuaris definir les seves pròpies preocupacions ètiques i els seus corresponents criteris d'avaluació per adaptar l'avaluació del biaix al seu context cultural particular i a l'entorn regulador", expliquen els investigadors.

Amb aquest objectiu, LangBiTe inclou biblioteques amb més de 300 prompts —instruccions o preguntes que es fan servir per interaccionar amb la IA— destinats a revelar biaixos en els models, cadascuna d'elles especialitzada en una preocupació ètica particular: edatisme, LGBTIQA-fòbia, preferències polítiques, prejudicis religiosos, racisme, sexisme i xenofòbia. Cadascun d'aquests prompts té unes respostes associades per poder valorar si la resposta del model està esbiaixada. A més, també inclou plantilles de prompts que es poden modificar, la qual cosa permet a l'usuari ampliar i enriquir la col·lecció original amb noves preguntes o preocupacions ètiques.

Molt més que ChatGPT

Actualment, LangBiTe proporciona accés als models propietaris d'OpenAI (GPT-3.5, GPT-4) i altres desenes de models d'IA generativa disponibles a Hugging Face i Replicate, que són plataformes que faciliten interactuar amb una gran varietat de models com els de Google i Meta. "A més, qualsevol desenvolupador interessat pot estendre la plataforma LangBiTe per avaluar altres models, incloent-hi els seus propis", afegeix Morales.

El programa també permet comprovar en tot moment la diferència entre respostes de diferents versions d'un mateix model i entre models de diferents proveïdors. "Per exemple, vam veure que la versió disponible de ChatGPT 4 tenia una taxa d'èxit de proves contra el biaix de gènere del 97 %, superior a l'obtinguda per la versió disponible en aquell moment de ChatGPT 3.5, amb un 42 % d'èxit. En aquesta mateixa data vam veure que, per al model Flan-T5 de Google, com més gran era, menys esbiaixat es mostrava respecte a gènere, religió i nacionalitat", recorda l'investigador.

Anàlisi multilingüe i multimèdia

Els models d'IA més populars van néixer a partir de contingut en anglès, però gradualment s'estan desenvolupant iniciatives regionals amb models entrenats en altres idiomes, com ara català o italià. En aquesta línia, els investigadors de la UOC han incorporat la funció d'avaluar eines en diferents idiomes, fet que permet als usuaris "detectar si un model mostra biaixos depenent del llenguatge que s'empra per a les consultes", assenyala Morales.

A més, també estan treballant per ser capaços d'analitzar models que generen imatges com Stable Diffusion, DALL·E i Midjourney. "L'aplicació actual d'aquestes eines va des de l'elaboració de llibres infantils fins a l'acompanyament de notícies, la qual cosa pot portar a la propagació d'estereotips tergiversadors o nocius, que òbviament la societat està interessada a erradicar. Esperem que el futur LangBiTe sigui útil per detectar, i apel·li a corregir, qualsevol tipus de biaix present en imatges generades per aquests models", destaca l'investigador de la UOC.

Una eina per complir amb l'EU AI Act

Les característiques d'aquesta eina poden ajudar a complir amb la recent Llei d'intel·ligència artificial de la Unió Europea (EU AI Act), que té com a comesa vetllar perquè els nous sistemes amb IA promoguin l'accés equitatiu, la igualtat de gènere i la diversitat cultural, i que en cap cas el seu ús comprometi els drets de no-discriminació estipulats per la Unió i les lleis nacionals dels seus països membres.

En aquest sentit, el programa ja ha estat adoptat per institucions com el Luxembourg Institute of Science and Technology (LIST), que ha integrat LangBiTe per avaluar diversos models d'IA generativa populars.

Aquesta recerca afavoreix els Objectius de Desenvolupament Sostenible de l’ONU: 5. Igualtat de gènere i 9. Indústria, Innovació i Infraestructura.