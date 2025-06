Àgata Lapedriza és una investigadora líder en l'àmbit de la intel·ligència artificial a escala internacional, cap del grup Artificial Intelligence for Human Wellbeing (AIWELL) —adscrit a l'eHealth Center de la Universitat Oberta de Catalunya (UOC)— i també investigadora en el prestigiós Massachusetts Institute of Technology (MIT). Professora, a més, dels Estudis d'Informàtica, Multimèdia i Telecomunicació, la seva recerca s'enfoca a la visió per computador i a la robòtica social, i els seus articles s'han citat milers de vegades en els últims anys.

Com valores els últims avenços en intel·ligència artificial, especialment el xat OpenGPT? Per què ha causat tanta sensació?

El progrés de la intel·ligència artificial en els darrers deu anys ha estat espectacular i el ritme al qual avança fa que continuï en ascens. El que fa ChatGPT és increïble. Ja fa temps que existeixen xatbots orientats a tasques concretes, com ara xatbots que ens poden ajudar a reservar una taula en un restaurant o a trobar un producte en una pàgina web. Aquests xatbots orientats a tasques funcionen relativament bé, però són molt limitats. La diferència és que ChatGPT és un sistema de diàleg obert, amb el qual, en principi, pots parlar de qualsevol tema. Crear sistemes de diàleg oberts és molt més complicat que fer sistemes de diàleg orientats a una tasca. Fa cinc anys vaig treballar en un projecte relacionat amb models de diàleg obert i tot funcionava molt malament.

Té molt marge de millora ChatGPT?

Aquest tipus de tecnologies encara necessiten moltes iteracions abans de poder-se utilitzar en casos pràctics, perquè cal entendre plenament com es comporten (per exemple, quins biaixos tenen, quina informació no són capaços de representar correctament, etc.). Però, sens dubte, el que s'està aconseguint avui és fantàstic i quan estigui madur pot ser molt útil.

Una part del teu treball s'enfoca a explicar com funciona la intel·ligència artificial, per tal que no sigui una "caixa negra"...

El darrer article que hem publicat en aquest àmbit proposa un mètode d'explicabilitat per entendre millor com funcionen els models d'aprenentatge profund (deep learning) que fan classificació de cares. Per exemple, els sistemes de verificació facial, que fan servir molts models de telèfon mòbil per desbloquejar-se de manera segura. Treballem per dissenyar models computacionals que puguin donar explicacions sobre les seves respostes, i ser així més transparents. Aquestes explicacions ens ajuden a saber si ens podem refiar de la resposta del sistema d'intel·ligència artificial.

Com es poden detectar els biaixos sovint presents en la intel·ligència artificial?

Mitjançant els mecanismes d'explicabilitat podem descobrir comportaments esbiaixats del sistema. Tant la transparència com la detecció de biaixos són importants per assegurar-nos que la intel·ligència artificial funciona de manera justa i fiable. Això és especialment essencial quan aquesta tecnologia s'utilitza per prendre decisions que poden afectar les persones, com per exemple per assistir en el diagnòstic de malalties. La transparència i el comportament no esbiaixat dels sistemes d'intel·ligència artificial són necessaris per desenvolupar una intel·ligència artificial responsable que tingui un impacte positiu en la societat.

Un altre focus de la teva recerca és la interacció entre robots i persones.

Aquest any volem dedicar una part dels esforços a la robòtica social, per entendre les mancances que tenen els sistemes de percepció de comunicació verbal i no verbal quan processen informació a temps real. Investiguem la comunicació de caràcter social i emocional que hi pot haver entre un robot i una persona. Per exemple, en una interacció entre ambdós, que el robot sigui capaç de percebre si la persona li està prestant atenció, si li està expressant una emoció concreta o si li està indicant que espera una resposta del robot.

També tens projectes en sistemes de visió per computador, que és una de les teves especialitats.

Sí, volem avançar en el disseny de dispositius que capturin imatges de la retina i la creació de sistemes de visió per computador que analitzin aquestes imatges per detectar malalties de manera precoç. Aquests projectes els estan liderant els professors David Merino i David Masip, en col·laboració amb universitats com ara la de Califòrnia a Berkeley (EUA) i hospitals com el Vall d'Hebron de Barcelona. També en relació amb el diagnòstic de malalties, el professor Carles Ventura està començant un projecte molt interessant de detecció del càncer de boca a partir d'imatges.

En quin moment estem en les tecnologies de visió per computador?

En els darrers anys s'ha fet un avenç espectacular en la detecció de patrons: per exemple, la detecció d'objectes, el reconeixement facial, la detecció de punts facials d'interès (com ara els extrems dels ulls o de la boca), la reconstrucció 3D a partir d'una o diverses imatges en 2D, o les eines pel diagnòstic basades en l'anàlisi automàtica d'imatges mèdiques, com ara mamografies o radiografies. Tot aquest progrés ha estat gràcies a l'aprenentatge profund, els grans volums de dades disponibles i la disponibilitat de maquinari per poder realitzar càlculs més efectius (per exemple les GPU).

Quines són les debilitats d'aquests sistemes, actualment?

Algunes de les debilitats són els biaixos o la poca capacitat de generalitzar en grups de dades que no estan ben representats. Entendre com superar aquestes debilitats és un repte i s'hi estan dedicant molts esforços. A més, hi ha molts reptes generals de la intel·ligència artificial que també afecten la visió per computador, per exemple, poder aprendre de conjunts de dades més petits. Els algorismes d'aprenentatge profund necessiten grans volums de dades etiquetades —per exemple, per aprendre a detectar pneumònia en radiografies de tòrax necessites moltes imatges de radiografies de persones sanes i de persones amb pneumònia—, i tenir aquestes imatges és costós. Seria fantàstic que la intel·ligència artificial aprengués de manera robusta amb pocs exemples, però avui en dia això encara no és possible.

També treballes en solucions que prediguin problemes de salut a partir de l'anàlisi de les nostres dades personals.

El professor Xavier Baró i jo explorem possibles solucions basades en dades capturades per dispositius electrònics personals —com ara el mòbil o un rellotge intel·ligent— per detectar malalties mentals de manera precoç. La nostra hipòtesi és que les dades que capturen els dispositius personals, juntament amb els sensors (com ara l'acceleròmetre, el sensor de llum o senyals fisiològics com ara el ritme cardíac) contenen informació sobre els nostres hàbits (per exemple, quantes hores dormim o si ens movem molt o poc). Aquesta informació té un interès clínic, perquè els canvis d'hàbits poden ser motiu (o conseqüència) d'un problema de salut mental. Per exemple, se sap que una alteració del patró de son pot estar relacionada amb un increment de l'estrès, i un estrès prolongat pot derivar en malalties mentals greus. Estem estudiant si es pot utilitzar la informació que els sensors capturen per detectar precoçment malalties mentals, moment en què les intervencions serien més. En aquest projecte treballem en col·laboració amb personal investigador del Massachusetts Institute of Technology (MIT, EUA), Universitat de Albizu (Florida, EUA) i l'Institut Politècnic Nacional (Mèxic). Esperem fer progressos interessants durant el 2023.

Alguna altra recerca que vulguis destacar?

Els últims tres anys hem treballat en la detecció d'incidents i desastres naturals (per exemple, incendis forestals, terratrèmols o accidents de cotxe) en imatges de les xarxes socials. Una de les motivacions és poder detectar imatges d'esdeveniments que poden requerir ajuda humanitària i facilitar una resposta ràpida de les ONG, que habitualment tenen problemes per aconseguir informació sobre què està passant. El nostre últim article mostra experiments sobre com es poden detectar imatges d'incidents a xarxes socials, i els resultats són molt prometedors. També hem desenvolupat una aplicació web per poder fer aquest monitoratge a temps real. Per aquesta recerca col·laborem amb personal investigador del MIT i del Qatar Computing Research Institute. Has estat professora visitant a Google. Com ha estat l'experiència de treballar amb aquesta companyia? Vaig estar un any a Google Research amb el programa Visiting Faculty. Va ser la primera vegada que vaig fer recerca en una empresa, fora de l'acadèmia. Va ser una experiència molt interessant i positiva, que m'ajuda a mentoritzar millor l'estudiantat que vol anar a la indústria després d'acabar el doctorat.

Per acabar, quin seria el teu missatge per motivar les nenes a dedicar-se a les matemàtiques i la tecnologia?

Els diria que les matemàtiques i la tecnologia serveixen per trobar solucions a una varietat enorme de problemes, en àmbits tan diversos com la salut, l'educació, l'entreteniment, la planificació urbanística o el disseny. També es poden utilitzar per crear art visual, música o literatura. I els diria que no es creguin els estereotips que ens venen a les pel·lícules o a les sèries, en què les persones que es dediquen a la tecnologia són rares o antisocials. Tot això és fals. Hi ha gent meravellosa, oberta i sociable que treballa en tecnologia, i és divertit i apassionant poder participar en el progrés de tots aquests àmbits. Ens cal gent amb diferents perfils, sensibilitats i inquietuds que contribueixi a la creació de tecnologia inclusiva.

L'eHealth Center investiga com les tecnologies digitals contribueixen a millorar la salut i el benestar individuals i col·lectius, com la salut digital permet reforçar —a partir de la tecnologia, la comunicació i les dades— els sistemes de salut i els seus professionals, i com ens ajuda a tenir més coneixement i millor capacitat de decisió sobre la mateixa salut.