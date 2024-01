Àgata Lapedriza és investigadora del grup de recerca Scene Understanding and Artificial Intelligence LAB (SUNAI) de la UOC, experta en visió per computador ‒especialment en el reconeixement d'objectes i la interpretació d'escenes‒, aprenentatge artificial, computació afectiva i mineria de dades. Com a investigadora ha realitzat diverses estades internacionals al Massachusetts Institute of Technology (MIT) de Boston. Doctora en Informàtica, és professora dels Estudis d'Informàtica, Multimèdia i Telecomunicació i directora del màster de Bioinformàtica i Bioestadística. Entre els seus treballs més recents destaquen la seva participació en el projecte Places, desenvolupat al MIT, el qual consisteix en la creació d'una base de dades de gran escala per al reconeixement automàtic d'escenes i en el desenvolupament de diversos sistemes automàtics per al reconeixement d'escenes basats en Deep Learning. Actualment treballa en temes de reconeixement d'emocions i és professora visitant en el grup de recerca de computació afectiva del MIT Medialab.

Quina ha estat la teva formació i expertesa?

Vaig fer Matemàtiques a la Universitat de Barcelona i després una tesi doctoral sobre informàtica a l'Autònoma de Barcelona, en l'àmbit de la intel·ligència artificial (IA). En particular, la meva tesi va ser sobre visió per computador, que és la branca de la IA que intenta simular el sistema visual humà: intentem fer màquines que puguin tenir percepció visual, que puguin entendre la informació visual, les imatges i els vídeos.

Formes part del grup de recerca SUNAI: en què consisteix la vostra activitat?

SUNAI és l'acrònim d'«Scene Understanding and Artificial Intelligence Lab». El que fem és visió per computador, reconeixement i classificació d'imatges. Som quatre doctors dirigint la recerca. Treballem en el reconeixement d'emocions, entre altres coses. Amb en David Masip hem estat treballant en el reconeixement d'expressions facials i actualment jo treballo més en el reconeixement de les escenes, en la interpretació de l'escena global. En el grup també hi ha el Carles Ventura, que treballa en la segmentació semàntica, que vol dir detectar amb precisió els diferents objectes i les diferents parts dins d'una escena. I en Xavier Baró, que fa reconeixement de la postura corporal i els gestos. També treballa una mica amb cares i amb interpretació d'imatges usant informació de profunditat a més de la imatge. Al final quasi tot el que fem està relacionat amb reconèixer què fa la gent, com se sent i com es comporta.

Has pogut fer estades en llocs referencials com el MIT a Boston: com valoraries les teves experiències internacionals?

Pel que fa a recerca, el que vaig fer durant la tesi estava més relacionat amb el reconeixement de les cares i la seva classificació, però de mica en mica em vaig anar interessant més pel reconeixement global de l'escena. Al Massachusetts Institute of Technology (MIT), a Boston, hi ha un grup de reconeixement i interpretació d'escenes que és molt bo. De fet, són els pioners, els que van definir, dins de la visió per computador, el problema de reconèixer l'escena en general i com cal utilitzar el context per a entendre coses concretes de l'escena. Vaig contactar amb ells, havíem coincidit en congressos, i vaig poder fer una visita, que inicialment anava a ser de tres mesos i es va allargar fins als tres anys. Ha estat molt interessant. Ha estat una experiència que m'ha donat una perspectiva de la recerca molt diferent de la que tenia quan no m'havia mogut d'aquí.

Fins a quin punt la recerca com la teva necessita conèixer experiències d'altres institucions?

Crec que és important en general col·laborar amb gent de fora. En qualsevol àmbit hi ha un expert que és el millor i és poc probable que estigui a la teva ciutat. Si et vols formar, si t'interessa el que sap aquell expert, el millor que pots fer per aprendre'n és anar a treballar a prop seu.

Quines aplicacions té actualment el reconeixement facial o d'espais?

Ja existeixen productes comercials que utilitzen l'anàlisi d'expressions facials per a reconèixer emocions. Hi ha empreses que desenvolupen programes per al reconeixement d'expressió facial i per a intentar reconèixer emocions a partir de microexpressions o d'expressions més explícites. El seu ús és múltiple. Des d'empreses de màrqueting que analitzen la teva cara mentre mires publicitat i analitzen la teva expressió facial per saber com la informació que veus afecta la teva emoció, fins a aplicacions mèdiques per a persones amb autisme o Alzheimer, en què pot resultar útil el monitoratge de l'expressió facial davant d'un determinat estímul per a permetre fer diagnòstic o seguiment del pacient durant la malaltia.

Ets una de les guanyadores del UOC Research Showcase 2017: en què consisteix el treball que hi vas presentar?

El treball que vaig presentar al Research Showcase és un article de reconeixement d'emocions que es diferencia d'altres treballs anteriors perquè analitza la imatge completa (la persona més el seu context) per fer una estimació dels estats emocionals. Com he dit, la tecnologia que està més avançada quant al reconeixement d'emocions és l'anàlisi de l'expressió facial. El que ens plantegem en aquest projecte és que, tot i que està molt bé analitzar l'expressió de la cara perquè transmet molta informació, el context és fonamental per a entendre bé els estats emocionals de les persones. De la mateixa forma que una frase sencera dona significat explícit a cada paraula, el context de la persona també dona significat al que expressa amb la cara. No pots extreure només la cara en una circumstància normal i esperar entendre perfectament com se sent aquella persona. Nosaltres, els humans, no ho fem així. Estem intentant dissenyar sistemes que modelin el context, entenent-lo com tot el que envolta una persona: el que està fent, en quina postura està, quins objectes té a prop, en quin entorn està, si hi ha més gent o no al voltant. El que fem és mirar d'extreure tota aquesta informació, processar-la i utilitzar-la de manera complementària a l'expressió facial per a poder estimar de forma més fiable l'estat emocional d'una persona.

Ens hauríem de preocupar del control de les emocions?

En general, qualsevol avenç tecnològic té uns potencials usos positius i negatius. Això és inevitable. Està en la nostra responsabilitat fer un bon ús de tot el que desenvolupem. Jo penso que no s'ha de frenar el progrés científic pels potencials mals usos. Però sí que és la nostra responsabilitat utilitzar-lo correctament. I les tecnologies per a reconèixer, per exemple, els estats emocionals de la gent tenen moltíssimes aplicacions positives, perquè hi ha moltes aplicacions en què les màquines necessiten interactuar amb la gent o assistir-la. Que puguin entendre que la gent se sent de formes diferents i que es puguin adreçar a les persones en funció del seu estat emocional crec que és molt important.

Per què és important explicar a la societat la recerca que fas?

És important que la societat entengui per què es fa recerca, en què es fa i per què és útil. Al final, l'objectiu dels investigadors és progressar, descobrir i inventar coses noves, i tots esperem prestar d'alguna forma un servei a la societat. Em dona satisfacció que la gent pugui entendre de què serveix el que fem i per què invertim temps en una determinada cosa i no en una altra.

Ens recomanes algun llibre sobre el teu àmbit?

El que jo faig està relacionat amb el sistema perceptual. Els que fem visió el que fem són màquines que interpretin aquest món. Relacionat amb la percepció hi ha un llibre que es diu Blink, de Malcolm Gladwell, sobre la nostra percepció i com els processos no conscients afecten les nostres reaccions, els judicis i les decisions que prenem.