«Les indústries de l'esport i la salut no són immunes a l'ús de les dades massives i la intel·ligència artificial» 

 Dades massives en salut i esport

Foto: Alexander Sinn/Unsplash

10/12/2020
Sílvia Oller
Angel A. Juan, Anna Bach i Milagros Sáinz, investigadors de la UOC, ajuden a identificar tendències emergents en big data, salut i esport, amb perspectiva de gènere

 

La intel·ligència artificial (IA) i les dades massives (big data) han entrat de ple en l'esport i la salut. Amb l'objectiu de donar a conèixer la recerca que s'està fent en aquests àmbits, la xarxa espanyola Sports and Health Analytics Research with a Gender Perspective (SHARP), finançada pel Ministeri de Cultura i Esport en coordinació amb tres grups de recerca de la Universitat Oberta de Catalunya (UOC), va organitzar l'octubre un taller amb una vintena d'experts. L'investigador principal del grup Internet Computing & Systems Optimization, de l'Internet Interdisciplinary Institute (ICSO@IN3), Angel Juan; la investigadora del grup FoodLab, directora del màster universitari d'Alimentació en l'Activitat Física i l'Esport i professora dels Estudis de Ciències de la Salut de la UOC, Anna Bach, i la investigadora principal del grup Gènere i TIC (GenTIC) de l'IN3, Milagros Sáinz, ajuden a identificar tendències emergents i predir l'evolució d'un sector que ja no és ciència-ficció

Fa temps que ens hem acostumat a rebre dades estadístiques a l'instant mentre veiem per televisió tota mena de competicions esportives. Els clubs es basen cada cop més en eines com ara les dades massives a l'hora de fitxar jugadors... Quins altres usos té la IA en els esports?

ÁNGEL JUAN / ANNA BACH: De fet, les tècniques analítiques i d'aprenentatge automàtic són cada cop més emprades pels clubs professionals de futbol, bàsquet... per captar talent jove que encaixi bé amb les característiques de l'equip. L'explosió de l'ús de dades i la IA ha afectat pràcticament tots els aspectes de la nostra vida, i la indústria de l'esport no n'ha estat una excepció. En el camp de l'esport, les anàlisis basades en dades poden estar vinculades amb el comportament i l'estat de salut dels esportistes (prevenció de lesions), però també en les decisions dels gestors i dels responsables dels equips esportius, entre altres. 

És possible predir lesions esportives amb les dades massives? I com les poden prevenir?

A.B. / A.J.: L'investigador de la Universitat de Vic - Universitat Central de Catalunya Javier Peña explicava en la seva intervenció «Com les dades poden ajudar a prevenir lesions esportives: restriccions actuals i perspectives de futur» que les lesions són un tema molt complex i que són difícils de predir. El cost de les lesions esportives és elevat i s'han de tractar amb cura si volem promoure l'adhesió a l'activitat física. Les principals limitacions dels estudis de prevenció de lesions en entorns esportius són que, a causa de les polítiques de protecció de dades, la informació sobre les lesions no és pública ni compartida i la notificació de lesions està lluny de ser impecable. A més, molts estudis publicats són retrospectius, fet que ens dona poc marge per canviar els nostres comportaments en temps real. 

La figura de l'observador d'abans està deixant pas a departaments de dades massives en molts clubs esportius. Quins beneficis o resultats els aporta aquesta eina?

A.J. / A.B.: L'investigador Martí Casals, també de la Universitat de Vic - Universitat Central de Catalunya, explicava que el paper del bioestadístic esportiu inclou aportar informació que faciliti la comunicació entre atletes, entrenadors i personal mèdic. Casals dona importància a la qualitat de les dades, a la transparència i al fet que es puguin reproduir i aplicar. Per preguntar correctament sobre dades necessitem proves científiques proporcionades pel bioestadístic, però cal tenir en compte, i de fet aquesta va ser una de les conclusions del taller, que les dades per se no aporten valor si no tenen la qualitat suficient, si no hi ha un bon disseny de recerca i anàlisi i una interpretació correcta dels resultats. 

Les dades massives o la IA són capaces de predir si un nen esportista acabarà tenint talent en l'edat adulta? Quins altres factors hi intervenen?

A.B. / A.J.: David López, investigador d'Esade Business School, en la seva presentació «Contribució de l'anàlisi de dades en l'adquisició de talents esportius», explicava que la tècnica més utilitzada és el judici dels experts per mitjà de l'anàlisi de dades i l'ús de models de simulació. Primer es fa una anàlisi descriptiva per tal de donar una visió de l'activitat i la generació de candidats i, mitjançant anàlisis predictives, s'usen dades per trobar patrons i utilitzar-los per pronosticar què pot passar. Però un dels obstacles d'aquesta eina és que el potencial total continua essent un misteri, ja que molts departaments de clubs només usen l'estadística amb la finalitat d'informar, i no de predir. Un altre factor determinant és el fet que els clubs professionals o semiprofessionals no comparteixen les seves dades i, per tant, tampoc els talents que tenen. 

És cert que hi ha biaixos de gènere en els algoritmes i la IA? Per què es donen aquests biaixos?

MILAGROS SÁINZ: Els biaixos de gènere es produeixen principalment per l'absència de dones i de perspectiva de gènere en el disseny i la producció de la tecnologia i, per tant, dels algoritmes. Els algoritmes es nodreixen d'informació o de dades de diferent tipus procedents de diverses fonts. Si aquestes dades no tenen la qualitat suficient perquè només tenen en compte la informació esbiaixada en funció de papers o estereotips de gènere, qualsevol decisió que es prengui a partir d'aquestes dades tindrà un biaix de gènere. I això és el que passa amb les plataformes de lleure i temps lliure, com ara Netflix o Spotify, que presenten llistes de recomanacions esbiaixades per gènere. 

I com es poden reduir o corregir?

M.S.: S'hauria d'aconseguir que més dones accedeixin a aquests àmbits, però abans caldria canviar la cultura dels contextos educatius i professionals i que les persones que es formen en els àmbits científics i tecnològics ho facin amb perspectiva de gènere. A més, els professors de primària, de secundària i universitaris també haurien de tenir una formació amb perspectiva de gènere. 

Què cal fer per assegurar una bona qualitat de dades? Què haurien de tenir en compte els equips que s'encarreguen d'analitzar dades? 

M.S.: Garantir una bona qualitat de dades implica posar a treballar persones expertes en anàlisi de dades de diverses disciplines, amb coneixements i habilitats de diferent tipus que contribueixin a assegurar que les dades que es prenen com a referència no exclouen persones pertanyents a determinats grups socials. La IA es nodreix de professionals vinculats al processament de la informació del llenguatge natural que contribueixen al desenvolupament d'eines tecnològiques, com ara els assistents virtuals de veu o els bots que empren diferents empreses per proporcionar serveis als usuaris. Aquests professionals aporten un valor afegit incalculable a la IA perquè s'han format en diverses especialitats de ciències socials o humanitats, com ara la filologia o la traducció, disciplines en les quals hi ha una gran presència de dones. 

Situacions extraordinàries com la que estem vivint arran d'aquesta emergència sanitària requereixen la col·laboració de persones provinents de diverses disciplines científiques (també de les ciències socials, les arts i les humanitats) que nodreixin la IA amb dades suficientment riques i rigoroses per donar resposta a reptes sanitaris i socials sobrevinguts. 

Quina és la representació de les dones en els equips d'IA? 

M.S.: Els estudis assenyalen que només l'11 % de les persones que programen codi font són dones. A més, un informe recent corrobora l'escassa diversitat de gènere en la recerca vinculada a la IA, ja que només un 13,8 % dels autors són dones. Les publicacions sobre IA que tenen com a mínim una coautora tendeixen a estar orientades a temes socials, com ara la justícia, la mobilitat humana, la salut o el gènere. 

Actualment, menys del 25 % dels investigadors en IA en institucions i organitzacions acadèmiques són dones. Segons diversos estudis, més del 80 % del professorat universitari que es dedica a temes d'IA està format per homes, i un 11,95 % del personal que investiga sobre IA a Microsoft i un 15,66 % a IBM són dones. 

Per què penses que hi ha tan poca representació femenina?

M.S.: Hi ha molt poques dones matriculades en estudis vinculats amb la IA o que tinguin professions relacionades amb aquest sector. Les oportunitats professionals i laborals lligades a aquest àmbit són il·limitades i es necessita la interdisciplinarietat perquè, des d'àmbits que a priori no són tècnics, es puguin donar solucions als diferents reptes que planteja la IA. La població continua tenint molts estereotips sobre el tipus de persona que treballa en aquest sector. Hi ha la percepció que les dones que treballen en camps lligats a la IA són «friquis» i rares, que no es relacionen amb l'altra gent i que es passen el dia picant codis o davant de l'ordinador. 

Al taller es va parlar de la dificultat que tenen les dones per trobar temps per practicar esport i també de la taxa d'abandonament femení en la pràctica esportiva. Per què passa, això? Com es pot revertir la situació?

M.S.: Generalment les dones assumeixen més responsabilitats en la cura de la família i en les tasques domèstiques, de manera que no els queda gaire marge per gaudir de l'esport i del temps lliure. Segons María Martín, professora de la Universitat Politècnica de Madrid, les futures recerques haurien d'incloure aspectes vinculats amb la motivació per la salut associats a l'esport, incorporar el fet de caminar en les pràctiques esportives i qüestions relacionades amb les condicions de vida de les persones, com ara aspectes vinculats amb la criança, la feina i la llar. 

Seria cabdal utilitzar una metodologia que permeti identificar la variable discriminant (per què no practiquen esport si de debò ho volen?) que complementi altres metodologies. En la seva presentació, la professora Martín va destacar la necessitat de reconsiderar la definició de «pràctica esportiva», ja que moltes dones caminen, però aquest tipus de pràctica esportiva no es considera un esport com a tal. 

En un tema de gran actualitat, la investigadora Lídia Arroyo, de l'IN3, està coordinant un projecte sobre la COVID-19 i el gènere. En què consisteix, Lídia?

LÍDIA ARROYO: És un projecte que té per objectiu crear un portal de dades obertes i analitzar científicament l'impacte de la pandèmia en funció de les desigualtats de gènere al mercat de treball. El projecte analitzarà l'impacte de la COVID-19 segons la segregació ocupacional en funció del gènere. La recerca vol estudiar l'impacte que té la segregació ocupacional horitzontal, relacionada amb la concentració de dones en unes ocupacions i uns sectors específics, com ara en les feines que consisteixen a tenir cura de persones. També analitzarà la segregació ocupacional vertical, que té relació amb una proporció més gran de dones en categories professionals més baixes, un fet que està relacionat també amb altres desigualtats interseccionals, com ara la classe i l'origen. El projecte va ser aprovat pel Programa d'analítica de dades per a la recerca i la innovació en salut (PADRIS), de l'Agència de Qualitat i Avaluació Sanitàries de Catalunya (AQuAS), adscrita al Departament de Salut. 

Com està millorant la salut l'anàlisi de dades? Les dades massives o la IA ajuden a afinar els diagnòstics?

AB/AJ: Aquestes eines permeten processar una gran quantitat de dades emprant algoritmes intel·ligents i millorar molts processos de l'àmbit de la salut. Grups com ara l'ICSO i el FoodLab, tots dos de la UOC, exploren diverses línies de recerca en aquest sentit. Per exemple, estem treballant en projectes de logística sanitària que han de permetre millorar els processos de mostreig i d'administració massiva de medicaments o vacunes, i també que els equips de protecció sanitaris puguin arribar als hospitals tan ràpid com sigui possible. 

També es treballa en projectes que donen suport a especialistes mèdics que han de decidir quines són les millors combinacions de tractament per a alguns càncers, tenint en compte aspectes com ara l'estat de la malaltia, les característiques físiques i genètiques del pacient, el seu gènere i l'edat, les interdependències entre tractaments i la disponibilitat futura de recursos, com ara sales d'operacions, especialistes... 

A més a més, treballem en projectes de reconeixement facial en què s'empren càmeres i algoritmes d'IA per identificar els pacients quan arribin a la sala d'urgències d'un hospital, de manera que tota la informació disponible sobre el pacient es carregui automàticament, en temps real, a l'ordinador dels metges que l'han d'atendre.

Penseu que els governs treuen prou partit de les dades massives a l'hora de fer polítiques eficients, o encara és una eina poc utilitzada?

A.J. / A.B.: Depèn molt de cada país. Hi ha països on la recerca compta amb un finançament més elevat i s'impulsen les carreres científiques i d'altres àmbits en què és més difícil disposar de recursos, com ara personal, equipaments o centres. La inversió en recerca puntera hauria de ser una prioritat per a qualsevol país desenvolupat, però al nostre encara som molt lluny de tenir les facilitats que tenen altres països europeus i nord-americans. 

M.S.: Penso que encara no es treu prou partit de moltes eines d'anàlisi de bases de dades massives, sobretot pel que fa a la perspectiva de gènere. A poc a poc s'estan desenvolupant, i per això és fonamental establir els requeriments ètics i legals que configuren l'ús de les dades massives. 

Quines recerques teniu en curs en els vostres respectius grups de recerca?

AB/AJ: L'estudiant de doctorat i membre del FoodLab i de l'ICSO@IN3 Natalia Forner està fent un estudi sobre els patrons dietètics per a la salut i la sostenibilitat, en el qual farà servir les dades massives per analitzar les dades disponibles i preveure escenaris. 

Seguint en aquesta línia, l'estudiant de doctorat de la Universitat de Ciutat del Cap (República de Sud-àfrica) i investigadora visitant del FoodLab Georgina Pujol-Busquets, mitjançant el programa de nutrició i salut per a dones de comunitats pobres, està treballant amb dades d'activitat física i alimentació, integrant aspectes de gènere. 

Al FoodLab, en la línia de recerca en alimentació i activitat física, estem treballant també en aspectes de rendiment, esport i salut. Per exemple, l'investigador Xavi Santabàrbara, estudiant del doctorat de Salut i Psicologia, va parlar al taller dels suplements dietètics i el dopatge. 

M.S.: En l'actualitat, el GenTIC, a banda de treballar en el projecte sobre la COVID-19 i el gènere encapçalat per la Lídia Arroyo, té en marxa tres projectes europeus, un d'ells per a la promoció de plans d'igualtat en institucions d'educació superior i un altre sobre innovació en empreses d'economia social amb perspectiva de gènere. També treballem en la creació d'un sistema europeu de certificació sobre igualtat i gènere per a les entitats de recerca i en un pla estatal amb un conjunt d'estudis sobre intervencions per fomentar les vocacions científiques i tecnològiques en les noies. A més, tenim un projecte finançat per RecerCaixa sobre els mecanismes de prevenció de la violència de gènere a l'educació secundària. 

"Sports and Health Analytics Research with a Gender Perspective" (SHARP) is a Spanish network of researchers funded by the High Council of Sports (CSD) of the Spanish Ministry of Culture and Sport (Ref. 09/UPR/20)