Un projecte de la UOC facilita l'aprofitament social de les dades obertes gràcies als bots de conversa

  persona amb el mòbil

La iniciativa ajudarà a rendibilitzar les inversions en dades obertes que han fet tota mena d'organitzacions (foto: Pradamas Gifarry / unsplash.com)

15/12/2021
Santiago Campillo

El projecte BODI vol acabar amb la paradoxa que, per bé que cada vegada hi ha més dades obertes, falta infraestructura perquè la població pugui aprofitar-les


Els bots de conversa i bots de veu fan servir interfícies senzilles, basades en la conversa natural i l'aprenentatge automàtic, per facilitar l'accés ciutadà a dades de fonts que aposten per les dades obertes

Desenvolupar una plataforma que obri l'accés "de conversa" a les fonts de dades obertes és l'objectiu d'un nou projecte de recerca tecnològica de la Universitat Oberta de Catalunya (UOC). Amb el títol "Bots per interactuar amb dades obertes - Interfícies conversacionals per facilitar l'accés a les dades públiques" (BODI), la iniciativa —finançada pel Ministeri de Ciència i Innovació i pel programa Next Generation de la UE— desenvolupa el paper dels chatbots, o bots de conversa, per a la gestió de grans fonts obertes de dades i per impulsar així el seu impacte social en aplicacions relacionades amb la transparència de governs o amb l'empoderament ciutadà

 

Què és un bot de conversa?


Com a bot de conversa, o chatbot en anglès, es coneixen certes aplicacions capaces de mantenir una conversa amb una persona en el moment de proveir respostes automàtiques més o menys complexes a les peticions d'un usuari. Aquestes respostes les estableixen prèviament un conjunt d'experts que preveuen certes preguntes concretes a les quals el bot ha de ser capaç de respondre. Amb l'avenç de la tecnologia, la capacitat de respondre d'aquests bots de conversa, i fins i tot d'aprendre preguntes no predefinides, ha suposat un avenç molt significatiu.

Un exemple clar de la seva utilitat el podem trobar a Xatkit, una empresa derivada de la UOC que ofereix bots prèviament entrenats per al comerç electrònic. Un cop instal·lats a les botigues, llegeixen els productes que es venen i es configuren automàticament per començar a ajudar els clients. "A més, estan preparats per continuar aprenent els canvis de la botiga i dels productes tots sols", indica Jordi Cabot, impulsor d'aquesta empresa derivada i coordinador del projecte BODI, a més d'investigador de la Institució Catalana de Recerca i Estudis Avançats (ICREA) i líder del grup Systems, Software and Models Research Lab (SOM Research Lab), de l'Internet Interdisciplinary Institute (IN3) de la UOC.

De forma semblant, BODI utilitzarà bots de conversa com a mecanisme de consulta, que utilitzaran solucions basades en dades obertes, amb la generació automàtica d'una interfície senzilla i familiar per a l'usuari. "Aquestes contribucions tècniques tindran un impacte molt positiu en l'àmbit social i econòmic", comenta Cabot.

"En primer lloc, ajudarà els ciutadans a millorar la seva presa de decisions, gràcies a la seva capacitat d'accés independent a les dades. També millorarà el retorn de la inversió dels projectes de les dades obertes de tota mena d'institucions i organismes oficials, gràcies a l'augment de la seva difusió i explotació. A més, permetrà desenvolupar projectes privats dedicats a la curació i publicació de dades obertes addicionals, gràcies a la reducció de costos en la seva publicació i ús", afegeix l'investigador.

 

Democratització de la informació


Cada dia es publiquen més dades obertes, tant per part del sector públic com de fonts privades. Per exemple, el portal oficial de dades europees registra actualment més d'un milió de conjunts de dades: informació de connexions, fluxos de dades meteorològiques, registres, números de contacte, informació sobre el trànsit, etc.

El moviment de dades obertes està destinat a posar a l'abast de la ciutadania la quantitat màxima d'informació per a infinitat d'usos, des de planificar un viatge fins a supervisar les accions d'un govern. Tot i que ja s'han fet passos importants en aquest sentit, el problema de treballar amb aquests grans conjunts de dades és que no sempre hi ha la infraestructura tecnològica necessària per poder-les gestionar. Aquesta realitat genera una paradoxa: les dades estan cada vegada més disponibles, però no hi ha eines adequades per gestionar-les. 

De moment, només qui disposa d'habilitats tècniques i formació especialitzada és capaç d'aprofitar fonts de dades heterogènies, mentre que la majoria de la població es veu obligada a dependre d'aplicacions o empreses de tercers, amb la qual cosa es desaprofita molta part de l'esperit de les dades obertes. "BODI pretén canviar aquesta situació: el nostre objectiu és capacitar la ciutadania perquè exploti les dades obertes i se'n beneficiï. En eliminar la barrera tècnica d'accés a les dades, el nostre projecte amplia l'oportunitat econòmica de les dades obertes i n'augmenta el valor net", explica l'investigador.

Per assolir aquest objectiu ambiciós, el projecte proposa aprofitar els últims avenços tecnològics en interfícies conversacionals, és a dir, a més dels bots de conversa, els bots de veu, que fan servir una interfície basada en la conversa oral perquè la ciutadania pugui fer qualsevol pregunta en llenguatge natural.

"La plataforma BODI processarà les preguntes i les descompondrà en un conjunt de sol·licituds tècniques que beuran de les fonts de dades obertes a través de les API o d'altres fonts disponibles", concreta Jordi Cabot. "Al final del procés, la tecnologia recopilarà les dades i respondrà l'usuari, també en un llenguatge senzill i natural, la qual cosa garantirà una comunicació fluida", afegeix. D'aquesta manera, es basteix un pont natural entre els usuaris i les vastes fonts de dades —inaccessibles fins al moment, a pesar de les bones intencions—, la qual cosa permetrà una veritable democratització de l'ús de la informació.

 

Una aposta decidida per la filosofia de dades obertes


"Les eines creades pel projecte estaran disponibles com a programari lliure", assegura l'investigador. "Es faran plantilles i exemples de projectes, derivats dels pilots, per facilitar l'adopció de les tecnologies de BODI per part de tota mena de companyies i institucions interessades a aplicar-les als seus propis conjunts de dades", relata. Segons confirma Cabot, s'espera que la plataforma arribi a un nivell de maduresa que permeti la seva aplicació immediata en projectes industrials al final del projecte.

"Un dels objectius de BODI és assegurar la transferència de tecnologia dels seus resultats a l'administració pública i al teixit empresarial. Per fer-ho, es treballarà en una estratègia de comercialització i explotació dels resultats del projecte que contribueixi a garantir la seva continuïtat i sostenibilitat futures", prossegueix. "Es publicaran tots els resultats, així com la part de la plataforma de codi obert, la qual cosa oferirà de forma gratuïta la infraestructura tècnica necessària per tenir converses sobre dades obertes. A més, per maximitzar l'abast, també definirem una estratègia que faciliti solucions personalitzades a empreses i institucions", indica.

Aquesta filosofia, que aposta per compartir en obert, ofereix un benefici social destacat. "Els resultats d'aquest projecte tindran un gran impacte, atès que faciliten a la població l'accés sense restriccions a enormes quantitats de dades obertes disponibles en línia, a fi d'ajudar-la en la presa de decisions quotidianes", explica. "En el sector públic, la millora de l'accés a les dades obertes impulsarà l'èxit d'iniciatives de governabilitat oberta. I, en el sector privat, l'aprofitament de les dades obertes ajudarà tota mena de negocis i enfortirà els seus mercats i la relació amb les seves clienteles", relata Jordi Cabot.

"Creiem que els bots de conversa són la interfície perfecta per a les dades obertes", continua. "Pel fet de ser una interfície conversacional per definició, no imposen cap classe de barrera d'entrada que exclogui part de la població. Són el complement perfecte per oferir a la ciutadania recursos més complets gràcies a l'accés a les dades", conclou.

 

Projecte PDC2021-121404-I00 finançat per:

 

El projecte Xatkit: Massive generation of chatbots on-demand, referència 2019 INNOV 00001, té el suport de la Secretaria d'Universitats i Recerca del Departament d'empresa i Coneixement de la Generalitat de Catalunya i ha estat cofinançat per la Unió Europea a través del Fons Europeu de Desenvolupament Regional (FEDER).

 

Xatkit ha estat el projecte guanyador del premi del jurat de l'SpinUOC 2021, el programa anual per a l'emprenedoria, la innovació i la transferència de coneixement de la UOC, impulsat per mitjà de la plataforma Hubbik.

 

Aquest projecte afavoreix l'objectiu de desenvolupament sostenible (ODS) 9, construir infraestructures resilients, promoure la industrialització sostenible i fomentar la innovació.

 

UOC R&I

La recerca i innovació (R+I) de la UOC contribueix a solucionar els reptes a què s'enfronten les societats globals del segle xxi, mitjançant l'estudi de la interacció entre la tecnologia i les ciències humanes i socials, amb un focus específic en la societat xarxa, l'aprenentatge en línia i la salut digital. Els més de 500 investigadors i investigadores i els 52 grups de recerca s'articulen entorn dels set estudis de la UOC i dos centres de recerca: l'Internet Interdisciplinary Institute (IN3) i l'eHealth Center (eHC).

A més, la Universitat impulsa la innovació en l'aprenentatge digital a través de l'eLearn Center (eLC) i la transferència de coneixement i l'emprenedoria de la comunitat UOC amb la plataforma Hubbik.

Els objectius de l'Agenda 2030 de desenvolupament sostenible de les Nacions Unides i el coneixement obert són eixos estratègics de la docència, la recerca i la innovació de la UOC.

Més informació: research.uoc.edu #25anysUOC

Experts UOC

Foto del professor Jordi Cabot

Jordi Cabot Sagrera

Professor d'Investigació ICREA

Expert/a en: Tot tipus de tècniques per a l'anàlisi, disseny i implementació de software amb la millor qualitat i productivitat possible. Inclou temes com la manipulació de dades obertes, l'estudi dels projectes de programari lliure, la generació automàtica de codi.

Àmbit de coneixement: Enginyeria del programari.

Veure fitxa

Enllaços relacionats