15/4/20 · Investigación

«Los macrodatos pueden ser una herramienta que ayude a predecir futuras pandemias, pero todavía existen retos por resolver»

Foto: Julián Salas

Foto: Julián Salas

Julián Salas Piñón , investigador mexicano del grupo K-riptography and Information Security for Open Networks (KISON) del Internet Interdisciplinary Institute (IN3) de la UOC

 

Hace diez años que el mexicano Julián Salas Piñón, tras estudiar Matemáticas en la Universidad Nacional Autónoma de México (UNAM), llegó a Cataluña para ampliar sus conocimientos. En el año 2012 se doctoró cum laude en Matemática Aplicada y ha trabajado en el Instituto de Investigación en Inteligencia Artificial del Consejo Superior de Investigaciones Científicas (IIIA-CSIC). En el año 2017 obtuvo una beca de la UOC para llevar a cabo un proyecto para proteger la privacidad de datos dinámicos como los que se generan a partir de los sitios web visitados, redes sociales o registros de compras. Actualmente es uno de los investigadores del grupo K-riptography and Information Security for Open Networks (KISON), del Internet Interdisciplinary Institute (IN3) de la Universitat Oberta de Catalunya (UOC), centrado en la seguridad y la privacidad de los usuarios en entornos abiertos. Se casó con una catalana y vive con un ojo puesto en la evolución del coronavirus en su país, al otro lado del Atlántico.

 

 

Hace diez años que el mexicano Julián Salas Piñón, tras estudiar Matemáticas en la Universidad Nacional Autónoma de México (UNAM), llegó a Cataluña para ampliar sus conocimientos. En el año 2012 se doctoró cum laude en Matemática Aplicada y ha trabajado en el Instituto de Investigación en Inteligencia Artificial del Consejo Superior de Investigaciones Científicas (IIIA-CSIC). En el año 2017 obtuvo una beca de la UOC para llevar a cabo un proyecto para proteger la privacidad de datos dinámicos como los que se generan a partir de los sitios web visitados, redes sociales o registros de compras. Actualmente es uno de los investigadores del grupo K-riptography and Information Security for Open Networks (KISON), del Internet Interdisciplinary Institute (IN3) de la Universitat Oberta de Catalunya (UOC), centrado en la seguridad y la privacidad de los usuarios en entornos abiertos. Se casó con una catalana y vive con un ojo puesto en la evolución del coronavirus en su país, al otro lado del Atlántico.

 

¿Cómo vive desde la distancia la pandemia en México? ¿Cree en la posibilidad de que allí haya un confinamiento como el de aquí o, por el contrario, piensa que la elevada densidad de habitantes y la pobreza de gran parte de la población de ciudades como Ciudad de México pueden hacerlo inviable?

En México están ahora en la fase en la que estábamos en España hace un mes, cuando la gente hacía una vida relativamente normal. Las universidades y las escuelas cerraron a mediados de marzo, pero el problema allí es que un porcentaje elevado de la población no tiene un trabajo reglado. Habrá que ver qué hará el Estado para garantizar que la gente que se quedará sin trabajo, como el gran número de personas que venden comida en la calle, puedan subsistir unos meses. En el fondo es un problema económico: el dilema es cómo se puede detener la pandemia y minimizar el coste para la economía.

En una situación de crisis sanitaria como la actual, herramientas como los macrodatos (big data) permiten a la Administración obtener información muy sectorizada sobre la enfermedad, pero también implican poner en sus manos muchos datos privados. ¿Los macrodatos garantizan la privacidad de los pacientes al 100 %?

Precisamente mi área de investigación sobre la privacidad tiene una dificultad: por un lado, la tecnología nos permite obtener cada vez más datos y, cuantos más datos obtengamos y más precisos sean, mejor funcionarán los algoritmos. Pero la privacidad va un poco en contra de este proceso. Si tienes datos muy precisos y lo sabes todo de una persona, ¿entonces dónde queda su derecho a la privacidad? La cuestión es saber usar los datos para la finalidad que nos interesa sin la necesidad de querer saber más de lo que necesitamos.

¿Se puede encontrar este equilibrio?

Sí. Por ejemplo, si quieres monitorizar la movilidad en una ciudad y saber cuánta gente se desplaza de un lugar a otro, no necesitamos saber todos los lugares en los que ha estado aquel vehículo antes de llegar al destino final. Basta con saber el punto de origen y el destino final. Uno de los últimos estudios que hemos llevado a cabo en la UOC consistía en obtener mapas de movilidad de personas sin tener las trayectorias individuales, porque estas trayectorias te pueden reidentificar.

¿Nuestro derecho a la protección de los datos personales puede ser un obstáculo ahora en la lucha contra el coronavirus?

A mí me parece que no, pero tal vez tendremos que esforzarnos más para poder utilizar los datos. Es decir, tendremos que aplicar algoritmos para anonimizarlos (es decir, para eliminar la posibilidad de identificar a la persona titular de los datos) antes de utilizarlos.

En China, los macrodatos han permitido implementar un sistema de control de la propagación del coronavirus, pero este sistema genera dudas sobre la violación de la privacidad. Una aplicación que puede descargarse mediante programas como WeChat, la red social más grande de China, permite que una base de datos central recopile datos sobre el movimiento y el diagnóstico de los ciudadanos y les otorga un código verde, que les permite circular libremente; naranja, que significa que tienen restringida la circulación en el ámbito local, o rojo, que les obliga a seguir la cuarentena. Esta aplicación hace una recopilación centralizada de las redes de contacto en tiempo real de los usuarios a partir de tres aspectos: la proximidad entre teléfonos móviles, la ubicación por GPS y el escaneo de códigos QR en la entrada y la salida de los edificios. Esta base de datos es analizada por un algoritmo de inteligencia artificial que genera los tres colores.

¿Sería viable hacer en España lo que han hecho en China?

En principio, si das tu consentimiento, se pueden recoger este tipo de datos. Otra cosa es si hay que saber la localización de todos en todo momento. Un buen ejemplo de protección de la privacidad es la aplicación TraceTogether de Singapur, que detecta qué usuarios han estado cerca y guarda estos datos durante 21 días en el móvil del usuario, que solo los debe revelar si da positivo en coronavirus. De este modo, tan solo recoge la información necesaria durante el tiempo necesario y la revela solo cuando es imprescindible.

Una empresa emergente (start-up) canadiense detectó el brote de la COVID-19 antes de que la Organización Mundial de la Salud (OMS) lo hiciera público oficialmente. ¿La inteligencia artificial es una gran herramienta para anticiparnos a futuras nuevas epidemias? ¿Nos puede ayudar a prever tratamientos eficaces?

Mediante la inteligencia artificial aprovechamos las capacidades de los ordenadores para procesar enormes cantidades de datos y hacer modelos predictivos muy precisos. Los macrodatos pueden ser una herramienta para el bien común, pero todavía hay muchos retos por resolver, tales como garantizar los intereses de las empresas propietarias de los datos y al mismo tiempo hacer que los algoritmos sean transparentes y explicables.

La Generalitat de Cataluña ha puesto en marcha una aplicación para ver dónde se concentran mayoritariamente los enfermos de coronavirus. ¿Los ciudadanos tenemos alguna garantía de que estos datos que hemos proporcionado no se usarán para otros fines?

Eso es lo que me pregunto yo también. Por ejemplo, cuando el Instituto Nacional de Estadística (INE) comenzó a hacer el estudio de rastreo de teléfonos móviles de millones de personas en España para saber cómo se movían, parecía que utilizarían todas las localizaciones de los usuarios con cierta imprecisión, pero con esta información podemos saber potencialmente de quién estamos hablando. No es necesario que tengamos todos los datos de alguien para poder reidentificarlo. Mucha gente piensa que los datos son anónimos porque no tienen ni nombres ni apellidos, pero lo que realmente debería significar ser anónimo es que no se te pudiera reidentificar.

Este estudio del INE a partir del rastreo de los teléfonos móviles generó muchas dudas y quejas respecto a la privacidad. ¿Eran dudas con fundamento?

La máxima privacidad es no recoger datos y la máxima utilidad es tener los datos de todos en todo momento. La cuestión es encontrar el equilibrio entre estos dos extremos. Nosotros intentamos desarrollar algoritmos en diferentes situaciones que nos puedan dar más garantías de privacidad y seguridad.

En el caso del INE, las operadoras telefónicas calcularon las matrices de origen y de destino, en las que las entradas representan cuántas personas se desplazan de la zona A la zona B habitualmente durante una semana, y dieron únicamente estos resultados. En este caso, el problema fue que en ese momento no se hizo pública la metodología que habían utilizado para proteger los datos. Los artículos de los periódicos no contaban exactamente a qué datos tendría acceso el INE ni cómo se habían protegido.

¿Los ciudadanos podemos estar seguros de que los datos que proporcionamos cuando, por ejemplo, nos registramos en un sitio web son anónimos?

Todo el mundo debería conocer esta historia: Una estudiante del Instituto de Tecnología de Massachusetts (MIT) logró identificar el registro médico del gobernador mediante tres parámetros: el código postal, el sexo y la fecha de nacimiento, a partir de una lista de registros que él mismo hizo pública porque pensaba que los datos eran anónimos porque no aparecían nombres ni apellidos. También ha habido ataques de reidentificaciones a partir de evaluaciones de películas de Netflix y datos geolocalizados de taxistas en Nueva York.

¿Podemos evitar ser reidentificados, es decir, que nos pongan nombres y apellidos, a partir del análisis de bases de datos supuestamente anónimos?

Hay algoritmos que lo intentan proteger. Ahora bien, debemos ser conscientes de que esto tiene unos costes, en el sentido de que la protección de la privacidad nos hace perder precisión. Lo que ganas por un lado lo pierdes por otro. Pero me parece que tenemos que cambiar la perspectiva: es deseable obtener la máxima precisión posible, respetando siempre el derecho a la privacidad.

¿Cree que los ciudadanos somos conscientes de que dejar nuestros datos tiene un precio? ¿De que registrarse en un sitio web implica que regalas información que luego se utilizará para hacer negocios?

No. Deberíamos ser conscientes de todos los datos que generamos con el ordenador, Facebook, Twitter, etc., de cómo se pueden utilizar y quién puede tener acceso. Puesto que muchas de estas acciones las hacemos en casa, tenemos la sensación de que lo que explicamos es privado, pero deberíamos saber dónde va a parar toda esta información y quién puede tener acceso. Cuando interactuamos con una página web o usamos las redes sociales, todo lo que hacemos queda almacenado. Ya me gustaría saber qué empresas tienen datos míos y qué modelos han hecho con estos datos. En Europa, con el Reglamento General de Protección de Datos, podemos pedir a las empresas qué datos nuestros tienen. Pero claro, no te lo dirán si no lo preguntas.

¿Qué riesgos supone revelar nuestras ubicaciones?

Por ejemplo, con el GPS del móvil, podemos saber dónde vive una persona, donde está en cada momento del día, a qué hora sale de casa, dónde trabaja, qué intereses tiene, si ha pasado una época en la que ha tenido que ir con frecuencia en el hospital... Hay aplicaciones de móvil que te piden la ubicación. Entonces, todo el mundo que tiene esta ubicación tiene la posibilidad de saber qué haces en cada momento.

Estamos vigilados por todos lados. Todo esto da un poco de miedo...

Yo estoy a favor de los macrodatos, pero debe haber un límite: la privacidad de los usuarios. Las empresas que recogen datos deberían ser transparentes y explicar para qué las usan; debería ser posible auditar los algoritmos con los que las han protegido y nos deberían informar cuando nuestros datos han sido incluidos en una base de datos.

¿Cuál es el principal reto tecnológico para vosotros, los expertos que trabajáis en la anonimización de datos?

En el mundo hay cada vez más sensores, como los de los móviles o el internet de las cosas, y eso hace que cada vez sea más difícil mantener la privacidad. Nuestro reto, precisamente, es encontrar un equilibrio en el que se respete nuestro derecho a la privacidad con la utilidad de los datos. El otro reto es generar conciencia entre la gente...

Contacto de prensa

También te puede interesar

Más leídos

Ver más sobre Investigación