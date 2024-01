Nuevos algoritmos para analizar el cumplimiento del RGPD

Más allá de los resultados del análisis, la importancia de la investigación está en los algoritmos utilizados para estudiar el cumplimiento de las leyes de privacidad en internet. El gran volumen de páginas y plataformas hace necesaria la automatización del proceso (estudiar cada caso de forma manual es imposible). Además, algunas de las técnicas de rastreo utilizadas son muy difíciles de detectar, ya que no existen marcadores claros que indiquen su presencia. Para solventar estos desafíos, los investigadores desarrollaron un método propio basado en cuatro algoritmos y un índice, el Websites Level of Confidence, con el que evaluar el estado del cumplimiento normativo.

"Nuestro método se basa en una combinación de automatización e inspección manual. Los algoritmos implementados navegan automáticamente por las páginas web analizadas y van tomando capturas de pantalla que después se inspeccionan manualmente", explica Cristina Pérez-Solà. "Además, para la detección de técnicas de rastreo también hacemos uso de una herramienta elaborada por el Supervisor Europeo de Protección de Datos llamada Website Evidence Collector. Esta herramienta está diseñada para hacer inspecciones de privacidad en sitios web y permite detectar el uso de cookies, web beacons (píxeles invisibles o balizas web) y herramientas de identificación de la huella del navegador".

Cada uno de los algoritmos utilizados por los investigadores tiene una función bien definida:

• El algoritmo del inspector de consentimiento (CIA, por sus siglas en inglés) captura imágenes claras de los báneres de cookies del sitio web e identifica los botones que deberían permitir a los usuarios personalizar el uso de estos elementos de rastreo.

• El Website Evidence Collector (WEC) recopila información sobre las diferentes técnicas de rastreo que se utilizan en cada página web.

• El algoritmo detector de cookies (CDA) categoriza, basándose en los datos recogidos por el WEC, las cookies que los sitios web utilizan en los navegadores sin el consentimiento del usuario.

• El algoritmo detector de web beacons (BDA) no solo extrae las balizas web o píxeles invisibles detectados por el WEC, sino que también identifica las técnicas de análisis de huellas digitales del navegador.

"Nuestro estudio se centra en analizar el cumplimiento del Reglamento General de Protección de datos por las páginas web más visitadas en España", añade Pérez-Solà. "Seleccionamos las 500 páginas más visitadas según el ranking Alexa y analizamos tanto el uso que hacen de estas técnicas de rastreo como la información que ofrecen sobre ellas a los usuarios y las alternativas de configuración que les proporcionan. Por último, combinamos los resultados de todo este análisis en un índice, el Websites Level of Confidence, que permite evaluar el estado actual del cumplimiento normativo".

"Conocer el detalle de las normativas que pueden aplicarse en cada momento y saber evaluar qué técnicas está usando una página web es una tarea que queda fuera del alcance de la mayoría de usuarios", concluye la investigadora. "El Websites Level of Confidence (WLoC) que proponemos permite a los usuarios conocer el estado de cumplimiento de las páginas web más populares y ver cómo este evoluciona en el tiempo sin necesidad de tener conocimientos legales o técnicos".

Esta investigación contribuye al objetivo de desarrollo sostenible (ODS) número 9, sobre la construcción de infraestructuras resilientes, la promoción de la industrialización sostenible y el fomento de la innovación.

David Martínez, Eusebi Calle, Albert Jové, Cristina Pérez-Solà, Web-tracking compliance: websites' level of confidence in the use of information-gathering technologies, Computers & Security, volumen 122, 2022, 102873, ISSN 0167-4048, https://doi.org/10.1016/j.cose.2022.102873.

