Se analiza la K-anonimidad

Recomendaciones de AEPD para realizar procesos de anonimización

Noticia

La Agencia Española de Protección de Datos (AEPD) ha publicado una nota técnica llamada La K-Anonimidad como medida de la privacidad, un documento orientado a organizaciones que aborden procesos de anonimización sobre conjuntos de datos. La nota tiene como objetivo mostrar cuáles son los límites en la efectividad de esos procesos de anonimización, hasta qué punto la información está realmente anonimizada y cómo se puede gestionar el riesgo de reidentificación.

Anominización

El tratamiento masivo de datos mediante el uso de técnicas basadas en big data, inteligencia artificial o machine learning obliga a la implementación de garantías o mecanismos para preservar la privacidad y el derecho a la protección de datos personales, entre ellas las basadas en la anonimización. En una realidad en la que las fuentes de las que proceden los datos, pese a ser independientes, se interconectan, existe la posibilidad de crear un rastro electrónico de las personas, incluso habiendo eliminado los datos que explícitamente les identifican.

Si bien el objetivo de los procesos de anonimización es preservar la privacidad de las personas cuyos datos son objeto de tratamiento, los datos, convenientemente agrupados y cruzados con otras fuentes de información, pueden utilizarse para identificarlas e incluso establecer relaciones con categorías especiales de datos asociadas a estas. Existe un riesgo de que, una vez que se ha anonimizado un conjunto de datos, se pueda revertir esa anonimización, reidentificando a la persona.

Para realizar esta gestión de riesgos, la nota técnica analiza la K-anonimidad, una técnica utilizada cuando se tratan grandes grupos de datos y que, entre otros aspectos, permite estudiar el grado de identificación que podría existir en ese conjunto de datos supuestamente anónimo. En consecuencia, permite cuantificar hasta qué punto se preserva el anonimato de los sujetos presentes en un conjunto de datos en el que se han eliminado los identificadores.

En aplicación del principio de responsabilidad proactiva establecido en el Reglamento General de Protección de Datos (RGPD), la Agencia recuerda que el responsable debe analizar los riesgos en los tratamientos de datos, en este caso, los de reidentificación derivado de sus procesos de anonimización, y los generados en el proceso posterior y en el enriquecimiento de conjuntos de datos. Las medidas de Privacidad por Defecto y desde el Diseño seleccionadas deben implementarse mediante procesos formales que permitan la gestión de dichos riesgos.