Investigadores de la URV defienden la eficacia de las técnicas que mantienen los datos personales en el anonimato
Los investigadores rehúsan, con un artículo en la revista Science, un estudio publicado en la misma en enero del 2015
Actualmente los datos personales son de gran utilidad en muchos ámbitos, tanto de investigacióncomo de negocios o de planificación. Por ejemplo, las de los pacientes almacenadas en historiales médicos son fundamentales para hacer investigaciónmédica; las operaciones bancarias son la base para hacer análisis financieros, y las transacciones comerciales sirven para mejorar la personalización de los servicios que se prestan. Esta información la reciben los investigadores de forma anónima para que la puedan utilizar sin comprometer la privacidad de los individuos a los cuales hacen referencia los datos. Utilizar mecanismos adecuados de anonimització es, por lo tanto, esencial para garantizar el anonimato y evitar la reidentificación de las personas. En este sentido, los investigadores del grupo de investigaciónCRISES-Cátedra UNESCO de privacidad de datos, del Departamento de Ingeniería Informática y Matemáticas de la URV, y formado por David Sánchez, Sergio Martínez y Josep Domingo-Ferrer, muestran a su trabajo publicado en Science que las personas a las cuales hacen referencia los datos anonimizados realmente mantienen el anonimato. Consideran que los mecanismos que existen para anonimizar los datos personales son fiables y adecuados, a fin de que estos datos puedan utilizarse para hacer investigación|búsqueda con la garantía de que las personas a las cuales corresponden no serán reidentificadas.
Este artículo ha sido motivado por la publicación, también en la revista Science, en enero del 2015, de 'Unique in the shopping mall: on the reidentifiability of credit card metadata', un artículo elaborado por investigadores del Instituto de Tecnología de Massachusetts (MIT), de la Universidad de Aarhus y de la Universidad Rutgers (Nueva Jersey), en el cual criticaban los métodos de anonimització y cuestionaban la viabilidad de publicar información personal para hacer investigación|búsqueda. Aseguraban que se podían reidentificar los individuos y comprometer la privacidad a partir de la combinación de valores de atributos únicos disponibles en una base de datos, a pesar de haber aplicado un mecanismo de anonimització basado a generalizar independientemente los valores de estos atributos.
A partir de estos resultados, los investigadores del MIT, Aarhus y Rutgers hicieron extensiva la ineficacia del sistema que utilizaron en todos los mecanismos de anonimització, e ignoraron los trabajos científicos que se han publicado en el área de la protección de datos a lo largo de los últimos cuarenta años. Concluyeron que los mecanismos existentes están obsoletos y son inadecuados, e instaron a los depositarios de los datos a no hacerlas públicas, cosa que sería «catastrófica para la investigación|búsqueda en muchos ámbitos», según los investigadores de la URV.
A raíz de la repercusión que tuvo este artículo, los investigadores de la URV, expertos en privacidad de datos, han hecho patentes en su réplica el desconocimiento del estado de la técnica en protección de datos por parte de los autores del artículo. Al mismo tiempo, han criticado que los investigadores del MIT, Aarhus y Rutgers hayan considerado ineficaces todos los métodos de anonimització, a partir de un método defectuoso diseñado por los mismos autores.
Métodos para evitar la reidentificación
Para defender la eficacia de los métodos de anonimització de datos, los investigadores de la URV se han basado en las investigaciones|búsquedas científicas sobre la materia publicadas en los últimos años y, mediante un modelo de anonimato denominado k-anonymity y un mecanismo propio de protección basado en microagregación de datos, han podido eliminar cualquier combinación de valores únicos de una base de datos −evitant así la reidentificación unívoca d'individus−, y han conseguido también que los datos mantuvieran su utilidad analítica.
Además, han puesto sobre la mesa en su artículo otros escenarios más complejos y actuales, como el anonimització de megadatos (big fecha) y/o de datos que se generan dinámicamente, o la anonimització controlada por los mismos individuos (anonimització colaborativa o coútil). Y han dejado claro que existen soluciones capaces de garantizar la privacidad en este escenarios, aunque todavía hace falta más investigaciónpara mejorar la eficiencia. A las conclusiones de su artículo, los investigadores de la URV defienden de manera contundente que los depositarios de la información personal pueden confiar en el anonimització, porque «estos datos son muy necesarios para hacer investigación».