Investigació
Investigadors de la URV defensen les tècniques que mantenen les dades personals en l'anonimat
Els investigadors refusen, amb un article a la revista Science, un estudi publicat a la mateixa el gener del 2015
Actualment les dades personals són de gran utilitat en molts àmbits, tant de recerca com de negocis o de planificació. Per exemple, les dels pacients emmagatzemades en historials mèdics són fonamentals per fer recerca mèdica; les operacions bancàries són la base per fer anàlisis financers, i les transaccions comercials serveixen per millorar la personalització dels serveis que es presten. Aquesta informació la reben els investigadors de forma anònima perquè la puguin utilitzar sense comprometre la privadesa dels individus als quals fan referència les dades. Utilitzar mecanismes adequats d’anonimització és, per tant, essencial per garantir l’anonimat i evitar la reidentificació de les persones.En aquest sentit, els investigadors del grup de recerca CRISES-Càtedra UNESCO de privadesa de dades, del Departament d’Enginyeria Informàtica i Matemàtiques de la URV, i format per David Sánchez, SergioMartínez i Josep Domingo-Ferrer,mostren al seu treball publicat a Science que les persones a les quals fan referència les dades anonimitzades realment mantenen l’anonimat. Consideren que els mecanismes que existeixen per anonimitzar les dades personals són fiables i adequats, per tal que aquestes dades puguin utilitzar-se per fer recerca amb la garantia de que les persones a les quals corresponen no seran reidentificades.
Aquest article ha estat motivat per la publicació, també a la revista Science, al gener del 2015, d’'Unique in the shopping mall: on the reidentifiability of credit card metadata', un article elaborat per investigadors de l’Institut de Tecnologia de Massachusetts (MIT), de la Universitat d’Aarhus i de la Universitat Rutgers (Nova Jersey), en el qual criticaven els mètodes d’anonimització i qüestionaven la viabilitat de publicar informació personal per fer recerca. Asseguraven que es podien reidentificar els individus i comprometre’n la privadesa a partir de la combinació de valors d’atributs únics disponibles en una base de dades, tot i haver aplicat un mecanisme d’anonimització basat a generalitzar independentment els valors d’aquests atributs.
A partir d’aquests resultats, els investigadors del MIT, Aarhus i Rutgers van fer extensiva la ineficàcia del sistema que van utilitzar a tots els mecanismes d’anonimització, i van ignorar els treballs científics que s’han publicat a l’àrea de la protecció de dades al llarg dels darrers quaranta anys. Van concloure que els mecanismes existents estan obsolets i són inadequats, i van instar els dipositaris de les dades a no fer-les públiques, cosa que seria«catastròfica per a la recerca en molts àmbits», segons els investigadors de la URV.
Arran de la repercussió que va tenir aquest article, els investigadors de la URV, experts en privadesa de dades, han fet palès en la seva rèplica el desconeixement de l’estat de la tècnica en protecció de dades per part dels autors de l’article. Alhora, han criticat que els investigadors del MIT, Aarhus i Rutgers hagin considerat ineficaços tots els mètodes d’anonimització, a partir d’un mètode defectuós dissenyat pels mateixos autors.
Mètodes per evitar la reidentificació
Per defensar l’eficàcia dels mètodes d’anonimització de dades, els investigadors de la URV s’han basat en les recerques científiques sobre la matèria publicades en els darrers anys i, mitjançant un model d’anonimat anomenat k-anonymity i un mecanisme propi de protecció basat en microagregació de dades, han pogut eliminar qualsevol combinació de valors únics d’una base de dades −evitant així la reidentificació unívoca d’individus−, i han aconseguit també que les dades mantinguessin la seva utilitat analítica.
A més, han posat sobre la taula en el seu article altres escenaris més complexos i actuals, com l’anonimització de megadades (big data) i/o de dades que es generen dinàmicament, o l’anonimització controlada pels mateixos individus (anonimització col·laborativa o coútil). I han deixat clar que existeixen solucions capaces de garantir la privadesa en aquest escenaris, tot i que encara cal més recerca per millorar-ne l’eficiència.A les conclusions del seu article, els investigadors de la URV defensen de manera contundent que els dipositaris de la informació personal poden confiar en l’anonimització, cosa d’altra banda essencial perquè«aquestes dades són molt necessàries per fer recerca».