James Thew - Fotolia

Resolver Problemas Consiga ayuda para problemas específicos con sus proyectos, procesos y tecnologías.

La información de alta dimensionalidad complica las técnicas de anonimato de datos

Las técnicas de anonimato de datos están diseñadas para preservar la privacidad de los datos compartidos, pero, ¿funcionan con datos de alta dimensionalidad? Esto es lo que los expertos tienen que decir.

La privacidad es una especie en peligro de extinción en este mundo abundante de datos. Si bien es fundamental que las organizaciones aprovechen los datos para obtener conocimientos, predecir tendencias e impulsar la innovación, la información personal sensible se pone a menudo en peligro.

Para habilitar casos de uso como el análisis de datos y el intercambio de datos de manera confidencial, las organizaciones recurren a técnicas de anonimato de datos.

"El anonimato de los datos es un proceso de dos pasos: seudonimización y desidentificación", dijo Yves-Alexandre de Montjoye, científico investigador del MIT Media Lab, que se unirá al Imperial College como conferenciante. "La idea, si es que funciona, es tomar datos confidenciales como el teléfono móvil y los datos médicos, y eliminar cualquier información que pueda vincularlos de nuevo a un individuo. Luego, podemos utilizarlos en la investigación, por ejemplo, sin poner en peligro la privacidad de la gente".

La mayoría de las técnicas de anonimato de datos se basan en dos tipos de identificadores: directos e indirectos, dijo Montjoye. El proceso de eliminar identificadores directos como nombres, direcciones de calle, números de teléfono –cualquier información que permita directamente el rastreo de datos a una determinada persona– se denomina seudonimización.

La seudonimización de los datos se logra ya sea eliminando los identificadores o reemplazándolos con una identificación aleatoria o procesándolos con un salt (una cadena de datos aleatoria utilizada para modificar el hash de una contraseña), dijo Montjoye.

Yves-Alexandre De Montjoye

El principal beneficio del anonimato de datos es que permite a las organizaciones obtener más uso de los datos, dijo el analista de Gartner, Ramon Krikken.

"Las técnicas de anonimización de datos permiten a las organizaciones modificar los datos de tal manera que la privacidad de las personas dentro del conjunto de datos permanece protegida al menos de alguna manera", dijo Krikken.

Pero, en la era de los grandes datos, las técnicas de anonimato de datos fallan porque hay cientos de miles de puntos de datos para un solo individuo, dijo Montjoye.

Como evidencia, Montjoye señaló a la investigación que llevó a cabo con sus colegas en el MIT, que mostró cómo se requiere solo cuatro piezas de información para identificar al 90% de las personas en un conjunto de datos que contienen transacciones de tarjetas de crédito de más de un millón de usuarios.

"Tomar los datos y seudonimizarlos, eliminar los identificadores directos y tratar de añadir ruido o hacer otras cosas para evitar la reidentificación, básicamente no funciona más cuando los datos se vuelven de alta dimensión", dijo Montjoye.

No se puede lograr el cien por ciento de desidentificación, reforzó Krikken, porque siempre existe la posibilidad de que ciertos ítems dentro de esos datos sean identificados.

Sin embargo, la conservación del anonimato en grandes conjuntos de datos debería ser de suma importancia para las organizaciones, ya que la reidentificación de los datos podría afectar su marca y crear consecuencias legales, dijo Krikken.

La organización es responsable de la gestión de datos y el anonimato, a menos que de alguna manera la responsabilidad se pase al proveedor de anonimato, dijo John Isaza, jefe de gobernanza de la información y la práctica de gestión de registros en la firma de abogados Rimon P.C., en una entrevista por correo electrónico.

"Incluso entonces, la organización sería la que se enfrenta a la exposición de relaciones públicas, que en algunos aspectos podría ser más costosa que el costo de una violación", dijo Isaza. “Según el nuevo Reglamento General de Protección de Datos que sale en Europa, la organización podría enfrentar una sanción de hasta un 4% de sus ingresos globales brutos anuales en caso de incumplimiento o mala gestión de los datos”.

Con las técnicas de anonimato de datos fallando en escalar, ¿cuál es la alternativa?

La solución radica en la investigación en ciencia informática, dijo Montjoye.

Actualmente, él está asociado con un proyecto llamado OPAL, que se centra en la construcción de infraestructura asegurada que permitirá el uso de datos, mientras da a las personas fuertes garantías de que los datos se utilizan de una manera respetuosa con la privacidad.

"La forma en que lo hacemos es asegurarnos de que controlamos automáticamente cómo se usan los datos, qué sale del entorno seguro, y cómo se está agregando, asegurando que los datos se utilizan de forma anónima, incluso si los datos en sí no son anónimos”, dijo Montjoye. .

Próximos pasos

Quizás le interese:

La seguridad y privacidad de datos de IoT empieza ahora por los CIO y los educadores

Brasil prepara reforma para proteger la privacidad y seguridad de los datos

La privacidad y la seguridad móvil no son lo mismo

Guía para el cumplimiento y la privacidad de los datos

Este artículo se actualizó por última vez en abril 2017

Profundice más

PRO+

Contenido

Encuentre más contenido PRO+ y otras ofertas exclusivas para miembros, aquí.

Inicie la conversación

Envíenme notificaciones cuando otros miembros comenten sobre este artículo.

Enviando esta solicitud usted acepta recibir correos electrónicos de TechTarget y sus socios. Si usted reside afuera de Estados Unidos, esta dando autorización para que transfiramos y procesemos su información personal en Estados Unidos.Privacidad

Por favor cree un Nombre de usuario para poder comentar.

- ANUNCIOS POR GOOGLE

Close