Ir al contenido principal

Gestión de datos de investigación

Esta guía te introducirá en los conceptos relevantes sobre los datos de investigación y cómo gestionarlos. Podrás encontrar una serie de recursos y herramientas útiles

Datos sensibles / anomización

Los datos personales se refieren simplemente a los registros u otra información que, por sí sola o vinculada con otros datos, puede revelar la identidad de una persona viva. Así, por ejemplo, puede utilizar números en lugar de nombres como identificadores en una encuesta, pero si mantiene otro registro vinculando esos números a los nombres reales, se considera que cada registro contiene información personal.

Son considerados “Datos personales” datos como teléfono, edad, dirección personal o laboral, colegios o establecimientos educacionales a los que asistió una persona, entre otros.

Los datos personales "sensibles" incluyen los datos personales combinados con cualquiera de los siguientes datos:

  • El origen racial o étnico de los interesados.
  • Sus opiniones políticas.
  • Sus creencias religiosas u otras creencias de naturaleza similar.
  • Si son miembros de sindicatos o asociaciones gremiales.
  • Su salud, estado físico o mental.
  • Su vida sexual.
  • La comisión o presunta comisión de cualquier delito.
  • Cualquier proceso judicial, por cualquier delito cometido o presuntamente cometido, la disposición de tales procesos judiciales o la sentencia de cualquier tribunal en tales procesos.

Así, determinados identificadores de información personal debe ser tratados a través de las técnicas de seudonimización o anonimización. Este tipo de información personal se puede dividir en identificadores directos, indirectos y geográficos:

Los datos sensibles pueden ser FAIR, puesto que estos principios no exigen el acceso abierto a los datos. Sin embargo, de acuerdo a sus recomendaciones, se considera importante publicar, al menos, los metadatos para que los datos confidenciales tengan la posibilidad de ser encontrados y citados, aunque los datos propiamente como tales no sean accesibles. Así también, estos registros de metadatos pueden incluir las características y condiciones específicas de acceso a los datos en los casos particulares.

El tratamiento y gestión de los datos sensibles es altamente recomendado para mitigar los riesgos que conlleva la obtención y tratamiento de datos masivos de carácter personal. Consiste en un proceso que permite identificar y ocultar la información sensible, permitiendo su divulgación sin que ello implique vulnerar los derechos de protección de datos de las personas y organizaciones que se puedan referenciar en los mismos.

 

El proceso de anonimización consiste en eliminar o reducir el mínimo los riesgos de re-identificación de los datos anonimizados, manteniendo la veracidad de los resultados del tratamiento de los mismos....

 

Objetivos de la anonimización:

  • Poder compartir esos datos sin comprometer la privacidad de las personas usuarias.
  • Proteger la privacidad de las personas usuarias de forma tal que no puedan: 1) ser reconocidos, 2) hacer inferencias sobre personas específicas

Será necesario anonimizar o seudonimizar cuando: 

  • Se quiera compartir o ceder datos a destinatarios con los que no se ha firmado un acuerdo de confidencialidad 
  • Se quiera publicar datos abiertamente 
  • La reducción de la calidad de la información sea aceptable y no afecte al uso de los datos 

Flujo general para la anonimización de datos 

Fuente: Guía básica de anonimización, traducida por la Agencia Española de Protección de Datos (AEPD): https://lnkd.in/exU4RmpR

Procedimientos para anonimizar los datos

 

Transformación de los datos que constituyan algún tipo de identificador que permitiera identificar al sujeto (suprimirlos, sustituirlos, distorsionarlos, generalizarlos o agregarlos sin que esto afecte al posterior uso de la información)

  • Remover identificadores directos. Ej.: Nombre, DNI, Número de la seguridad social, etc.
  • Remover combinaciones infrecuentes de cuasi identificadores. Ej.: combinaciones únicas de fechas y códigos postales
  • Combinaciones infrecuentes se eliminan a través de la generalización. Ej.: fecha de nacimiento 14/01/1977 se convertiría en **/**/1977

 

                            Dataset ficticio creado para prácticas.

 

OpenAir recomienda la utilización de la herramienta Amnesia de anonimización de datos, que permite borrar de los datos toda aquella información identificativa (nombres, código postal, fechas de nacimiento...). 

Si quieres profundizar más te dejamos esta guía y su herramienta asociada para anonimizar datos:

 

Guía de anonimización de datos de investigación

Síguenos en:

Licencia Creative Commons
Biblioteca/CRAI de la Universidad Pablo de Olavide Licencia Creative Commons Atribución-NoComercial-CompartirIgual 4.0 Internacional.