Skip to Main Content
Parece que está usando Internet Explorer 11 o una versión anterior. Este sitio web funciona mejor con navegadores modernos como las últimas versiones de Chrome, Firefox, Safari y Edge. Si continúa con este navegador, es posible que vea resultados inespera

Gestión de datos de investigación

Esta guía te introducirá en los conceptos relevantes sobre los datos de investigación y cómo gestionarlos(qué son, cómo procesarlos y compartirlos, cómo crear un Plan de Gestión de datos de investigación, etc). Y te proporcionará una serie de recursos y h

Datos sensibles / anomización

Los datos personales se refieren simplemente a los registros u otra información que por sí sola o vinculada con otros datos, puede revelar la identidad de una persona viva. Así, por ejemplo, puede utilizar números en lugar de nombres como identificadores en una encuesta, pero si mantiene otro registro vinculando esos números a los nombres reales, se considera que cada registro contiene información personal.

Son considerados “Datos personales” datos como teléfono, edad , dirección personal o laboral, colegios o establecimientos educacionales a los que asistió una persona, entre otros.

Los datos personales "sensibles" incluyen los datos personales combinados con cualquiera de los siguientes otros datos:

  • El origen racial o étnico de los interesados,
  • Sus opiniones políticas,
  • Sus creencias religiosas u otras creencias de naturaleza similar,
  • Si son miembros de sindicatos u asociaciones gremiales
  • Su salud o estado físico o mental,
  • Su vida sexual,
  • La comisión o presunta comisión de cualquier delito, o
  • Cualquier procedimiento por cualquier delito cometido o presuntamente cometido, la disposición de tales procedimientos o la sentencia de cualquier tribunal en tales procedimientos.

 

Así determinados identificadores de información personal debe ser tratada a través de las técnicas de seudonimización o anonimización. Este tipo de información suelen denominarse identificadores (directos, indirectos y geográficos :

 

Los datos sensibles pueden ser FAIR, puesto que estos principios no exigen el acceso abierto a los datos. Sin embargo, de acuerdo a sus recomendaciones, se considera importante publicar al menos los metadatos para que los datos confidenciales tengan la posibilidad de ser encontrados y citados, aunque los datos propiamente tal no sean accesibles. Así también, estos registros de metadatos pueden incluir las características y condiciones específicas de acceso a los datos en los casos particulares.

En el tratamiento y gestión de los datos sensibles es altamente recomendado para mitigar los riesgos que conlleva la obtención y tratamiento de datos masivos de carácter personal. Consiste en un proceso que permite identificar y ocultar la información sensible, permitiendo su divulgación sin que ello implique vulnerar los derechos de protección de datos de las personas y organizaciones que se puedan referenciar en los mismos.

 

El proceso de anonimización consiste en eliminar o reducir el mínimo los riesgos de re-identificación de los datos anonimizados, manteniendo la veracidad de los resultados del tratamiento de los mismos....

 

Objetivos de la anonimización:

  • Poder compartir esos datos sin comprometer la privacidad de los usuarios
  • Proteger la privacidad de los usuarios de forma tal que no puedan: 1) ser reconocidos, 2) hacer inferencias sobre personas específicas

Será necesario anonimizar o seudonimizar cuando: 

  • Se quiera compartir o ceder datos a destinatarios con los que no se ha firmado un acuerdo de confidencialidad 
  • Se quiera publicar datos abiertamente 
  • La reducción de la calidad de la información sea aceptable y no afecte al uso de los datos 

 

Procedimientos para anonimizar los datos

 

Transformación de los datos que constituyan algún tipo de identificador que permitiera identificar al sujeto (suprimirlos, sustituirlos, distorcionarlos, generalizarlos o agregarlos sin que esto afecte al posterior uso de la información)

  • Remover identificadores directos: EX: Nombre, DNi, Número de la seguridad social, etc
  • Remover combinaciones infrecuentes de cuasi identificadores, ex: combinaciones únicas de fechas y códigos postales
  • Combinaciones infrecuentes se eliminan a través de la generalización, ex: fecha de nacimiento 14/01/1977 se convirtiría en **/**/1977

 

                            Dataset ficticio creado para prácticas 

 

OpenAir recomienda la utilización de la herramienta Amnesia de anonimización de datos, que permite borrar de los datos toda aquella información identificativa (nombres, código postal, fechas de nacimiento...). 

 

Síguenos en:

Licencia Creative Commons
Biblioteca/CRAI de la Universidad Pablo de Olavide Licencia Creative Commons Atribución-NoComercial-CompartirIgual 4.0 Internacional.