Skip to Main Content
Parece que está usando Internet Explorer 11 o una versión anterior. Este sitio web funciona mejor con navegadores modernos como las últimas versiones de Chrome, Firefox, Safari y Edge. Si continúa con este navegador, es posible que vea resultados inespera

Gestión de datos de investigación

Esta guía te introducirá en los conceptos relevantes sobre los datos de investigación y cómo gestionarlos(qué son, cómo procesarlos y compartirlos, cómo crear un Plan de Gestión de datos de investigación, etc). Y te proporcionará una serie de recursos y h

Documentación y metadatos

¿Cómo documentar tus datos y porqué ? 

Documentar adecuadamente tus datos ayuda a que se puedan comprender y reutilizar por ti y por otros, en el presente y en el futuro. Documentar tus datos significa agregar información que permita que se entiendan los datos en el contexto de su estudio 

 

Una buena documentación de datos incluye información sobre:

  • El contexto de la recopilación de datos: historia del proyecto, objetivos e hipótesis
  • Métodos de recopilación de datos: muestreo, proceso de recopilación de datos,
  • instrumentos utilizados, hardware y software utilizado, escala y resolución, cobertura temporal y geográfica y fuentes de datos secundarias utilizadas
  • Estructura de los archivos de datos y relaciones entre archivos 
  • Validación de datos, verificación, limpieza y procedimientos llevados a cabo para asegurar su calidad 
  • Cambios realizados en los datos a lo largo del tiempo desde su creación original e identificación de las diferentes versiones
  • Información sobre el acceso, condiciones de uso o confidencialidad

 

 

Existen tres niveles fundamentales para la documentación de los datos 

  •     A nivel de proyecto: Se documenta objetivos del estudio, preguntas de investigación, metodologías, instrumentos de medida, etc
  •     A nivel de Base de datos y Fichero: Se documenta cómo todos los ficheros que conforman el data-set se relacionan. Se incluye un fichero  "readme.txt" con la información relevante. 
  •     A nivel de Variables e ítems:  Se incluye un fichero tipo diccionario, no sólo con los nombres de las variables, sino con sus respectivas etiquetas explicando su significado en el contexto del estudio.  

Ejemplos más usados: ​

  • Cuestionarios, ​

  • Ficheros Readme.txt, ​

  • Libros de códigos, ​

  • Guías de usuario, ​

  • Diccionarios de datos, etc​

  • Software syntax​

  • Cuadernos de laboratorio​

 

Puede consultar este ejemplo: The National Survey of Sexual Attitudes and Lifestyles, 2010-2012 

 

Si quieres saber más y necesitas asesoría...
Puedes consultar la Guía de Gestión de datos de la Biblioteca/CRAi o solicitar asesoría al propio Servicio de Datos de Investigación de la Biblioteca

Además de la documentación explicativa y contextual que puedes elaborar con un fichero Readme txt que acompañe a tus datos,  es preciso describir los datos para poder identificarlos y organizarlos. Esta descripción de los datos se hace a través de los metadatos.

¡Toma nota...!
Los metadatos son "datos sobre los datos" . Se refiere a aquella "Información estructurada que describe, explica, localiza, o representa algo más"

 

Como mismo se describen los libros y revistas, a través de campos como título, nombre del artículo, fecha de creación, fecha de publicación, ISSS de la revista, palabras clave, etc, también los datos necesitan ser descritos de manera estandarizada . 

 

Algunos de estos metadatos asignados a los datos de investigación son:

- Titulo

- Identificador único (ej: Doi)

- Licencia para que puedan ser re-utilizados

- Formato del archivo (Ej:CSV, txt, SAv, etc)

- Descripción del conjunto de datos 

- Palabras clave 

- Descripción de las variables que lo componen

- Información sobre la financiación si fuera el caso

 

En la actualidad existen varios estándares de metadatos para describir los datos.

Cada área de conocimiento tiene su estándar propio y sus herramientas. 

 

¿ Cómo saber cuáles utilizar ?

 

1. Trata de escoger uno o dos que representen tu campo disciplinar y otro también para datos de investigación en general.

  • Ejemplo: DDI (Data Documentation Index) para Ciencias Sociales
  • Dublin Core (General Research Data )

2. Escoge un formato preferentemente **.xml**. o **json**. Son formatos abiertos, leíbles por máquina y permiten la interoperabilidad.

Si no sabes como leer los metadatos en xml, puedes usar este conversor a excel: https://cdkm.com/es/xml-to-xls

3. Puedes generar los metadatos al estándar Dublin core con esta herramienta: http://nsteffel.github.io/dublin_core.../generator_nq.html

4. Si depositas tus datos en un Repositorio de confianza, ya te asignarían los metadatos que tenga el estándar que utilice el repositorio.

5. Si estas comenzando, usa plantillas de metadatos para que te sea más fácil:
* Create a codebook about your research to accompany the dataset (DDI Alliance, 2017a). https://ddialliance.org/.../getting.../create-a-codebook
* Georgia Tech Library (n.d.) Metadata Template https://www.library.gatech.edu/smartech-metadata;
* Use the Dublin Core Metadata Generator (dublincoregenerator, n.d.);
* the Cornell University (n.d.) guide to writing “readme” style metadata (with downloadable template) https://data.research.cornell.edu/content/readme;
* ISO 19115-2 Metadata Editor (GRIIDC (2015)) web application https://data.gulfresearchinitiative.org/metadata-editor...;
 

Para más información y buenas prácticas: 

 

Toma nota ...

! Cuanto más relevantes sea los metadatos, más fácil será para otros investigadores encontrar y reutilizar los datos !

¿Qué es un fichero Readme.txt y para que sirve? 

 Un fichero Readme.txt describe la información necesaria para que los conjuntos de datos sean comprensibles y reutilizables.

 

¿Para qué usarlo y cuándo?                                                                                                                                              

  • Un fichero Readme.txt es parte de la documentación que describen los datos en el contexto del proyecto. 
  • Es importante generarlo desde el comienzo e ir actualizándolo,
  • Es fundamental  en el momento del depósito del Dataset en un repositorio. 
  • Permite la reproducibilidad de la investigación de manera efectiva,. 

 

 

 

¿Qué información debe contener?

  • autoría,
  • título del Dataset,
  • descripción de los datos y ficheros (Lista de ficheros o carpetas y relación entre ellos, datos adicionales que no están incluidos en el dataset, descripción de las posibles versiones si es el caso y su actualizaciones)
  • metodología  e instrumentos de medición,
  • Descripción detallada de los ficheros incluidos (Número de variables, Número de casos/filas; Lista de variables y descripción, códigos para el tratamiento de Missing values o valores ausentes; etc)
  • financiadores,
  • cobertura temporal y geográfica,
  • derechos de uso y privacidad, etc. (Licencias o restricciones en relación a los datos ,   Link a las publicaciones que citan o usan los datos, etc)

 

¿Dónde ubicarlo ? 

 

 

 

 

 

 

 

 

 

 

También puedes utilizarlo para documentar los pasos que vas realizando en el procesamiento de tus datos:

 

#Tips

 

  • Nombra el fichero Readme de forma tal que su nombre se asocie al fichero (s) de datos que describe,
  • Escribe tu fichero Readme en formato txt. 
  • Para varios ficheros Readme en un proyecto, intente darle el mismo formato, orden y terminología. 
  • Use formatos estándar para las fecha: Ejemplo, W3C/ISO 8601 date standard,
  • Intente utilizar la terminología propia de su campo científico. 

                    

Aquí te dejamos un ejemplo de plantilla para que la puedas utilizar para documentar tus datos. 

Ejemplo de plantilla para crear un fichero Readme.txt de la Universidad de Cornell 

¿Qué es un diccionario de datos y para qué sirve? 

Para que los datos creados durante la investigación sean comprensibles, reutilizados por el propio equipo de investigadores y posteriormente por otros, es necesario que el contenido sea comprensible sin dejar lugar a dudas o mal interpretaciones. Ello puede conllevar perdida de tiempo, e incluso errores que traen consigo retrabajo y pérdida en la efectividad del proceso investigador.

 

Un diccionario de datos es útil para:

  • definir adecuadamente todas las unidades de medidas. Una variable en un contexto puede tener un significado y en otro proyecto otro (Ejemplo, la propia edad de un individuo. No es lo mismo la edad real, a la edad basal de entrada en el estudio o la edad al concluir un seguimiento ).  O incluso dicha variable se puede transformar de cuantitativa a grupos etarios como variable categórica. 
  • definición conceptual y operativas para el estudio en cuestión,
  • valores codificados de la variable,
  • posibles formatos, abreviaciones, etc 

 

Elementos principales a incluir en un diccionario de datos

 

Los elementos a incluir varía mucho de un proyecto a otro y del nivel de profundidad con el que se quieran describir los datos , desde datos contextuales relativos al proyecto a los campos específicos para describir cada una de las variables.

Lista de algunos campos que podrías incluir:

  • Elemento identificador de la tabla (eso para si tienes datos en varias tablas)
  • Nombres de las variables
  • Definición de cada variable (cómo se entiende en tu estudio)
  • Tipo de datos
  • Longitud del campo
  • ¿Campo requerido? y/n
  • ¿Valores nulos? Codificación 

Ejemplo:

 

Un Diccionario de datos puede contribuir a la consistencia, seguimiento de los estándares más adecuados en función de cada campo científico, y la propia re-utilización e interoperabilidad de los datos. 

 

 

Síguenos en:

Licencia Creative Commons
Biblioteca/CRAI de la Universidad Pablo de Olavide Licencia Creative Commons Atribución-NoComercial-CompartirIgual 4.0 Internacional.