Tlf: 954 34 92 55
Servicio de Apoyo a la investigación.
Biblioteca-CRAI Universidad Pablo de Olavide - Ctra. de Utrera, km. 1 - 41013 Sevilla
¿Cómo documentar tus datos y por qué?
Documentar adecuadamente tus datos ayuda a que se puedan comprender y reutilizar por ti y por otros, en el presente y en el futuro. Documentar tus datos significa agregar información que permita que se entiendan los datos en el contexto de su estudio.
Imagina que accedes a un fichero de datos y tiene un conjunto de variables que se han usado pero están codificadas, y no aparece la descripción de esas variables.
En ese caso, ¿Podrías comprender qué datos han utilizado? Seguro que no.
Por eso, es crucial que no dejes los datos solos.
Una buena documentación de datos incluye información sobre:
Existen tres niveles fundamentales para la documentación de los datos
Ejemplos más usados:
Cuestionarios,
Ficheros Readme.txt
Libros de códigos
Guías de uso
Diccionarios de datos, etc.
Software syntax
Cuadernos de laboratorio
Puede consultar este ejemplo: The National Survey of Sexual Attitudes and Lifestyles, 2010-2012
Si quieres saber más ...
Puedes solicitar asesoría al propio Servicio de Datos de Investigación de la Biblioteca/CRAI.
Además de la documentación explicativa y contextual que puedes elaborar con un fichero Readme.txt que acompañe a tus datos, es preciso describir los datos para poder identificarlos y organizarlos. Esta descripción de los datos se hace a través de los metadatos.
¡Toma nota...!
Los metadatos son "datos sobre los datos". Se refiere a aquella "Información estructurada que describe, explica, localiza, o representa algo más"
Al igual que se describen los libros y revistas, a través de campos como título, nombre del artículo, fecha de creación, fecha de publicación, ISSN de la revista, palabras clave, etc., también los datos necesitan ser descritos de manera estandarizada.
Algunos de estos metadatos asignados a los datos de investigación son:
- Título
- Identificador único (Ej.: DOI)
- Licencia para que puedan ser reutilizados
- Formato del archivo (Ej.: CSV, TXT, SAV, etc.)
- Descripción del conjunto de datos
- Palabras clave
- Descripción de las variables que lo componen
- Información sobre la financiación si fuera el caso
En la actualidad existen varios estándares de metadatos para describir los datos.
Cada área de conocimiento tiene su estándar propio y sus herramientas.
1. Trata de escoger uno o dos que representen tu campo disciplinar y otro también para datos de investigación en general.
Ejemplo: DDI (Data Documentation Index) para Ciencias Sociales
Dublin Core (General Research Data)
2. Escoge un formato preferentemente XML o JSON. Son formatos abiertos, leíbles por máquina y permiten la interoperabilidad.
Si no sabes cómo leer los metadatos en XML, puedes usar este conversor a Excel: https://cdkm.com/es/xml-to-xls
3. Puedes generar los metadatos al estándar Dublin core con esta herramienta: http://nsteffel.github.io/dublin_core.../generator_nq.html
4. Si depositas tus datos en un repositorio de confianza, ya te asignarán los metadatos que tenga el estándar que utilice el repositorio.
5. Si estas comenzando, usa plantillas de metadatos para que te sea más fácil:
* Create a codebook about your research to accompany the dataset (DDI Alliance, 2017a). https://ddialliance.org/.../getting.../create-a-codebook
* Georgia Tech Library (n.d.) Metadata Template https://www.library.gatech.edu/smartech-metadata;
* Use the Dublin Core Metadata Generator (dublincoregenerator, n.d.);
* the Cornell University (n.d.) guide to writing “readme” style metadata (with downloadable template) https://data.research.cornell.edu/content/readme;
* ISO 19115-2 Metadata Editor (GRIIDC (2015)) web application https://data.gulfresearchinitiative.org/metadata-editor...;
Para más información y buenas prácticas:
Disciplinary metadata. Digital Curation Center UK
Metadata. Australian National Data Service
Metadata. JISC
Metadata Tips: Cornell's Digital Repository
Toma nota ...
¿Qué es un fichero Readme.txt y para qué sirve?
Un fichero Readme.txt describe la información necesaria para que los conjuntos de datos sean comprensibles y reutilizables.
¿Para qué usarlo y cuándo?
¿Qué información debe contener?
¿Dónde ubicarlo?
También puedes utilizarlo para documentar los pasos que vas realizando en el procesamiento de tus datos:
Aquí te dejamos una guía y ejemplos de plantillas para que la puedas utilizar para documentar tus datos.
¿Qué es un diccionario de datos y para qué sirve?
Para que los datos creados durante la investigación sean comprensibles, reutilizados por el propio equipo investigador y posteriormente por otros, es necesario que el contenido sea comprensible sin dejar lugar a dudas o malas interpretaciones. Ello puede conllevar pérdida de tiempo, e incluso errores que traen consigo retrabajo y pérdida en la efectividad del proceso investigador.
Un diccionario de datos es útil para:
Los elementos a incluir varían mucho de un proyecto a otro y del nivel de profundidad con el que se quieran describir los datos, desde datos contextuales relativos al proyecto a los campos específicos para describir cada una de las variables.
Lista de algunos campos que podrías incluir:
Ejemplo:
Un Diccionario de datos puede contribuir a la consistencia, seguimiento de los estándares más adecuados en función de cada campo científico, y la propia reutilización e interoperabilidad de los datos.