Ir al contenido principal

Gestión de datos de investigación

Esta guía te introducirá en los conceptos relevantes sobre los datos de investigación y cómo gestionarlos. Podrás encontrar una serie de recursos y herramientas útiles

Formatos

Los ficheros de trabajo, aquellos usados durante la recogida y trabajo con los datos del proyecto, no siempre son organizados y nombrados de manera que permitan su re-utilización y preservación a largo plazo. 

 

Para ello, es importante seguir una serie de principios para seleccionar el formato adecuado para los ficheros de datos con el fin de garantizar su uso y preservación:

Formatos de archivos FAIR: 

  • Contenedores: TAR, GZIP, ZIP
  • Bases de datos: XML, CSV, JSON
  • Geoespacial: SHP, DBF, GeoTIFF, NetCDF
  • Video: MPEG, AVI, MXF, MKV
  • Sonido: WAVE, AIFF, MP3, MXF, FLAC
  • Estadísticas: DTA, POR, SAS, SAV
  • Imágenes: TIFF, JPEG 2000, PDF, DNG, GIF, BMP, SVG
  • Datos tabulares: CSV, TXT
  • Texto: XML, PDF / A, HTML, JSON, TXT, RTF
  • Archivo web: WARC

 

 

 

              Creative Commons CC0 1.0 Universal Public Domain Dedication

  • 1 estrella - se exige que el material esté disponible en la web (cualquier formato) bajo una licencia abierta.
  • 2 estrellas - los datos deben estar disponibles como datos estructurados (por ejemplo: Excel en lugar de escanear la imagen de una tabla).
  • 3 estrellas - los datos deben estar disponibles en un formato no propietario (por ejemplo: CSV en lugar de Excel).
  • 4 estrellas - es necesario que los datos puedan ser identificados mediante una URI y que así estén integrados en la web. Una forma de representación de los datos en este nivel es RDF.
  • 5 estrellas - vincular tus datos a los que otras personas o instituciones publican, de modo que se proporcione un contexto (LOD / Linked Open Data).

 

Transformar los datos 

Cuando los datos se convierten de un formato a otro – a través de exportaciones o mediante un conversor- pueden ocurrir pequeñas variaciones que podrían afectar la calidad de los datos.

Por ejemplo:

En los datos organizados en paquetes estadísticos, hojas de cálculo en excel o bases de datos, pueden perderse total o parcialmente datos relativos a definición de valores, decimales, fórmulas o etiquetas variables. Para los datos textuales, pueden perderse aspectos de edición como negrita, encabezamiento y pie de páginas, destacados.

Por tanto, es recomendable:

  • Que las propias autorías de los datos hagan la conversión de formatos, para asegurar su integridad durante el proceso
  • Hacer la conversión cuando los datos se han empaquetado en formatos propietarios a formatos estándares para la preservación digital, ya que ello facilitará la apertura de los ficheros en el futuro. 

En la UPO, especialmente de cara a su correcto depósito en el Repositorio Institucional Olavide (RIO) recomienda estas herramientas para la conversión de formatos:

 

Síguenos en:

Licencia Creative Commons
Biblioteca/CRAI de la Universidad Pablo de Olavide Licencia Creative Commons Atribución-NoComercial-CompartirIgual 4.0 Internacional.