Skip to Main Content
Parece que está usando Internet Explorer 11 o una versión anterior. Este sitio web funciona mejor con navegadores modernos como las últimas versiones de Chrome, Firefox, Safari y Edge. Si continúa con este navegador, es posible que vea resultados inespera

Gestión de datos de investigación

Esta guía te introducirá en los conceptos relevantes sobre los datos de investigación y cómo gestionarlos(qué son, cómo procesarlos y compartirlos, cómo crear un Plan de Gestión de datos de investigación, etc). Y te proporcionará una serie de recursos y h

Formatos

Los ficheros de trabajo, aquellos usados durante la recogida y trabajo con los datos del proyecto, no siempre son organizados y nombrados de manera que permitan su re-utilización y preservación a largo plazo. 

 

Para ello, es importante seguir una serie de principios para seleccionar el formato adecuado para los ficheros de datos con el fin de garantizar su uso y preservación-

  • Ejemplo de un formato propietario: archivo .psd de Photoshop
  • Ejemplo de formato abierto: archivo de imagen .tiff

Ventajas de guardar en TEXT (.txt, .csv, .html, .xml):

  • El archivo de dato puede ser leído en un editor de texto plano (Ej: NotePad). 
  • Puede, entonces, ser abierto en cualquier sistema operativo y por un amplio rango de aplicaciones. 

Formatos de archivos FAIR: 

  • Contenedores: TAR, GZIP, ZIP
  • Bases de datos: XML, CSV, JSON
  • Geoespacial: SHP, DBF, GeoTIFF, NetCDF
  • Video: MPEG, AVI, MXF, MKV
  • Sonido: WAVE, AIFF, MP3, MXF FLAC
  • Estadísticas: DTA, POR, SAS, SAV
  • Imágenes: TIFF, JPEG 2000, PDF, DNG, GIF, BMP, SVG
  • Datos tabulares: CSV, TXT
  • Texto: XML, PDF / A, HTML, JSON, TXT, RTF
  • Archivo web: WARC

 

 

 

 

 

 

 

 

 

              Creative Commons CC0 1.0 Universal Public Domain Dedication

  • 1 estrella - se exige que el material esté disponible en la web (cualquier formato) bajo una licencia abierta.
  • 2 estrellas - los datos deben estar disponibles como datos estructurados (por ejemplo, Excel en lugar de escanear la imagen de una tabla).
  • 3 estrellas - los datos deben estar disponibles en un formato no propietario (por ejemplo, CSV en lugar de Excel).
  • 4 estrellas -es necesario que los datos puedan ser identificados mediante una URI y que así estén integrados en la web. Una forma de representación de los datos en este nivel es RDF.
  • 5 estrellas - vincular tus datos a los que otras personas o instituciones publican, de modo que se proporcione un contexto (LOD / Linked Open Data)

 

Cuando los datos se convierten de un formato a otro – a través de exportaciones o mediante un conversor- pueden ocurrir pequeñas variaciones que podrían afectar la calidad de los datos. Por ejemplo, en los datos organizados en paquetes estadísticos, spreadsheets o bases de datos, pueden perderse total o parcialmente datos relativos a definición de valores, decimales, fórmulas o etiquetas variables. Para los datos textuales, pueden perderse aspectos de edición como negrita, encabezamiento y pie de páginas, destacados.

Recomendaciones: 

 

Que los propios autores de los datos hagan la conversión de formatos, para asegurar su integridad durante el proceso

Hacer la conversión cuando los datos se han empaquetado en formatos propietarios a formatos estándares para la preservación digital, ya que ello facilitará la apertura de los ficheros en el futuro. 

En la UPO, especialmente de cara a su correcto depósito en el Repositorio Institucional Olavide (RIO), se recomiendan estas herramientas para la conversión de formatos:

Más información:

 Servicios de gestión de datos de la Universidad de Edimburgo 

 

Síguenos en:

Licencia Creative Commons
Biblioteca/CRAI de la Universidad Pablo de Olavide Licencia Creative Commons Atribución-NoComercial-CompartirIgual 4.0 Internacional.