Skip to main content
Parece que está usando Internet Explorer 11 o una versión anterior. Este sitio web funciona mejor con navegadores modernos como las últimas versiones de Chrome, Firefox, Safari y Edge. Si continúa con este navegador, es posible que vea resultados inespera

Gestión de datos de investigación

Esta guía te introducirá en los conceptos relevantes sobre los datos de investigación (qué son, cómo procesarlos y compartirlos, cómo crear un Plan de Gestión de datos de investigación, etc). Y te proporcionará una serie de recursos y herramientas útiles

Formatos

Formato de los ficheros:

Los ficheros de trabajo, aquellos usados durante la recogida y trabajo con los datos del proyecto, no siempre son organizados y nombrados de manera que permitan su re-utilización y preservación a largo plazo y cumplan los requisitos de los repositorios o satisfagan los requerimientos de los organismos financiadores. 

Para ello, es importante seguir una serie de principios para seleccionar el formato adecuado para los ficheros de datos con el fin de garantizar su uso y preservación:

Seleccionar formatos abiertos, no propietarios.
Es mucho más probable que los formatos abiertos y no propietarios sigan siendo utilizables incluso si el software que los creó no está disponible o ya no funciona. Los formatos cuya documentación es completa y está disponible gratuitamente también tienen una mayor probabilidad de conservación a largo plazo. La ausencia de barreras legales en el acceso a los conjuntos de datos que caracteriza a los formatos abiertos facilita la gestión y las posibles manipulaciones de los datos (migraciones, emulaciones, reutilización de datos).

Como regla general, los formatos de texto sin formato, como los archivos delimitados por comas o tabuladores, son formatos abiertos y suelen ser mejores para su re-utilización y conservación a largo plazo.

  • Ejemplo de un formato propietario: archivo .psd de Photoshop
  • Ejemplo de formato abierto: archivo de imagen .tiff

Ventajas de guardar en TEXT (.txt, .csv, .html, .xml):

  • El archivo de dato puede ser leído en un editor de texto plano (Ej: NotePad). 
  • Puede, entonces, ser abierto en cualquier sistema operativo y por un amplio rango de aplicaciones. 

Seleccione formatos que cuando se comprima , no se pierda información ("sin pérdida"). 

Los formatos comprimidos de un archivo suelen ser más pequeños, pero la compresión a menudo elimina datos del archivo de forma permanente. Estos formatos tienen "pérdida", mientras que los formatos que no dan como resultado la pérdida de información cuando se descomprimen son "sin pérdida".

  • Ejemplo de formatos con pérdida: archivo de audio .mp3, archivo de imagen .jpeg
  • Ejemplo de formatos sin pérdida: archivo de audio .wav, archivo de imagen .tiff

Seleccione formatos sin cifrar y sin compilar
Si se pierde la clave de cifrado, la frase de contraseña o la contraseña de un archivo, es posible que no haya forma de recuperar los datos del archivo más adelante, dejándolo inutilizable para otros.

El código fuente no compilado es más fácilmente reutilizable por otros y tiene una probabilidad mucho mayor de seguir siendo utilizable a lo largo del tiempo, ya que la recompilación es posible en diferentes arquitecturas y plataformas.

Formatos de archivos FAIR: 

  • Contenedores: TAR, GZIP, ZIP
  • Bases de datos: XML, CSV, JSON
  • Geoespacial: SHP, DBF, GeoTIFF, NetCDF
  • Video: MPEG, AVI, MXF, MKV
  • Sonido: WAVE, AIFF, MP3, MXF FLAC
  • Estadísticas: DTA, POR, SAS, SAV
  • Imágenes: TIFF, JPEG 2000, PDF, DNG, GIF, BMP, SVG
  • Datos tabulares: CSV, TXT
  • Texto: XML, PDF / A, HTML, JSON, TXT, RTF
  • Archivo web: WARC

Para mayor información: 

eCommons: Cornelll´s Digital Repository: Formatos de ficheros recomendados

Cuando los datos se convierten de un formato a otro – a través de exportaciones o mediante un conversor- pueden ocurrir pequeñas variaciones que podrían afectar la calidad de los datos. Por ejemplo, en los datos organizados en paquetes estadísticos, spreadsheets o bases de datos, pueden perderse total o parcialmente datos relativos a definición de valores, decimales, fórmulas o etiquetas variables. Para los datos textuales, pueden perderse aspectos de edición como negrita, encabezamiento y pie de páginas, destacados.

Es recomendable:

Que los propios autores de los datos hagan la conversión de formatos, para asegurar su integridad durante el proceso

Hacer la conversión cuando los datos se han empaquetado en formatos propietarios a formatos estándares para la preservación digital, ya que ello facilitará la apertura de los ficheros en el futuro. 

En la UPO, especialmente de cara a su correcto depósito en el Repositorio Institucional Olavide (RIO) recomienda estas herramientas para la conversión de formatos:

Más información:

 Servicios de gestión de datos de la Universidad de Edimburgo 

 

Síguenos en:

Licencia Creative Commons
Biblioteca/CRAI de la Universidad Pablo de Olavide Licencia Creative Commons Atribución-NoComercial-CompartirIgual 4.0 Internacional.