UMD - Manejo Integrado de Datos para la Investigación

Author

Omar Benites A - UCSS

1 Manejo Integrado de Datos para la Investigación

El presente documento menciona los principales principios para la implementación de lineamientos de manejo integrado de datos en la Facultad de Ingenieria Agraria de la UCSS.

Con el fin de generar procesos estandarizados en los trabajos de investigación (tesis o proyectos) de la FIA,

2 Objetivos

  • Documentar desde el planeamiento del proyecto de investigación, las variables y metadata del estudio por parte del alumno o investigador.

  • Reducir el tiempo en la revisión del trabajo de tesis o investigación de parte de los revisores. Evitar leer toda la tésis para identificar que tipo de estudio están realizando.

  • Sugerir posibles delimitaciones en el trabajo: en base a la cantidad de variables, sugerir delimitar el número de variables posibles a ser incluidas en el trabajo.

  • Identificar lentitudes en el avance por una falta (o excesiva) rigurosidad: no perderse demasiado en la revisión bibliográfica o “analizar todo”.

  • Permitir un avance sostenido en los trabajos: al estar involucrados desde el planeamiento podemos identificar que tipos de análisis se pueden realizar.

  • En base a las trabajos ya realizados, generar automatismos (templates) para trabajos similares que puedan desarrollarse al mismo tiempo y en diferentes lugares por alumnos o investigadores.

3 Estandarización del Proceso de Manejo de Datos

Para el manejo integrado de datos -contamos con 3 estándares:

  • Metadata-Descripción del estudio
  • Data diccionario
  • Metadata-Estudio de Investigación

3.1 Metadatos-Descripción del estudio

Son los “datos de los datos”, o mejor dicho, la descripción en la cual han sido colectado los datos. Esto puede incluir el nombre del investigador, nombre del tesista, nombre del proyecto, objetivos del proyecto ,fecha de inicio del proyecto, entre otros (ver Figure 1).

Figure 1: Ejemplo de metadatos relacionados a la descripción del estudio de adaptación de variedades
  • Template

https://docs.google.com/spreadsheets/d/1YFE2RXviyV9af00FsDYus4fP_mWZ83Wp5JRaGMRZUH4/copy#gid=2110295743

  • Ejemplo

https://docs.google.com/spreadsheets/d/1ZvRYmcjBw09hMTiVhzM-Em2f9AnxpKr71N3TzT4kcWE/edit#gid=0

3.2 Data Diccionario

Es el registro de todas las variables que vamos a evaluar en el estudio. Estas variables tendrán una información minima con los siguientes atributos:

  • Nombre de la variable: el nombre de la variable que vamos a evaluar

  • Unidades métricas: unidades métricas o escala

  • Abreviación: nombre corto y conciso del nombre original de la variable. (Ver más detalle adelante).

  • Número de mediciones en el tiempo: la variable será medida cuantas veces en el tiempo

  • Tipo de variable: si la variable es cuantitativa o categorica

Dependiendo del tipo de variable, tambien es bueno ingresar información sobre:

Si e categorica, incluir un campo adicional categorias donde se menciona las categorias de la variable separadas por coma.

Si es cuantitativa, incluir dos campo de valores minimos (limite inferior) y valores máximo (limite superior).

Figure 2: Ejemplo de data diccionario

3.2.1 Abreviaciones de las variables

Reglas de abreviación

Una abreviación de una variable por lo general debe ser corta y fácil de leer. Ejemplo: altura de planta la podemos abreviar como altplant. Tambien peso de tuberculo la podemos abreviar como ptuber.

No debe incluir espacio en blanco entre los nombres de las abreviaciones. En remplazo puede ir un guion abajo (). Ejemplo: altura de planta la podemos abreviar como alt_plant (correcto).

No debe ir carácteres extraños como “!, ?, {, (), %, &, ^,” o “comas, punto y comas, tildes”. Ejemplo: La variable porcentaje de clorofila no se puede abreviar como “%clorofila” (incorrecto).

Finalmente, las abreviaciones no deben exceder más de 32 caractéres. Ejemplo: contenido de cadmio en la raíz se puede abreviar como cont_cd_raiz.

3.3 Metadata-Estudio de Investigación

Se debe documentar los aspectos relacionados al estudio experimental o explorativo realizado por el estudiante o el investigador, con el fin de entender rapidamente el planteamiento experimental o explorativo del trabajo a realizar (ver imagen Figure 3).

Observación

Esta sección puede variar, dado que según el estudio

Aquí tenemos que considerar 2 tipos de estudio

3.3.1 Estudios experimentales:

Aqui documentamos todos los campos relacionados al diseño experimental. Se consideran:

  • Tipo de estudio: experimental

  • Número de factores: cuantos factores hay en el estudio

  • Nombre del factor: que nombre tiene el factor

  • Niveles del factor: niveles del factor separados por comas

  • Tipo de diseño: que tipo de diseño se utilizó

  • Repeticiones, bloques : numero de repeticiones o bloques

Figure 3: Documentación del estudio realizado

3.3.2 Estudios no-experimentales

Donde el investigador no interviene, involucra la observación del fenómeno.

4 Recursos

  • Template

https://docs.google.com/spreadsheets/d/1ZvRYmcjBw09hMTiVhzM-Em2f9AnxpKr71N3TzT4kcWE/copy#gid=2110295743

  • Ejemplo

https://docs.google.com/spreadsheets/d/1ZvRYmcjBw09hMTiVhzM-Em2f9AnxpKr71N3TzT4kcWE/edit#gid=0