UMD - Manejo Integrado de Datos para la Investigación
1 Manejo Integrado de Datos para la Investigación
El presente documento menciona los principales principios para la implementación de lineamientos de manejo integrado de datos en la Facultad de Ingenieria Agraria de la UCSS.
Con el fin de generar procesos estandarizados en los trabajos de investigación (tesis o proyectos) de la FIA,
2 Objetivos
Documentar desde el planeamiento del proyecto de investigación, las variables y metadata del estudio por parte del alumno o investigador.
Reducir el tiempo en la revisión del trabajo de tesis o investigación de parte de los revisores. Evitar leer toda la tésis para identificar que tipo de estudio están realizando.
Sugerir posibles delimitaciones en el trabajo: en base a la cantidad de variables, sugerir delimitar el número de variables posibles a ser incluidas en el trabajo.
Identificar lentitudes en el avance por una falta (o excesiva) rigurosidad: no perderse demasiado en la revisión bibliográfica o “analizar todo”.
Permitir un avance sostenido en los trabajos: al estar involucrados desde el planeamiento podemos identificar que tipos de análisis se pueden realizar.
En base a las trabajos ya realizados, generar automatismos (templates) para trabajos similares que puedan desarrollarse al mismo tiempo y en diferentes lugares por alumnos o investigadores.
3 Estandarización del Proceso de Manejo de Datos
Para el manejo integrado de datos -contamos con 3 estándares:
- Metadata-Descripción del estudio
- Data diccionario
- Metadata-Estudio de Investigación
3.1 Metadatos-Descripción del estudio
Son los “datos de los datos”, o mejor dicho, la descripción en la cual han sido colectado los datos. Esto puede incluir el nombre del investigador, nombre del tesista, nombre del proyecto, objetivos del proyecto ,fecha de inicio del proyecto, entre otros (ver Figure 1).
- Template
- Ejemplo
https://docs.google.com/spreadsheets/d/1ZvRYmcjBw09hMTiVhzM-Em2f9AnxpKr71N3TzT4kcWE/edit#gid=0
3.2 Data Diccionario
Es el registro de todas las variables que vamos a evaluar en el estudio. Estas variables tendrán una información minima con los siguientes atributos:
Nombre de la variable: el nombre de la variable que vamos a evaluar
Unidades métricas: unidades métricas o escala
Abreviación: nombre corto y conciso del nombre original de la variable. (Ver más detalle adelante).
Número de mediciones en el tiempo: la variable será medida cuantas veces en el tiempo
Tipo de variable: si la variable es cuantitativa o categorica
Dependiendo del tipo de variable, tambien es bueno ingresar información sobre:
Si e categorica, incluir un campo adicional categorias donde se menciona las categorias de la variable separadas por coma.
Si es cuantitativa, incluir dos campo de valores minimos (limite inferior) y valores máximo (limite superior).
3.2.1 Abreviaciones de las variables
- Reglas de abreviación
-
Una abreviación de una variable por lo general debe ser corta y fácil de leer. Ejemplo: altura de planta la podemos abreviar como altplant. Tambien peso de tuberculo la podemos abreviar como ptuber.
No debe incluir espacio en blanco entre los nombres de las abreviaciones. En remplazo puede ir un guion abajo (). Ejemplo: altura de planta la podemos abreviar como alt_plant (correcto).
No debe ir carácteres extraños como “!, ?, {, (), %, &, ^,” o “comas, punto y comas, tildes”. Ejemplo: La variable porcentaje de clorofila no se puede abreviar como “%clorofila” (incorrecto).
Finalmente, las abreviaciones no deben exceder más de 32 caractéres. Ejemplo: contenido de cadmio en la raíz se puede abreviar como cont_cd_raiz.
3.3 Metadata-Estudio de Investigación
Se debe documentar los aspectos relacionados al estudio experimental o explorativo realizado por el estudiante o el investigador, con el fin de entender rapidamente el planteamiento experimental o explorativo del trabajo a realizar (ver imagen Figure 3).
- Observación
-
Esta sección puede variar, dado que según el estudio
Aquí tenemos que considerar 2 tipos de estudio
3.3.1 Estudios experimentales:
Aqui documentamos todos los campos relacionados al diseño experimental. Se consideran:
Tipo de estudio: experimental
Número de factores: cuantos factores hay en el estudio
Nombre del factor: que nombre tiene el factor
Niveles del factor: niveles del factor separados por comas
Tipo de diseño: que tipo de diseño se utilizó
Repeticiones, bloques : numero de repeticiones o bloques
3.3.2 Estudios no-experimentales
Donde el investigador no interviene, involucra la observación del fenómeno.
4 Recursos
- Template
- Ejemplo
https://docs.google.com/spreadsheets/d/1ZvRYmcjBw09hMTiVhzM-Em2f9AnxpKr71N3TzT4kcWE/edit#gid=0