Ejemplo de un proyecto de bioestadística (metodología y resultados)
¹Escuela de Ciencias Biológicas, Universidad Nacional, Heredia, Costa Rica; daniela.obando.garcia@est.una.ac.cr, gloriana.ramos.azofeifa@est.una.ac.cr,melannyjrg32@gmail.com
Fecha: 2020-10-27 13:57:29
Metodología
Sitio de estudio:El proyecto se realizó en cuatro ríos de San Carlos, Alajuela. Precisamente el río Peje denotado como Sitio1, río Peñas Blancas llamado el Sitio 2, río Chachagua nombrado el Sitio 3 y río Chachagüita referenciado como el Sitio 4. Se realizó un muestreo durante los años 2017 y 2018, en época seca y lluviosa con larvas del orden de insectos Tricópteros del género Leptonema.
Diseño muestreo y experimental: Los muestreos se realizaron en cuatro sitios, de cada uno de estos se tomaron treinta muestras para la determinación de la abundancia de Tricópteros por metro cuadrado. Además, se colectó una muestra de agua para determinar la concentración de fosfato presente en esta. Posterior a esto, se establecieron valores promedio de los parámetros morfométricos en unidades de milímetros; como la longitud total, ancho cefálico y el largo del fémur para individuos de cuatro especies de Leptonema. Por otro lado, se realizó un experimento de laboratorio, en el cual se seleccionaron diez individuos de cada sitio y especies, considerando que los muestreos se realizaron en dos épocas estacionales de dos años. La cual se dio de manera aleatoria para determinar el tiempo de actividad y sobrevivencia, ambas en unidades de minutos, siendo sometidas a tres temperaturas diferentes en un rango de diez minutos en condiciones controladas.
Análisis datos:Para comparar la similitud entre los diferentes datos, se sometieron estos a pruebas de análisis de varianzas(ANDEVA). Se realizó un modelo respecto al muestreo previo, donde se tomó como variable la longitud total del individuo y como factor la especies. También se elaboraron dos modelos de los datos adquiridos en el experimento, en los cuales la variables fueron la actividad y la supervivencia, siguiendo este orden, para sus respectivos factores se utilizó la temperatura implementada y la especie. De cada modelo realizado se comprobó la normalidad de los residuos con la prueba Shapiro–Wilk, la distribución de los datos por categorías con una prueba de balance y también se realizó la mejor prueba de homocedasticidad que se adaptó según las condiciones de cada modelo. Luego de esto, se verificó si existían diferencias significativas entre las categorías comparadas y se utilizaron Post-hoc para determinar cuáles eran estas diferencias. Al finalizar se elaboró un diagrama de cajas que representa los valores obtenidos para su mejor interpretación. Todos los análisis se realizaron con un nivel de confianza al 95% desde la programación de Rstudio (versión 1.3.1056, 2020).
Resultados
El primer modelo presentó datos paramétricos y homocedásticos. Además, estos fueron balanceados, cada categoría presentó una distribución de 480 datos. Se encontraron diferencias en las medias (F=3.122;g.l= 3; p-value=0.025), por esto se se aplicó la prueba de Tukey dando como resultado una leve diferencia entre la especie 1 y 4 . Además, se observa la existencia de varios datos atípicos con respecto al valor de la media(Figura 1).Figura 1. Comparación de las varianzas de la longitud total por la especie.
Al realizar el segundo modelo, basado en la parte experimental, primeramente se comprobó que tanto la variable actividad como la temperatura son datos asimétricos ya que su p-value tuvo un valor de 4.509e-07 al utilizar la prueba de Shapiro–Wilk. Seguidamente se evidenció que ambas variables están balanceadas al registrar 160 datos por categoría y son homocedásticas puesto que su valor de p-value es mayor a 0.05, correspondiente a 0.9952. Posterior a esto, se aplicó la prueba de Kruskal-Wallis, con la cual se identificó que no existe diferencia significativa entre la variable actividad y la temperatura ya que su valor es de 0.9423.
En otro modelo en el cual se relacionó el variable de sobrevivencia con el factor de especie en la sección experimental, se determinó que los datos son asimétricos y a su vez se encuentra balanceados con un total de 120 datos por categoría. Sin embargo, en este caso no se presentó homocedasticidad debido a que su valor es igual a 2.2e-16, por lo que se dio la prueba como concluida.
Anexo: Códigos de R utilizados
#...............................................................................
#Llamar paquetes y la base de datos
library(ggplot2)
library(readxl)
d<- read_excel("Data/BD-Trichoptera.xlsx", sheet="Muestreo")
d<- data.frame(d)
d.e<- read_excel("Data/BD-Trichoptera.xlsx", sheet="Experimento")
d.e<- data.frame(d.e)
#...............................................................................
#Factores
especieM<-as.factor(d$especie)
Temp<-as.factor(d.e$temperatura)
especieE<-as.factor(d.e$especie)
#Variables
long<-d$long
Actividad<-d.e$actividad
Sobrevivencia<-d.e$sobrevivencia
#Modelos........................................................................
modelo1<-aov(long ~ especieM)
modelo2<-aov(Actividad~Temp)
modelo2.3<-aov(Sobrevivencia~especieE)
#Normalidad ....................................................................
shapiro.test(resid(modelo1))
shapiro.test(resid(modelo2))
shapiro.test(resid(modelo2.3))
#Balance........................................................................
tapply(long, especieM, length)
tapply(Actividad, Temp, length)
tapply(Sobrevivencia, especieE, length)
#Homocedasticidad...............................................................
bartlett.test(long ~ especieM)
fligner.test(Actividad, Temp)
fligner.test(Sobrevivencia, especieE)
#Diferencias....................................................................
summary(modelo1)
TukeyHSD(modelo1)
kruskal.test(Actividad~Temp)
#Grafico........................................................................
boxplot(long ~ especieM, xlab="Especie", ylab="Longitud total de la especie", col=c("cadetblue3", "yellow2", "purple", "deeppink3"))
#...............................................................................