Para el siguiente estudio se consideraron cuatro especies de Gasteropodos correspondientes a Titanostrombus galeatus (TIT_GAL), Melongena patula (MEL_PAT), Triplofusus princeps (TRI_PRI) y Goniofusus dupetitthouars (GON_DUP), el proyecto se evaluó por dos años (2018 y 2019) en cuatro distintos lugares: Islas Murciélagos, Costa Rica, Isla Coiba, Panamá, Monterrico, Guatemala y Puerto Vallarta, México, divididos en 10 transectos de 30 metros cuadrados cada uno. Se consideraron como variables: talla, abundancia, temperatura, salinidad y densidad.
Se realizaron dos correlaciones y una regresión. Para la primera correlación se crearon dos vectores, en los cuales se filtraron los datos, para el vector “abundancia” se escogió como especie Melongena patula (MEL_PAT), Costa Rica como sitio y estos correspondientes al año 2019, para el vector “Talla” se utilizaron exactamente los mismos datos. A estos vectores se les realizó la prueba de normalidad de Shapiro, a un nivel de confianza al 95%, para comprobar la naturaleza de los datos. Posteriormente, se ejecutó una prueba de correlación para comprobar si existía correlación entre ambos vectores, según los resultados de la prueba de Shapiro se indicó el método Spearman debido a que ambos vectores presentaban asimetría. Finalmente se realizó una gráfica para visualizar los resultados obtenidos.
Seguidamente se escogieron las variables temperatura y salinidad. Al igual que para la primera correlación, se crearon dos vectores en los cuales se filtraron los datos de temperatura y salinidad, utilizando la especie Melongena patula (MEL_PAT), Costa Rica como sitio y 2019 como año. A cada uno se le aplicó la prueba de normalidad de Shapiro con un nivel de confianza de 95%, para establecer si los datos presentaban normalidad. Posteriormente se realizó una prueba de correlación siguiendo el método de Spearman, al igual que en la primera correlación se graficaron los resultados obtenidos.
Por ultimo, con el fin de poder representar un modelo de regresión entre las variables de temperatura y salinidad, se tomaron en examen los datos producto de la investigación pertenecientes a la especie Titanostrombus galeatus (TIT_GAL) en Costa Rica correspondientes al año 2019. Se crearon dos vectores denominados “temperatura” y “salinidad”, se creó un data.frame que incluyera los dos vectores y se formuló una regresión de salinidad versus temperatura. Para poder definir si los datos escogidos podían ser utilizados en una regresión, se procedió a realizar las pruebas de supuestos.La primera prueba realizada fue la de correlación de errores, seguida de la prueba de normalidad de los residuos y por último la prueba de homocedasticidad. Finalmente, una vez obtenidos los resultados necesarios, se procedió a generar un gráfico de regresión que relacionara las variables en examen. Adicionalmente se hizo una predicción para calcular la salinidad del agua, utilizando la ecuación de la recta obtenida con la regresión.
En la primera correlación, según los resultados de la prueba de normalidad de Shapiro, ambos vectores fueron asimétricos, ya que, para abundancia se obtuvo un p.value <0.05 y para talla su p.value fue <0.05, después de aplicar la prueba de correlación, siguiendo el método de Spearman. Se obtuvo lo siguiente: rho=-0.2657506, este nos indica el coeficiente de correlación, el cual es negativo y débil por su cercanía a cero, con un p-value <0.05, siendo esta significativa (Ver Figura 1).
Figura 1: Correlación entre abundancia y talla
Para la segunda correlación, en las pruebas de normalidad las dos variable fueron asimétricas con un p-value <0.05 para la temperatura y un p-value <0.05 para la salinidad. En la prueba de correlacion se obtuvo un p-value < 0.05, un coeficiente de correlación de -0.7736038 por lo cual se puede afirmar que las variables presentaron una correlacion negativa fuerte y significativa, en la cual conforme aumentó la temperatura disminuyó la salinidad (Ver Figura 2).
Figura 2: Correlación entre salinidad y temperatura
Las pruebas de supuestos permitieron utilizar los datos, ya que no presentaban correlación de errores (p-value > 0.05), los residuos seguían una distribución normal (p-value > 0.05) y resultaron presentar homocedasticidad (p-value > 0.05).Por medio de “summary” se pudo establecer la ecuación de la recta que resultó corresponder a salinidad = -0.84776*temperatura + 56.18304 con la cual se pudo simular una predicción basandonos en una temperatura de 20°C,que sustituida a la variable independiente X (temperatura) nos brindó un valor de la variable dependiente y (salinidad) de 39.22784 g/L. La gráfica obtenida relaciona las variables temperatura Y salinidad de forma inversamente proporcional, esto implica que a mayor temperatura, menor concentración de sal en el medio acuoso (Ver Figura 3). Esto pareció ser el opuesto de lo planteado y probablemente se debe a la naturaleza de los datos, ya que se inventaron y es posible que no correspondan a las verdaderas características químico-físicas de las áreas de investigación.
Figura 3: Regresión entre salinidad y temperatura
library(readxl)
library(PerformanceAnalytics)
library(lmtest)
library(visreg)
basedatos <- read_excel("Data/BD_Gasteropoda.xlsx", sheet = "Muestreo")
Correlaciones
#1
abundancia<-c(basedatos$Abundancia[basedatos$Especies=="MEL_PAT" & basedatos$Sitio== "CR" & basedatos$Anio==2019])
abundancia
talla<-c(basedatos$Talla[basedatos$Especies=="MEL_PAT" & basedatos$Sitio== "CR" & basedatos$Anio==2019])
talla
shapiro.test(abundancia)
shapiro.test(talla)
cor.test(abundancia,talla,method="spearman")
graf1<- data.frame(abundancia,talla)
chart.Correlation(graf1,method = "spearman")
#2
temperatura<-c(basedatos$Temperatura[basedatos$Especies=="MEL_PAT" & basedatos$Sitio== "CR" & basedatos$Anio==2019])
temperatura
salinidad<-c(basedatos$Salinidad[basedatos$Especies=="MEL_PAT" & basedatos$Sitio== "CR" & basedatos$Anio==2019])
salinidad
shapiro.test(temperatura)
shapiro.test(salinidad)
cor.test(temperatura,salinidad,method="spearman")
chart.Correlation(matriz, method = "spearman")
#regresion
temperatura<-c(basedatos$Temperatura[basedatos$Especies=="TIT_GAL" & basedatos$Sitio== "CR" & basedatos$Anio==2019])
salinidad<-c(basedatos$Salinidad[basedatos$Especies=="TIT_GAL" & basedatos$Sitio== "CR" & basedatos$Anio==2019])
regresion1<-data.frame(temperatura,salinidad)
regresion1
model<-lm(salinidad~temperatura)
dwtest(model)
shapiro.test(model$residuals)
ncvTest(model)
summary(model)
mean(basedatos$Salinidad)
mean(basedatos$Temperatura)
-0.84776*20+56.18304
visreg(model, xlab="temperatura (°C)", ylab="salinidad (g/L)")