Correlación y regresión

Metodología

Para el debido análisis estadístico se utilizó como herramienta la versión 1.3.1056 de RStudio.

Identificación de correlaciones: Se buscó una correlación para lograr explicar si existe o no relación entre abundancia-temperatura, abdomen-actividad y alas-actividad donde se vectorizan los datos para luego aplicar pruebas shapiro, estas para determinar la simetría de los datos. Seguidamente se sometieron ambos vectores a un cor.test utilizando Spearman ya que las variables de las 3 pruebas presentaron asimetría . A partir de la prueba cor.test se determinó si existía o no correlación en los datos.

Observación de regresiones a partir de modelos de regresión lineal: Se estableció un modelo de regresión lineal para predecir la abundancia esperada de las especies a una temperatura ambiente de 30ºC y 17.5ºC. Haciendo uso del comando lm para la regresión de las variables, después se procedió a realizar los supuestos de la prueba con los comandos: dwtest, dentro del paquete preinstalado lmtest, para la autocorrelación de errores, una prueba de shapiro para la normalidad de los residuos y ncvTest, del paquete car, para determinar la homocedasticidad; posteriormente se realizó un summary para observar la pendiente e intersección del modelo. Finalmente se procedió a graficar para la regresión con el programa visreg, con el comando con el mismo nombre.

Resultados e interpretación

Correlación

Para el análisis entre los vectores de abundancia y temperatura se obtuvo un p-value=2.2e-16 indicando la existencia de correlación, el coeficiente de correlación (rho) fue de 0.2074404 y de determinación 0.04303152, mostrando una correlación positiva débil al 4.30%. (Figura 1)

Figura 1. Gráfico de correlación Abundancia-Temperatura.

Sobre los vectores abdomen y porcentaje de actividad se interpretó un p-value= 9.947e-15 lo que indica la existencia de correlación entre los datos, el coeficiente de correlación (rho) fue de 0.1753824 y de determinación 0.03075899, arrojando una correlación positiva débil al 3,07%. (Figura 2)

Figura 2. Gráfico de correlación Abdomen-Porcentaje de actividad.

Finalmente a partir de la interpretación de los vectores largo máximo de alas y porcentaje de actividad se obtuvo un p-value=1.005e-10, el coeficiente de correlación (rho) fue de 0.1468641 y de determinación 0.02156906, resultando una correlación positiva débil al 2,15%. (Figura 3)

Figura 3. Gráfico de correlación Largo máximo de alas-Porcentaje de actividad.

Regresión

En el análisis de los supuestos del modelo de regresión lineal no se presentó autocorrelación de errores, la prueba arrojó un p-value de 0.7735, la normalidad de los residuos y la homocedasticidad no se cumplen, el p-value obtenido fue de 2.2e-16 para ambas pruebas. Se obtiene, al aplicar el summary al modelo, un p-value de 2.2e-16, una pendiente de 1.06937 y una intersección de -7.26490, donde se deriva la ecuación para determinar la abundancia a cierta temperatura (N= 1.07* temp -7.26). Para una temperatura de 30ºC se predice una abundancia de 25 individuos y para una temperatura de 17.5 de 11 individuos, aproximadamente. Lo cual indica que a mayor temperatura, la abundancia de las especies será mayor. (Figura 4)

Figura 4. Modelo de regresión lineal de la abundancia respecto a la temperatura.