En este estudio, se busca analizar diversas hipótesis que nos permitan entender si existe algún tipo de correlación entre las características morfológicas de las cangrejas, como la presencia o ausencia de satélites. Por un lado, se espera que las hembras que presentan un mayor tamaño tengan una mayor cantidad de satélites; sin embargo, a lo largo del proyecto se irán planteando diversas hipótesis.
Para poder cumplir con nuestro objetivo, se realizarán diversas pruebas estadísticas que nos ayuden a confirmar o descartar la relación entre las características morfológicas de las cangrejas y la presencia de satélites. Esta información es valiosa, ya que nos permite entender cómo diversos rasgos morfológicos influyen en el comportamiento y la reproducción de una población de cangrejos.
El objetivo de este proyecto es evaluar y analizar la relación que pueda existir con la presencia o ausencia de satélites.
La base de datos utilizada en este proyecto nos brinda información morfológica sobre cangrejas, proporcionando así diferentes variables relacionadas con su peso, ancho, color, espinas, etc. Con esta información, se busca evaluar las diferentes relaciones o dependencias que puedan existir entre algunas de las variables. Gracias a esto, podremos evaluar las diferentes hipótesis planteadas con ayuda de pruebas estadísticas.
library(readxl)
Base_de_datos_ejercicio <- read_excel("C:/Users/LETIZIA/Documents/Bioestadística/Base de datos ejercicio.xlsx",
col_types = c("numeric", "numeric", "numeric",
"numeric", "text", "text", "numeric"))
head(Base_de_datos_ejercicio)
require(table1)
table1(~Satellites>0,data=Base_de_datos_ejercicio)
| Overall (N=173) |
|
|---|---|
| Satellites > 0 | |
| Yes | 111 (64.2%) |
| No | 62 (35.8%) |
Descrición: Se observa en la tabla que el 64.2% de los cangrejos tienen satélites, mientras que un 35.8% no. Por lo tanto, se comprueba esta hipótesis de prueba, indicando que las hembras tienen más satélites que las que no.
require(table1)
table1(~Satellites>0 |Spine, data=Base_de_datos_ejercicio)
| 1 (N=37) |
2 (N=15) |
3 (N=121) |
Overall (N=173) |
|
|---|---|---|---|---|
| Satellites > 0 | ||||
| Yes | 26 (70.3%) | 7 (46.7%) | 78 (64.5%) | 111 (64.2%) |
| No | 11 (29.7%) | 8 (53.3%) | 43 (35.5%) | 62 (35.8%) |
require(table1)
table1(~Satellites | Spine, data = Base_de_datos_ejercicio)
| 1 (N=37) |
2 (N=15) |
3 (N=121) |
Overall (N=173) |
|
|---|---|---|---|---|
| Satellites | ||||
| Mean (SD) | 3.65 (3.39) | 2.00 (2.36) | 2.81 (3.13) | 2.92 (3.15) |
| Median [Min, Max] | 4.00 [0, 14.0] | 0 [0, 6.00] | 2.00 [0, 15.0] | 2.00 [0, 15.0] |
Descripción: En la tabla se puede observar una diferencia entre las proporciones, indicando así que las hembras con mejores espinas pueden llegar a atraer más satélites. Sin embargo, las variaciones que se observan pueden indicar un factor externo que también podría estar influyendo, pero realmente no se observa una relación significativa.
En la primera tabla se puede observar que la condición de las espinas se encuentra ligada a la presencia de satélites, ya que en el grupo número uno los resultados indican una mayor cantidad de hembras con satélites, mostrando así la proporción de hembras en cada uno de los grupos con al menos un satélite. En la segunda tabla se puede ver la distribución del número de satélites; el primer grupo de hembras también tiene la mayor media y mediana, reforzando así la hipótesis planteada.
Base_de_datos_ejercicio$Color_recode <- factor(Base_de_datos_ejercicio$Color,
labels=c("Muy claro","Claro", "Oscuro", "Muy oscuro"),
levels=c("1", "2", "3", "4"))
table1(~Satellites | Color_recode, data=Base_de_datos_ejercicio)
| Muy claro (N=12) |
Claro (N=95) |
Oscuro (N=44) |
Muy oscuro (N=22) |
Overall (N=173) |
|
|---|---|---|---|---|---|
| Satellites | |||||
| Mean (SD) | 4.08 (3.12) | 3.29 (3.21) | 2.23 (2.60) | 2.05 (3.62) | 2.92 (3.15) |
| Median [Min, Max] | 4.50 [0, 9.00] | 3.00 [0, 15.0] | 1.00 [0, 10.0] | 0 [0, 12.0] | 2.00 [0, 15.0] |
Descrición: En estos resultados se puede observar que las hembras con un color más claro, por lo general, tienen más satélites, contradiciendo así la hipótesis planteada inicialmente. Por lo tanto, entre más oscuro sea el color de las hembras, menor será la cantidad de satélites que presenten.
Base_de_datos_ejercicio$peso_code=cut(Base_de_datos_ejercicio$Weight,breaks=c(0,2000,4000,6000), labels=c("Liviano", "Medio","Pesado"))
table1(~Satellites | peso_code, data = Base_de_datos_ejercicio)
| Liviano (N=46) |
Medio (N=126) |
Pesado (N=1) |
Overall (N=173) |
|
|---|---|---|---|---|
| Satellites | ||||
| Mean (SD) | 1.43 (2.39) | 3.43 (3.22) | 7.00 (NA) | 2.92 (3.15) |
| Median [Min, Max] | 0 [0, 10.0] | 3.00 [0, 15.0] | 7.00 [7.00, 7.00] | 2.00 [0, 15.0] |
require(ggplot2)
g1=ggplot(aes(x=Weight, y=Satellites, colour= Satellites), data=Base_de_datos_ejercicio)+ geom_point()+geom_smooth(method="lm")+theme_bw()
require(plotly)
ggplotly(g1)
resultado_correlacion <- cor(Base_de_datos_ejercicio$Satellites, Base_de_datos_ejercicio$Weight)
print(paste("El coeficiente de correlación entre Satélites y peso es:", resultado_correlacion))
## [1] "El coeficiente de correlación entre Satélites y peso es: 0.369247440436737"
Descripción: En el gráfico se puede observar una comparación entre las categorías de peso y número de satélites, permitiendo evidenciar así que el incremento en la cantidad de satélites está relacionado con el aumento de peso en las hembras. (Entre más intenso sea el color, menor será la cantidad de satélites, y entre más claro sea, mayor será la cantidad de satélites). Esto se relaciona con los resultados obtenidos en las tablas, confirmando así que, aunque los satélites se observen en mayor proporción en hembras con más peso, hay una dispersión de datos.
Por otro lado, el coeficiente de correlación nos indica que existe una relación positiva moderada entre las variables evaluadas. Dado que el valor no es cercano a uno, podemos suponer que la relación no es perfecta.
tiene_satelites=Base_de_datos_ejercicio$Satellites>0
tamaño_mayor_mediana=Base_de_datos_ejercicio$Width>median(Base_de_datos_ejercicio$Width)
Base_de_datos_ejercicio2=data.frame(tiene_satelites, tamaño_mayor_mediana)
table1(~tiene_satelites | tamaño_mayor_mediana, data=Base_de_datos_ejercicio2)
| FALSE (N=87) |
TRUE (N=86) |
Overall (N=173) |
|
|---|---|---|---|
| tiene_satelites | |||
| Yes | 43 (49.4%) | 68 (79.1%) | 111 (64.2%) |
| No | 44 (50.6%) | 18 (20.9%) | 62 (35.8%) |
Descripción: Los resultados de esta prueba aprueban la hipótesis planteada, ya que la diferencia en proporciones puede indicar una relación entre las variables trabajadas, entendiendo así que las hembras que son más grandes tienen más satélites.
Los resultados de este proyecto nos indican que ciertas características morfológicas de las hembras se encuentran relacionadas con la presencia de satélites. El tamaño y el peso juegan un papel clave en la atracción de los satélites, pero la variabilidad presente en los datos nos permiten evidencias que hay otros factores que también podrían estar involucrados.
Por otro lado, es posible que factores ambientales, de comportamiento ou otros estén afectando la relación entre las características físicas de la hembras y la presencia de satélites. En futuras investigaciones, es importante tener en cuenta otros aspectos y utilizar métodos adicionales que puedan permitir evaluar con mayor precisión las variables que influyen en la reproducción de la especie.