Introducción

La base de datos contiene información sobre un estudio de una poblacion de cangrejos. en este contexto, se pretende hacer un analisis del fitness de las hembras evaluado en la cantidad de satelites (machos) que son atraidos por diferentes caracteristicas morfologicas que pueden influir en la seleccion sexual como lo son la condicion de espinas, el color y el peso.

Los datos dados sobre este estudio proporciona informacion detallada sobre estas variables, permitiendo el analisis descriptivo y exploratorio para evaluar cada una de las hipotesis especificas. entre las hipotesis planteadas se encunetran: 1) se espera mayor porcentaje de hembras con satelites. 2)Se espera mayor porcentaje de hembras con satelites este relacionada con la condicion de las espinas. 3) aumento del porcentaje de hembras con satelites relacionado con el color. 4) existe una relacion entre el peso de las hembras y la presencia de satiles, ¿entre mas peso tengan, mayor porcentaje de satalites? 5)Se espera una relación entre la presencia o no de satelites este relacionado.

Con el fin de abortar estas hipotesis se han empleado herramientas estadisticas como tablas de frecuencia, recodificacion de variables y analis de correlacion con el objetivo de explorar patrones y relaciones entre los datos, proporcionando una base solida para la interpretacion de los resultados obtenidos.

##Cargar la base desde linea 

library(readxl)
Datos_ejemplo <- read_excel("~/Documents/Datos ejemplo.xlsx", 
                            col_types = c("numeric","numeric","numeric",
                                          "numeric","text","text","numeric"))

H1:

Se espera mayor porcentaje de hembras con satelites que las que no la tienen

Opc1. descriptiva
require(table1)
## Loading required package: table1
## 
## Attaching package: 'table1'
## The following objects are masked from 'package:base':
## 
##     units, units<-
table1 (~Satelites>0,data=Datos_ejemplo)
Overall
(N=173)
Satelites > 0
Yes 111 (64.2%)
No 62 (35.8%)
head(Datos_ejemplo)
Crab Satelites Weight Wudth Color Spine Y
1 8 3050 28.3 2 3 1
2 0 1550 22.5 3 3 0
3 9 2300 26.0 1 1 1
4 0 2100 24.8 3 3 0
5 4 2600 26.0 3 3 1
6 0 2100 23.8 2 3 0

Interpretacion:

Al analizar la anterior tabla, los resultados confirman la Hipótesis 1, pues el 64.2% de los individuos tienen satélites, mientras que solo el 35.8% carecen de estos. dicha distribución indica una mayor presencia de satélites, lo cual respalda la tendencia de las hembras al asociarse más frecuentemente con estos.

H2:

Se espera que el porcentaje de hembras con satelites este relacionada con la condicion de las espinas (Mejor calidad mas satelites)

Opc1. descriptiva

table(Datos_ejemplo$Satelites>0, Datos_ejemplo$Spine)
##        
##          1  2  3
##   FALSE 11  8 43
##   TRUE  26  7 78
table1(~Satelites>0 | Spine, data=Datos_ejemplo)
1
(N=37)
2
(N=15)
3
(N=121)
Overall
(N=173)
Satelites > 0
Yes 26 (70.3%) 7 (46.7%) 78 (64.5%) 111 (64.2%)
No 11 (29.7%) 8 (53.3%) 43 (35.5%) 62 (35.8%)
table1(~Satelites | Spine, data=Datos_ejemplo)
1
(N=37)
2
(N=15)
3
(N=121)
Overall
(N=173)
Satelites
Mean (SD) 3.65 (3.39) 2.00 (2.36) 2.81 (3.13) 2.92 (3.15)
Median [Min, Max] 4.00 [0, 14.0] 0 [0, 6.00] 2.00 [0, 15.0] 2.00 [0, 15.0]

Interpretacion:

Con el análisis de la anterior tabla se aceptaría parcialmente la Hipótesis 2, sin embargo la evidencia no es concluyente. Ya que inicialmente, los datos muestran una disminución en la cantidad de satélites del Grupo 1 (70.3%) al Grupo 2 (46.7%), sugiriendo asi una posible relación respecto a la calidad de las espinas. Sin embargo, en el último grupo se presento un aumento repentino de la media, interrumpiendo asi la tendencia a la baja.

H3:

Se espera que el porcentaje de hembras con satelites esta relacionada con el color (mas oscura mas satelites)?

table1(~Satelites | Color, data=Datos_ejemplo)
1
(N=12)
2
(N=95)
3
(N=44)
4
(N=22)
Overall
(N=173)
Satelites
Mean (SD) 4.08 (3.12) 3.29 (3.21) 2.23 (2.60) 2.05 (3.62) 2.92 (3.15)
Median [Min, Max] 4.50 [0, 9.00] 3.00 [0, 15.0] 1.00 [0, 10.0] 0 [0, 12.0] 2.00 [0, 15.0]

Recodificar los niveles de un factor

Datos_ejemplo$Color_recode <- factor(Datos_ejemplo$Color,
                                            labels = c("muy claro", "claro", "oscuro", "muy oscuro"),
                                     levels = c("1", "2", "3", "4"))
                            
  table1(~Satelites | Color_recode, data= Datos_ejemplo)
muy claro
(N=12)
claro
(N=95)
oscuro
(N=44)
muy oscuro
(N=22)
Overall
(N=173)
Satelites
Mean (SD) 4.08 (3.12) 3.29 (3.21) 2.23 (2.60) 2.05 (3.62) 2.92 (3.15)
Median [Min, Max] 4.50 [0, 9.00] 3.00 [0, 15.0] 1.00 [0, 10.0] 0 [0, 12.0] 2.00 [0, 15.0]

Interpretacion:

Al analizar la variación de los satélites según el color no se aceptaría la Hipótesis 3. Debido a que los individuos con tonos más claros presentan una mayor cantidad de satélites, en comparación a los más oscuros que muestran menos. Lo cual sugiere una relación lineal negativa, es decir, que entre mas oscuro menos satélites presenta.

H4:

Se espera una relacion entre la cantidad de satelites y el peso (Mas peso mas satelites)??

Opc1

require(ggplot2)
g1=ggplot(aes(x=Weight, y=Satelites), data = Datos_ejemplo)+
  geom_point()+ geom_smooth(method = "lm")+ theme_bw()

cor(Datos_ejemplo$Satelites, Datos_ejemplo$Weight)
## [1] 0.3692474
require(plotly)
ggplotly(g1)

Opc2

cut(Datos_ejemplo$Weight, breaks = c(0,2000,4000,6000), labels = c("liviano", "medio", "pesado"))
##   [1] medio   liviano medio   medio   medio   medio   medio   liviano liviano
##  [10] medio   medio   medio   medio   liviano medio   medio   liviano medio  
##  [19] medio   medio   liviano medio   liviano medio   liviano liviano medio  
##  [28] medio   medio   medio   medio   medio   liviano liviano medio   liviano
##  [37] medio   medio   liviano medio   medio   medio   medio   medio   medio  
##  [46] medio   medio   medio   medio   medio   medio   medio   medio   liviano
##  [55] liviano medio   medio   medio   medio   medio   medio   medio   medio  
##  [64] medio   medio   medio   medio   medio   liviano medio   medio   liviano
##  [73] liviano medio   liviano liviano medio   medio   liviano medio   medio  
##  [82] medio   liviano medio   medio   medio   medio   medio   liviano liviano
##  [91] medio   medio   medio   medio   liviano medio   medio   liviano medio  
## [100] medio   medio   liviano medio   medio   liviano medio   medio   medio  
## [109] liviano medio   medio   medio   medio   medio   medio   liviano medio  
## [118] liviano medio   medio   liviano medio   medio   liviano medio   medio  
## [127] medio   liviano medio   medio   liviano liviano medio   medio   medio  
## [136] medio   medio   medio   medio   medio   pesado  medio   medio   liviano
## [145] medio   medio   medio   medio   liviano medio   medio   medio   liviano
## [154] liviano liviano liviano medio   liviano liviano medio   medio   medio  
## [163] medio   medio   medio   medio   liviano medio   medio   medio   medio  
## [172] medio   liviano
## Levels: liviano medio pesado
Datos_ejemplo$peso_code=cut(Datos_ejemplo$Weight, breaks = c(0,2000,4000,6000), labels = c("liviano", "medio", "pesado"))
table1(~Satelites | peso_code, data= Datos_ejemplo)
liviano
(N=46)
medio
(N=126)
pesado
(N=1)
Overall
(N=173)
Satelites
Mean (SD) 1.43 (2.39) 3.43 (3.22) 7.00 (NA) 2.92 (3.15)
Median [Min, Max] 0 [0, 10.0] 3.00 [0, 15.0] 7.00 [7.00, 7.00] 2.00 [0, 15.0]

Interpretacion:

Al analizar el grafico y la tabla nos encontramos con que los datos respaldan la hipótesis 4, mostrando una relación positiva entre la variable peso de los objetos y la cantidad de satélites asociados a ellos. Esto sugiere que, en general, a mayor, mayor es la cantidad de satélites que los acompañan.

H5:

Se espera una relación entre la presencia o no de satelites este relacionado

con los cangrejos con un tamaño (Ancho) mayor a la mediana?

V1=Binaria: Tiene o no satelites

V2=Binaria: Es mayor o no de la media del tamaño

tiene_satelites=Datos_ejemplo$Satelites>0
tamaño_mayor_mediana=Datos_ejemplo$Wudth>median(Datos_ejemplo$Wudth)

Datos_ejemplo2=data.frame(tiene_satelites, tamaño_mayor_mediana)

table1(~tiene_satelites | tamaño_mayor_mediana, data = Datos_ejemplo2)
FALSE
(N=87)
TRUE
(N=86)
Overall
(N=173)
tiene_satelites
Yes 43 (49.4%) 68 (79.1%) 111 (64.2%)
No 44 (50.6%) 18 (20.9%) 62 (35.8%)

Interpretacion:

Al analizar la tabla nos encontramos con que hay una relación muy significativa (casi 1.4 veces más) entre la presencia de satélites en cangrejas con respecto a un mayor tamaño corporal.