La base de datos contiene información sobre un estudio de una poblacion de cangrejos. en este contexto, se pretende hacer un analisis del fitness de las hembras evaluado en la cantidad de satelites (machos) que son atraidos por diferentes caracteristicas morfologicas que pueden influir en la seleccion sexual como lo son la condicion de espinas, el color y el peso.
Los datos dados sobre este estudio proporciona informacion detallada sobre estas variables, permitiendo el analisis descriptivo y exploratorio para evaluar cada una de las hipotesis especificas. entre las hipotesis planteadas se encunetran: 1) se espera mayor porcentaje de hembras con satelites. 2)Se espera mayor porcentaje de hembras con satelites este relacionada con la condicion de las espinas. 3) aumento del porcentaje de hembras con satelites relacionado con el color. 4) existe una relacion entre el peso de las hembras y la presencia de satiles, ¿entre mas peso tengan, mayor porcentaje de satalites? 5)Se espera una relación entre la presencia o no de satelites este relacionado.
Con el fin de abortar estas hipotesis se han empleado herramientas estadisticas como tablas de frecuencia, recodificacion de variables y analis de correlacion con el objetivo de explorar patrones y relaciones entre los datos, proporcionando una base solida para la interpretacion de los resultados obtenidos.
##Cargar la base desde linea
library(readxl)
Datos_ejemplo <- read_excel("~/Documents/Datos ejemplo.xlsx",
col_types = c("numeric","numeric","numeric",
"numeric","text","text","numeric"))
Se espera mayor porcentaje de hembras con satelites que las que no la tienen
require(table1)
## Loading required package: table1
##
## Attaching package: 'table1'
## The following objects are masked from 'package:base':
##
## units, units<-
table1 (~Satelites>0,data=Datos_ejemplo)
| Overall (N=173) |
|
|---|---|
| Satelites > 0 | |
| Yes | 111 (64.2%) |
| No | 62 (35.8%) |
head(Datos_ejemplo)
| Crab | Satelites | Weight | Wudth | Color | Spine | Y |
|---|---|---|---|---|---|---|
| 1 | 8 | 3050 | 28.3 | 2 | 3 | 1 |
| 2 | 0 | 1550 | 22.5 | 3 | 3 | 0 |
| 3 | 9 | 2300 | 26.0 | 1 | 1 | 1 |
| 4 | 0 | 2100 | 24.8 | 3 | 3 | 0 |
| 5 | 4 | 2600 | 26.0 | 3 | 3 | 1 |
| 6 | 0 | 2100 | 23.8 | 2 | 3 | 0 |
Al analizar la anterior tabla, los resultados confirman la Hipótesis 1, pues el 64.2% de los individuos tienen satélites, mientras que solo el 35.8% carecen de estos. dicha distribución indica una mayor presencia de satélites, lo cual respalda la tendencia de las hembras al asociarse más frecuentemente con estos.
Se espera que el porcentaje de hembras con satelites este relacionada con la condicion de las espinas (Mejor calidad mas satelites)
table(Datos_ejemplo$Satelites>0, Datos_ejemplo$Spine)
##
## 1 2 3
## FALSE 11 8 43
## TRUE 26 7 78
table1(~Satelites>0 | Spine, data=Datos_ejemplo)
| 1 (N=37) |
2 (N=15) |
3 (N=121) |
Overall (N=173) |
|
|---|---|---|---|---|
| Satelites > 0 | ||||
| Yes | 26 (70.3%) | 7 (46.7%) | 78 (64.5%) | 111 (64.2%) |
| No | 11 (29.7%) | 8 (53.3%) | 43 (35.5%) | 62 (35.8%) |
table1(~Satelites | Spine, data=Datos_ejemplo)
| 1 (N=37) |
2 (N=15) |
3 (N=121) |
Overall (N=173) |
|
|---|---|---|---|---|
| Satelites | ||||
| Mean (SD) | 3.65 (3.39) | 2.00 (2.36) | 2.81 (3.13) | 2.92 (3.15) |
| Median [Min, Max] | 4.00 [0, 14.0] | 0 [0, 6.00] | 2.00 [0, 15.0] | 2.00 [0, 15.0] |
Con el análisis de la anterior tabla se aceptaría parcialmente la Hipótesis 2, sin embargo la evidencia no es concluyente. Ya que inicialmente, los datos muestran una disminución en la cantidad de satélites del Grupo 1 (70.3%) al Grupo 2 (46.7%), sugiriendo asi una posible relación respecto a la calidad de las espinas. Sin embargo, en el último grupo se presento un aumento repentino de la media, interrumpiendo asi la tendencia a la baja.
Se espera que el porcentaje de hembras con satelites esta relacionada con el color (mas oscura mas satelites)?
table1(~Satelites | Color, data=Datos_ejemplo)
| 1 (N=12) |
2 (N=95) |
3 (N=44) |
4 (N=22) |
Overall (N=173) |
|
|---|---|---|---|---|---|
| Satelites | |||||
| Mean (SD) | 4.08 (3.12) | 3.29 (3.21) | 2.23 (2.60) | 2.05 (3.62) | 2.92 (3.15) |
| Median [Min, Max] | 4.50 [0, 9.00] | 3.00 [0, 15.0] | 1.00 [0, 10.0] | 0 [0, 12.0] | 2.00 [0, 15.0] |
Datos_ejemplo$Color_recode <- factor(Datos_ejemplo$Color,
labels = c("muy claro", "claro", "oscuro", "muy oscuro"),
levels = c("1", "2", "3", "4"))
table1(~Satelites | Color_recode, data= Datos_ejemplo)
| muy claro (N=12) |
claro (N=95) |
oscuro (N=44) |
muy oscuro (N=22) |
Overall (N=173) |
|
|---|---|---|---|---|---|
| Satelites | |||||
| Mean (SD) | 4.08 (3.12) | 3.29 (3.21) | 2.23 (2.60) | 2.05 (3.62) | 2.92 (3.15) |
| Median [Min, Max] | 4.50 [0, 9.00] | 3.00 [0, 15.0] | 1.00 [0, 10.0] | 0 [0, 12.0] | 2.00 [0, 15.0] |
Al analizar la variación de los satélites según el color no se aceptaría la Hipótesis 3. Debido a que los individuos con tonos más claros presentan una mayor cantidad de satélites, en comparación a los más oscuros que muestran menos. Lo cual sugiere una relación lineal negativa, es decir, que entre mas oscuro menos satélites presenta.
Se espera una relacion entre la cantidad de satelites y el peso (Mas peso mas satelites)??
require(ggplot2)
g1=ggplot(aes(x=Weight, y=Satelites), data = Datos_ejemplo)+
geom_point()+ geom_smooth(method = "lm")+ theme_bw()
cor(Datos_ejemplo$Satelites, Datos_ejemplo$Weight)
## [1] 0.3692474
require(plotly)
ggplotly(g1)
cut(Datos_ejemplo$Weight, breaks = c(0,2000,4000,6000), labels = c("liviano", "medio", "pesado"))
## [1] medio liviano medio medio medio medio medio liviano liviano
## [10] medio medio medio medio liviano medio medio liviano medio
## [19] medio medio liviano medio liviano medio liviano liviano medio
## [28] medio medio medio medio medio liviano liviano medio liviano
## [37] medio medio liviano medio medio medio medio medio medio
## [46] medio medio medio medio medio medio medio medio liviano
## [55] liviano medio medio medio medio medio medio medio medio
## [64] medio medio medio medio medio liviano medio medio liviano
## [73] liviano medio liviano liviano medio medio liviano medio medio
## [82] medio liviano medio medio medio medio medio liviano liviano
## [91] medio medio medio medio liviano medio medio liviano medio
## [100] medio medio liviano medio medio liviano medio medio medio
## [109] liviano medio medio medio medio medio medio liviano medio
## [118] liviano medio medio liviano medio medio liviano medio medio
## [127] medio liviano medio medio liviano liviano medio medio medio
## [136] medio medio medio medio medio pesado medio medio liviano
## [145] medio medio medio medio liviano medio medio medio liviano
## [154] liviano liviano liviano medio liviano liviano medio medio medio
## [163] medio medio medio medio liviano medio medio medio medio
## [172] medio liviano
## Levels: liviano medio pesado
Datos_ejemplo$peso_code=cut(Datos_ejemplo$Weight, breaks = c(0,2000,4000,6000), labels = c("liviano", "medio", "pesado"))
table1(~Satelites | peso_code, data= Datos_ejemplo)
| liviano (N=46) |
medio (N=126) |
pesado (N=1) |
Overall (N=173) |
|
|---|---|---|---|---|
| Satelites | ||||
| Mean (SD) | 1.43 (2.39) | 3.43 (3.22) | 7.00 (NA) | 2.92 (3.15) |
| Median [Min, Max] | 0 [0, 10.0] | 3.00 [0, 15.0] | 7.00 [7.00, 7.00] | 2.00 [0, 15.0] |
Al analizar el grafico y la tabla nos encontramos con que los datos respaldan la hipótesis 4, mostrando una relación positiva entre la variable peso de los objetos y la cantidad de satélites asociados a ellos. Esto sugiere que, en general, a mayor, mayor es la cantidad de satélites que los acompañan.
Se espera una relación entre la presencia o no de satelites este relacionado
con los cangrejos con un tamaño (Ancho) mayor a la mediana?
V1=Binaria: Tiene o no satelites
V2=Binaria: Es mayor o no de la media del tamaño
tiene_satelites=Datos_ejemplo$Satelites>0
tamaño_mayor_mediana=Datos_ejemplo$Wudth>median(Datos_ejemplo$Wudth)
Datos_ejemplo2=data.frame(tiene_satelites, tamaño_mayor_mediana)
table1(~tiene_satelites | tamaño_mayor_mediana, data = Datos_ejemplo2)
| FALSE (N=87) |
TRUE (N=86) |
Overall (N=173) |
|
|---|---|---|---|
| tiene_satelites | |||
| Yes | 43 (49.4%) | 68 (79.1%) | 111 (64.2%) |
| No | 44 (50.6%) | 18 (20.9%) | 62 (35.8%) |
Al analizar la tabla nos encontramos con que hay una relación muy significativa (casi 1.4 veces más) entre la presencia de satélites en cangrejas con respecto a un mayor tamaño corporal.