Introducción

En esta práctica se hará uso de una base de datos contemporánea procedente de dos panteones de la Ciudad de México: San Nicolas Tolentino y San Lorenzo Tezonco.

setwd("~/Metodos_cuantitativos_sua")
##Abriendo paquete pacman
library(pacman)
## El archivo esta en formato SPSS, lo abrimos mediante la libreria haven
p_load(haven,dplyr,ggplot2,MASS)
p_load(tinytex)
Hombro <- read_sav("Datos hombro.sav")
## Definimos como factor la variable sexoN
Hombro$sexoN <- factor(Hombro$sexoN,
                       levels = c(2, 1),
                       labels = c("Mujer", "Hombre"))
table (Hombro$sexoN)  ## Frecuencias de sexo
## 
##  Mujer Hombre 
##     30     50

Podemos observar que la muestra consta de 80 individuos de los cuales 50 son hombres y 30 mujeres

Estadística descriptiva

Empezemos con la estadística descriptiva, para resumir por sexo la información de Longitud Máxima del húmero derecho

 res_dmhd <- Hombro %>%
          group_by(sexoN) %>%
          summarise(
            n       = sum(!is.na(LMHD)),
            media   = mean(LMHD, na.rm = TRUE),
            sd      = sd(LMHD, na.rm = TRUE)
          ) %>%
          mutate(across(c(media, sd), ~round(.x, 2)))
        res_dmhd
## # A tibble: 2 × 4
##   sexoN      n media    sd
##   <fct>  <int> <dbl> <dbl>
## 1 Mujer     26  283.  15.7
## 2 Hombre    43  312.  13.9

De la tabla anterior observamos que en ambos sexos hay datos perdidos en la variable Longuitud Máxima del húmero derecho. También se vislumbra que los hombres tienen valores mayores que las mujeres

Ahora veremos el caso de la Altura biomecánica del húmero

res_abhd <- Hombro %>%
          group_by(sexoN) %>%
          summarise(
            n       = sum(!is.na(ABHD)),
            media   = mean(ABHD, na.rm = TRUE),
            sd      = sd(ABHD, na.rm = TRUE)
          ) %>%
          mutate(across(c(media, sd), ~round(.x, 2)))
        res_abhd
## # A tibble: 2 × 4
##   sexoN      n media    sd
##   <fct>  <int> <dbl> <dbl>
## 1 Mujer     26  279.  14.7
## 2 Hombre    41  308.  13.6

observamos que en este caso de la tabla anterior observamos que en ambos sexos hay datos perdidos en la variable Altura biomecánica del húmero. También se vislumbra que los hombres tienen valores mayores que las mujeres

REalizaremos una grafica comparativa de longuitud máxima del húmero derercho por Sexo

  ggplot(Hombro, aes(x = LMHD, fill = sexoN)) +
          geom_density(alpha = 0.5) +
          labs(
            title = "Gráfica 1. Longitud máxima del húmero derecho por sexo",
            x = "Longitud máxima del húmero derecho (mm)",
            y = "Densidad"
          ) +
          theme_minimal()
## Warning: Removed 11 rows containing non-finite outside the scale range
## (`stat_density()`).

Otra gráfica, ahora de caja
  ggplot(Hombro, aes(x = sexoN, y = LMHD, fill = sexoN)) +
          geom_boxplot(alpha = 0.7) +
          labs(
            title = "Longitud máxima del húmero derecho",
            x = "Sexo",
            y = " "
          ) +
          theme_minimal()
## Warning: Removed 11 rows containing non-finite outside the scale range
## (`stat_boxplot()`).

calcular la d de cohen
    p_load(effsize)
        # Comparar  entre hombres y mujeres
        cohen.d(Hombro$LMHD, Hombro$sexoN,na.rm = TRUE)
## 
## Cohen's d
## 
## d estimate: -2.031314 (large)
## 95 percent confidence interval:
##     lower     upper 
## -2.635474 -1.427154
Realizaremos la prueba t para comparar las medias
 ## Realizaremos la prueba t para comparar las medias
        t.test(LMHD ~ sexoN, data = Hombro, var.equal = TRUE)
## 
##  Two Sample t-test
## 
## data:  LMHD by sexoN
## t = -8.1766, df = 67, p-value = 1.156e-11
## alternative hypothesis: true difference in means between group Mujer and group Hombre is not equal to 0
## 95 percent confidence interval:
##  -36.86178 -22.39620
## sample estimates:
##  mean in group Mujer mean in group Hombre 
##             282.5998             312.2288
        t.test(LMHD ~ sexoN, data = Hombro, var.equal = FALSE)
## 
##  Welch Two Sample t-test
## 
## data:  LMHD by sexoN
## t = -7.9259, df = 47.778, p-value = 2.941e-10
## alternative hypothesis: true difference in means between group Mujer and group Hombre is not equal to 0
## 95 percent confidence interval:
##  -37.14616 -22.11183
## sample estimates:
##  mean in group Mujer mean in group Hombre 
##             282.5998             312.2288
        ## la alternativa no paramétrica
        wilcox.test(LMHD ~ sexoN, data = Hombro)
## Warning in wilcox.test.default(x = DATA[[1L]], y = DATA[[2L]], ...): cannot
## compute exact p-value with ties
## 
##  Wilcoxon rank sum test with continuity correction
## 
## data:  LMHD by sexoN
## W = 81, p-value = 3.344e-09
## alternative hypothesis: true location shift is not equal to 0

cuando las varianas son iguales =Ho cuando son difererntes Ha Pueba de homogeneidad de varianzas

Supuesto de normalidad, prueba de Shapiro-Wilk
  by(Hombro$LMHD, Hombro$sexoN, shapiro.test)
## Hombro$sexoN: Mujer
## 
##  Shapiro-Wilk normality test
## 
## data:  dd[x, ]
## W = 0.98209, p-value = 0.9149
## 
## ------------------------------------------------------------ 
## Hombro$sexoN: Hombre
## 
##  Shapiro-Wilk normality test
## 
## data:  dd[x, ]
## W = 0.98631, p-value = 0.8811

p-valuehombre=0.8811 es mayor a 0.05 por lo que se asume distribucion nomrmalp-valuemujer=0.9149 es mayor a 0.05 por lo que se asume distribucion normal Ambos grupos se asume distribucion normal por lo que se realiza prueba t-student

Supuesto de homogeneidad de varianza
  var.test(LMHD ~ sexoN, data = Hombro)
## 
##  F test to compare two variances
## 
## data:  LMHD by sexoN
## F = 1.2843, num df = 25, denom df = 42, p-value = 0.4642
## alternative hypothesis: true ratio of variances is not equal to 1
## 95 percent confidence interval:
##  0.6498778 2.7084863
## sample estimates:
## ratio of variances 
##           1.284277

0.4642 es mayor a 0.05, no se rechaza Ho, se asume igualdad de las varianzas Asumiendo varianzas iguales, pruebas t

P-VALUE 1.156e-11 P<0.05 por lo que se rechaza H0, las medias de hombre y mujeres son significativas