Análise de uma replicação

iat = read_csv(here::here(params$arquivo_dados), col_types = "cccdc")
iat = iat %>% 
    mutate(sex = factor(sex, levels = c("m", "f"), ordered = TRUE))
glimpse(iat)

## Rows: 267
## Columns: 5
## $ session_id  <chr> "2478783", "2478785", "2478786", "2478787", "2478789", "24…
## $ referrer    <chr> "lse", "lse", "lse", "lse", "lse", "lse", "lse", "lse", "l…
## $ sex         <ord> m, f, f, f, m, m, f, m, m, f, f, f, f, f, f, f, f, f, f, m…
## $ d_art       <dbl> 0.80543823, 0.31463632, 0.60437687, 0.32284672, 0.73121367…
## $ iat_exclude <chr> "Include", "Include", "Include", "Include", "Include", "In…

iat %>%
    ggplot(aes(x = d_art, fill = sex)) +
    geom_histogram(binwidth = .2, alpha = .5, color = "black") +
    geom_rug() +
    facet_grid(sex ~ ., scales = "free_y") + 
    theme(legend.position = "None")

iat %>% 
    ggplot(aes(x = sex, y = d_art)) + 
    geom_quasirandom(width = .1)

iat %>% 
    ggplot(aes(x = sex, y = d_art)) + 
    geom_quasirandom(width = .1) + 
    stat_summary(geom = "point", fun.y = "mean", color = "red", size = 5)

## Warning: The `fun.y` argument of `stat_summary()` is deprecated as of ggplot2 3.3.0.
## ℹ Please use the `fun` argument instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.

Qual a diferença na amostra

iat %>% 
    group_by(sex) %>% 
    summarise(
      media = mean(d_art),
      desvio_padrao = sd(d_art),
      N = n()
    )

## # A tibble: 2 × 4
##   sex   media desvio_padrao     N
##   <ord> <dbl>         <dbl> <int>
## 1 m     0.160         0.483    91
## 2 f     0.522         0.453   176

agrupado = iat %>% 
        group_by(sex) %>% 
        summarise(media = mean(d_art))
    m = agrupado %>% filter(sex == "m") %>% pull(media)
    f = agrupado %>% filter(sex == "f") %>% pull(media)
m - f

## [1] -0.3617526

Comparação via ICs

theta <- function(d, i) {
    agrupado = d %>% 
        slice(i) %>% 
        group_by(sex) %>% 
        summarise(media = mean(d_art))
    m = agrupado %>% filter(sex == "m") %>% pull(media)
    f = agrupado %>% filter(sex == "f") %>% pull(media)
    m - f
}

booted <- boot(data = iat, 
               statistic = theta, 
               R = 2000)

ci = tidy(booted, 
          conf.level = .95,
          conf.method = "bca",
          conf.int = TRUE)

glimpse(ci)

## Rows: 1
## Columns: 5
## $ statistic <dbl> -0.3617526
## $ bias      <dbl> 0.001594372
## $ std.error <dbl> 0.05986606
## $ conf.low  <dbl> -0.4929001
## $ conf.high <dbl> -0.2501878

ci %>%
    ggplot(aes(
        x = "",
        y = statistic,
        ymin = conf.low,
        ymax = conf.high
    )) +
    geom_pointrange() +
    geom_point(size = 3) + 
    labs(x = "Diferença", 
         y = "IAT homens - mulheres")

p1 = iat %>% 
    ggplot(aes(x = sex, y = d_art)) +
    geom_quasirandom(width = .1) + 
    stat_summary(geom = "point", fun.y = "mean", color = "red", size = 5)

p2 = ci %>%
    ggplot(aes(
        x = "",
        y = statistic,
        ymin = conf.low,
        ymax = conf.high
    )) +
    geom_pointrange() +
    geom_point(size = 3) + 
    ylim(-1, 1) + 
    labs(x = "Diferença", 
         y = "IAT homens - mulheres")

grid.arrange(p1, p2, ncol = 2)

Conclusão

Utilizando o Bootstrap a partir da biblioteca boot

Considerando os dados de LSE, em média, as mulheres que participaram do experimento tiveram uma associação implícita (medida pelo IAT) com a matemárica negativa e média (média 0.52, desv. padrão 0.45, N = 176). Homens tiveram uma associação positiva com a matemática, portanto maior que a das mulheres (média 0.16, desv. padrão 0.48, N = 91). Houve portanto uma considerável diferença entre homens e mulheres (diferença das médias -0.362, 95% CI [-0.487, -0.242]).

Implementação própria

O método de intervalo de confiança (IC) adotado na implementação própria será o método percentil, escolhido devido à sua simplicidade e robustez.

bootstrap <- function(data, B = 2000, alpha = 0.05) {
    diff_means <- numeric(B)
    
    for (i in 1:B) {
        boot_x <- data[sample(nrow(data), replace = TRUE), ]
        
        men_mean <- mean(boot_x$d_art[boot_x$sex == "m"])
        women_mean <- mean(boot_x$d_art[boot_x$sex == "f"])
        
        diff_means[i] <- men_mean - women_mean
    }
    
    statistic <- mean(diff_means)
    bias <- mean(diff_means) - mean(data$d_art[data$sex == "m"]) + mean(data$d_art[data$sex == "f"])
    std_error <- sd(diff_means)
    ci_boot <- quantile(diff_means, c(alpha / 2, 1 - alpha / 2))
    
    results <- tibble::tibble(
    statistic = statistic,
    bias = bias,
    std_error = std_error,
    conf.low = ci_boot[1],
    conf.high = ci_boot[2]
  )
    
    return(results)
}

ci_bootstrap = bootstrap(iat)
ci_bootstrap

## # A tibble: 1 × 5
##   statistic      bias std_error conf.low conf.high
##       <dbl>     <dbl>     <dbl>    <dbl>     <dbl>
## 1    -0.363 -0.000749    0.0606   -0.481    -0.246

ci_bootstrap %>%
    ggplot(aes(
        x = "",
        y = statistic,
        ymin = conf.low,
        ymax = conf.high
    )) +
    geom_pointrange() +
    geom_point(size = 3) + 
    labs(x = "Diferença", 
         y = "IAT homens - mulheres")

Conclusão

Em média, as mulheres que participaram do experimento tiveram uma associação implícita (medida pelo IAT) com a matemática negativa e média (média 0.52, desv. padrão 0.45, N = 176). Homens tiveram uma associação positiva com a matemática, portanto maior que a das mulheres (média 0.16, desv. padrão 0.48, N = 91). Houve portanto uma considerável diferença entre homens e mulheres (diferença das médias -0.361, 95% CI [-0.478, -0.239]). A partir desta amostra, estimamos que mulheres têm uma associação negativa moderadamente mais forte com a matemática, com uma diferença suficiente para indicar uma diferença nas atitudes implícitas entre os sexos.

Conclusões finais

Dada a diferença das médias nos dois métodos -0.362 (biblioteca boot) versus -0.361 (implementação própria) e ICs semelhantes [-0.487, -0.242] (biblioteca boot) versus [-0.478, -0.239] (implementação própria), conclui-se que as diferenças entre os métodos são mínimas e não impactam significativamente a conclusão geral.

Dito isso, ambas as análises indicam que mulheres têm uma associação negativa moderadamente mais forte comparado aos homens, o que evidencia uma diferença suficiente para sugerir que, no contexto da LSE, os homens tendem a preferir matemática em detrimento das artes.

Análise de uma replicação

Sobre IAT

Análise de uma replicação

Qual a diferença na amostra

Comparação via ICs

Conclusão

Implementação própria

Conclusão

Conclusões finais