Sobre Implicit Association Tests (IAT)

IAT: 0.15, 0.35, and 0.65 are considered small, medium, and large level of bias for individual scores.

Positive means bias towards arts / against Math.

Análise de uma replicação

iat = read_csv(here::here(params$arquivo_dados), col_types = "cccdc")
iat = iat %>% 
    mutate(sex = factor(sex, levels = c("m", "f"), ordered = TRUE))
glimpse(iat)
## Rows: 165
## Columns: 5
## $ session_id  <chr> "2435230", "2435236", "2435237", "2435239", "2435240", "24…
## $ referrer    <chr> "swpson", "swpson", "swpson", "swpson", "swpson", "swpson"…
## $ sex         <ord> f, f, m, f, f, f, f, f, f, f, f, f, f, m, f, f, f, f, f, f…
## $ d_art       <dbl> 0.39171550, 1.00715226, 0.26248436, 0.64749897, 0.58174417…
## $ iat_exclude <chr> "Include", "Include", "Include", "Include", "Include", "In…
iat %>%
    ggplot(aes(x = d_art, fill = sex, color = sex)) +
    geom_histogram(binwidth = .2, alpha = .4) +
    geom_rug() +
    facet_grid(sex ~ ., scales = "free_y") + 
    theme(legend.position = "None")

iat %>% 
    ggplot(aes(x = sex, y = d_art)) + 
    geom_quasirandom(width = .1)

iat %>% 
    ggplot(aes(x = sex, y = d_art)) + 
    geom_quasirandom(width = .1) + 
    stat_summary(geom = "point", fun.y = "mean", color = "red", size = 5)
## Warning: The `fun.y` argument of `stat_summary()` is deprecated as of ggplot2 3.3.0.
## ℹ Please use the `fun` argument instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.

Qual a diferença na amostra
iat %>% 
    group_by(sex) %>% 
    summarise(media = mean(d_art))
## # A tibble: 2 × 2
##   sex   media
##   <ord> <dbl>
## 1 m     0.238
## 2 f     0.508
agrupado = iat %>% 
        group_by(sex) %>% 
        summarise(media = mean(d_art))
    m = agrupado %>% filter(sex == "m") %>% pull(media)
    f = agrupado %>% filter(sex == "f") %>% pull(media)
m - f
## [1] -0.2696448

Comparação via ICs

library(boot)

theta <- function(d, i) {
    agrupado = d %>% 
        slice(i) %>% 
        group_by(sex) %>% 
        summarise(media = mean(d_art))
    m = agrupado %>% filter(sex == "m") %>% pull(media)
    f = agrupado %>% filter(sex == "f") %>% pull(media)
    m - f
}

booted <- boot(data = iat, 
               statistic = theta, 
               R = 2000)

ci = tidy(booted, 
          conf.level = .95,
          conf.method = "bca",
          conf.int = TRUE)

glimpse(ci)
## Rows: 1
## Columns: 5
## $ statistic <dbl> -0.2696448
## $ bias      <dbl> 0.001389071
## $ std.error <dbl> 0.08003634
## $ conf.low  <dbl> -0.4348024
## $ conf.high <dbl> -0.1168561
library(boot)

bootstrap <- function(data, statistic, R, ci_level = 0.95) {
  n <- nrow(data)
  replicates <- numeric(R)
  
  for (i in 1:R) {
    resample <- data[sample(n, replace = TRUE), ]
    replicates[i] <- statistic(resample)
  }
  
  # Cálculo das estatísticas resumidas
  boot_results <- list(
    statistic = replicates,
    bias = mean(replicates) - statistic(data),
    std.error = sd(replicates),
    conf.low = quantile(replicates, probs = (1 - ci_level) / 2),
    conf.high = quantile(replicates, probs = 1 - (1 - ci_level) / 2)
  )
  
  return(boot_results)
}

theta <- function(d, i) {
  resample <- d[i, ]
  agrupado <- resample %>%
    group_by(sex) %>%
    summarise(media = mean(d_art))
  
  m <- agrupado$media[agrupado$sex == "m"]
  f <- agrupado$media[agrupado$sex == "f"]
  
  m - f
}


booted <- bootstrap(data = iat, 
               statistic = theta, 
               R = 2000)
glimpse(booted)
## List of 5
##  $ statistic: num [1:2000] -0.251 -0.247 -0.302 -0.185 -0.361 ...
##  $ bias     : num 0.00121
##  $ std.error: num 0.0813
##  $ conf.low : Named num -0.427
##   ..- attr(*, "names")= chr "2.5%"
##  $ conf.high: Named num -0.111
##   ..- attr(*, "names")= chr "97.5%"
ci %>%
    ggplot(aes(
        x = "",
        y = statistic,
        ymin = conf.low,
        ymax = conf.high
    )) +
    geom_pointrange() +
    geom_point(size = 3) + 
    labs(x = "Diferença", 
         y = "IAT homens - mulheres")

p1 = iat %>% 
    ggplot(aes(x = sex, y = d_art)) +
    geom_quasirandom(width = .1) + 
    stat_summary(geom = "point", fun.y = "mean", color = "red", size = 5)

p2 = ci %>%
    ggplot(aes(
        x = "",
        y = statistic,
        ymin = conf.low,
        ymax = conf.high
    )) +
    geom_pointrange() +
    geom_point(size = 3) + 
    ylim(-1, 1) + 
    labs(x = "Diferença", 
         y = "IAT homens - mulheres")

grid.arrange(p1, p2, ncol = 2)

Conclusão

Bootstrap biblioteca

Considerando os dados de SWPSON, em média, as mulheres que participaram do experimento tiveram uma associação implícita (medida pelo IAT) com a matemárica negativa e fraca (média 0.508, desv. padrão 0.433, N = 112). Homens tiveram uma associação negativa com a matemática, portanto menor que a das mulheres (média 0.238, desv. padrão 0.515, N = 53). Houve portanto uma considerável diferença entre homens e mulheres (diferença das médias -0.270). Houve portanto uma considerável diferença entre homens e mulheres (diferença das médias = -0.2696448, 95% CI [-0.4259649, -0.1102534]). A partir desta amostra, estimamos que esses resultados sugerem que, em média, as mulheres apresentaram uma associação implícita menos favorável com a matemática em comparação aos homens. Além disso, a diferença observada entre os grupos foi estatisticamente significativa, indicando uma disparidade na associação implícita com a matemática entre homens e mulheres nessa amostra. A partir desta amostra, podemos estimar que, em geral, mulheres tendem a apresentar uma associação implícita menos positiva com a matemática do que os homens.


Bootstrap modificado

Considerando os dados de SWPSON, observamos que as mulheres que participaram do experimento apresentaram uma associação implícita negativa e fraca com a matemática (média 0.508, desvio padrão 0.433, N = 112). Por outro lado, os homens tiveram uma associação negativa com a matemática, sendo menor do que a das mulheres (média 0.238, desvio padrão 0.515, N = 53). Essa diferença entre homens e mulheres nas associações é considerável, com uma diferença média de -0.270.

Os resultados do bootstrap fornecem uma estimativa da diferença das médias entre homens e mulheres, juntamente com intervalos de confiança. Com base nos resultados obtidos (-0.2696448, 95% CI [-0.4259649, -0.1102534]), podemos interpretar os dados da seguinte forma:

  1. As mulheres têm uma associação negativa consideravelmente mais forte com a matemática em comparação aos homens. A diferença média estimada está entre -0.4259649 e -0.1102534 na escala IAT, o que indica uma associação negativa mais acentuada.

Em resumo, os resultados sugerem que existe uma diferença significativa entre homens e mulheres em relação às associações implícitas com a matemática. As mulheres demonstram uma associação negativa mais forte, indicando possíveis atitudes negativas em relação à matéria. Essa diferença é considerável e merece atenção ao discutir questões de gênero e envolvimento com a matemática.

Realize novas análises sobre IAT usando as abordagens a seguir

Realize a análise e compare as conclusões obtidas nos dois casos experimentados:

  1. bootstraps a partir de uma bibliotece (exemplo acima)
  2. bootstraps implementados por você (justifique o método de IC com bootstraps escolhido)