Análise de uma replicação

iat = read_csv(here::here(params$arquivo_dados), col_types = "cccdc")
iat = iat %>% 
    mutate(sex = factor(sex, levels = c("m", "f"), ordered = TRUE))
glimpse(iat)

## Rows: 84
## Columns: 5
## $ session_id  <chr> "2399681", "2399926", "2399928", "2403003", "2407135", "24…
## $ referrer    <chr> "tamuc", "tamuc", "tamuc", "tamuc", "tamuc", "tamuc", "tam…
## $ sex         <ord> f, f, f, f, f, m, f, f, m, f, f, f, f, f, m, m, f, f, m, m…
## $ d_art       <dbl> 0.778724218, 0.989174445, 1.171245767, 0.635428882, 0.3222…
## $ iat_exclude <chr> "Include", "Include", "Include", "Include", "Include", "In…

iat %>%
    ggplot(aes(x = d_art, fill = sex, color = sex)) +
    geom_histogram(binwidth = .2, alpha = .4) +
    geom_rug() +
    facet_grid(sex ~ ., scales = "free_y") + 
    theme(legend.position = "None")

iat %>% 
    ggplot(aes(x = sex, y = d_art)) + 
    geom_quasirandom(width = .1)

iat %>% 
    ggplot(aes(x = sex, y = d_art)) + 
    geom_quasirandom(width = .1) + 
    stat_summary(geom = "point", fun.y = "mean", color = "red", size = 5)

## Warning: The `fun.y` argument of `stat_summary()` is deprecated as of ggplot2 3.3.0.
## ℹ Please use the `fun` argument instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.

Qual a diferença na amostra

iat %>% 
    group_by(sex) %>% 
    summarise(media = mean(d_art), desvio_padrao = sd(d_art), count = n())

## # A tibble: 2 × 4
##   sex   media desvio_padrao count
##   <ord> <dbl>         <dbl> <int>
## 1 m     0.278         0.434    15
## 2 f     0.559         0.423    69

agrupado = iat %>% 
        group_by(sex) %>% 
        summarise(media = mean(d_art))
    m = agrupado %>% filter(sex == "m") %>% pull(media)
    f = agrupado %>% filter(sex == "f") %>% pull(media)
m - f

## [1] -0.2810528

Comparação via ICs

library(boot)

theta <- function(d, i) {
    agrupado = d %>% 
        slice(i) %>% 
        group_by(sex) %>% 
        summarise(media = mean(d_art))
    m = agrupado %>% filter(sex == "m") %>% pull(media)
    f = agrupado %>% filter(sex == "f") %>% pull(media)
    m - f
}

booted <- boot(data = iat, 
               statistic = theta, 
               R = 2000)

ci = tidy(booted, 
          conf.level = .95,
          conf.method = "bca",
          conf.int = TRUE)

glimpse(ci)

## Rows: 1
## Columns: 5
## $ statistic <dbl> -0.2810528
## $ bias      <dbl> -0.001732401
## $ std.error <dbl> 0.1212057
## $ conf.low  <dbl> -0.5099549
## $ conf.high <dbl> -0.03642659

ci %>%
    ggplot(aes(
        x = "",
        y = statistic,
        ymin = conf.low,
        ymax = conf.high
    )) +
    geom_pointrange() +
    geom_point(size = 3) + 
    labs(x = "Diferença", 
         y = "IAT homens - mulheres")

p1 = iat %>% 
    ggplot(aes(x = sex, y = d_art)) +
    geom_quasirandom(width = .1) + 
    stat_summary(geom = "point", fun.y = "mean", color = "red", size = 5)

p2 = ci %>%
    ggplot(aes(
        x = "",
        y = statistic,
        ymin = conf.low,
        ymax = conf.high
    )) +
    geom_pointrange() +
    geom_point(size = 3) + 
    ylim(-1, 1) + 
    labs(x = "Diferença", 
         y = "IAT homens - mulheres")

grid.arrange(p1, p2, ncol = 2)

Conclusão

Preencha os resultados e conclusões abaixo

Em média, as mulheres que participaram do experimento tiveram uma associação implícita (medida pelo IAT) com a matemárica positiva e média (média 0.559, desv. padrão 0.423, N = 69). Homens tiveram uma associação positiva com a matemática, porém menor que a das mulheres (média 0.278, desv. padrão 0.434, N = 15). Houve portanto uma considerável diferença entre homens e mulheres (diferença das médias -0.2810528 (male - female), 95% CI [-0.511, -0.015]). A partir desta amostra, estimamos que mulheres têm uma associação positiva (note que apesar da diferença m - f ser negativa, ambas possuem associações positivas na média) consideravelmente mais forte, com uma diferença que provavelmente está entre 0.511 e 0.015 aproximadamente ponto na escala IAT, o suficiente para diferenciar uma associação neutra de uma forte para o lado da arts / contra a matemática.

Realize novas análises sobre IAT usando as abordagens a seguir

Realize a análise e compare as conclusões obtidas nos dois casos experimentados:

bootstraps a partir de uma bibliotece (exemplo acima)
bootstraps implementados por você (justifique o método de IC com bootstraps escolhido)

IMPLEMENTANDO O BOOTSTRAP:

O método selecionado é o Simple Percentile, ou Quantile-based, ou Approximate intervals. O cálculo é baseado nos quantis (2.5% e 97.5% para os intervalos inferiores e superiores, respectivamente, 95% CI). Após a técnica do bootstraping (sampling), os dados são ordenados e os quantis selecionados são os intervalos de confiança. Neste caso, vamos calcular os CI’s para a diferença m - f

B = 2000
results = numeric(B)
n = nrow(iat)

for(b in 1:B){
  i = sample(x = 1:n, size = n, replace = TRUE) ## sampling
  bootSample = iat %>% slice(i)
  agrupado = bootSample %>%
        group_by(sex) %>% 
        summarise(media = mean(d_art))
  m = agrupado %>% filter(sex == "m") %>% pull(media)
  f = agrupado %>% filter(sex == "f") %>% pull(media)
  theta = m - f
  results[b] = theta
}

quantile(results, c(0.025, 0.5, 0.975))

##        2.5%         50%       97.5% 
## -0.52352623 -0.28088404 -0.03747758

A partir desta amostra, estimamos que mulheres têm uma associação positiva consideravelmente mais forte, com uma diferença que provavelmente está entre -0.518 e -0.035 aproximadamente ponto na escala IAT, o suficiente para diferenciar uma associação neutra de uma forte para o lado da arts / contra a matemática. Os IC’s gerados foram similares em ambas as abordagens (manual ou usando biblioteca).

Análise de uma replicação

Sobre Implicit Association Tests (IAT)

Análise de uma replicação

Qual a diferença na amostra

Comparação via ICs

Conclusão

Preencha os resultados e conclusões abaixo

Realize novas análises sobre IAT usando as abordagens a seguir

IMPLEMENTANDO O BOOTSTRAP: