IAT: 0.15, 0.35, and 0.65 are considered small, medium, and large level of bias for individual scores.
Positive means bias towards arts / against Math.
iat = read_csv(here::here(params$arquivo_dados), col_types = "cccdc")
iat = iat %>%
mutate(sex = factor(sex, levels = c("m", "f"), ordered = TRUE))
glimpse(iat)
## Rows: 84
## Columns: 5
## $ session_id <chr> "2399681", "2399926", "2399928", "2403003", "2407135", "24…
## $ referrer <chr> "tamuc", "tamuc", "tamuc", "tamuc", "tamuc", "tamuc", "tam…
## $ sex <ord> f, f, f, f, f, m, f, f, m, f, f, f, f, f, m, m, f, f, m, m…
## $ d_art <dbl> 0.778724218, 0.989174445, 1.171245767, 0.635428882, 0.3222…
## $ iat_exclude <chr> "Include", "Include", "Include", "Include", "Include", "In…
iat %>%
ggplot(aes(x = d_art, fill = sex, color = sex)) +
geom_histogram(binwidth = .2, alpha = .4) +
geom_rug() +
facet_grid(sex ~ ., scales = "free_y") +
theme(legend.position = "None")
iat %>%
ggplot(aes(x = sex, y = d_art)) +
geom_quasirandom(width = .1)
iat %>%
ggplot(aes(x = sex, y = d_art)) +
geom_quasirandom(width = .1) +
stat_summary(geom = "point", fun.y = "mean", color = "red", size = 5)
## Warning: The `fun.y` argument of `stat_summary()` is deprecated as of ggplot2 3.3.0.
## ℹ Please use the `fun` argument instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
iat %>%
group_by(sex) %>%
summarise(media = mean(d_art), desvio_padrao = sd(d_art), count = n())
## # A tibble: 2 × 4
## sex media desvio_padrao count
## <ord> <dbl> <dbl> <int>
## 1 m 0.278 0.434 15
## 2 f 0.559 0.423 69
agrupado = iat %>%
group_by(sex) %>%
summarise(media = mean(d_art))
m = agrupado %>% filter(sex == "m") %>% pull(media)
f = agrupado %>% filter(sex == "f") %>% pull(media)
m - f
## [1] -0.2810528
library(boot)
theta <- function(d, i) {
agrupado = d %>%
slice(i) %>%
group_by(sex) %>%
summarise(media = mean(d_art))
m = agrupado %>% filter(sex == "m") %>% pull(media)
f = agrupado %>% filter(sex == "f") %>% pull(media)
m - f
}
booted <- boot(data = iat,
statistic = theta,
R = 2000)
ci = tidy(booted,
conf.level = .95,
conf.method = "bca",
conf.int = TRUE)
glimpse(ci)
## Rows: 1
## Columns: 5
## $ statistic <dbl> -0.2810528
## $ bias <dbl> -0.001732401
## $ std.error <dbl> 0.1212057
## $ conf.low <dbl> -0.5099549
## $ conf.high <dbl> -0.03642659
ci %>%
ggplot(aes(
x = "",
y = statistic,
ymin = conf.low,
ymax = conf.high
)) +
geom_pointrange() +
geom_point(size = 3) +
labs(x = "Diferença",
y = "IAT homens - mulheres")
p1 = iat %>%
ggplot(aes(x = sex, y = d_art)) +
geom_quasirandom(width = .1) +
stat_summary(geom = "point", fun.y = "mean", color = "red", size = 5)
p2 = ci %>%
ggplot(aes(
x = "",
y = statistic,
ymin = conf.low,
ymax = conf.high
)) +
geom_pointrange() +
geom_point(size = 3) +
ylim(-1, 1) +
labs(x = "Diferença",
y = "IAT homens - mulheres")
grid.arrange(p1, p2, ncol = 2)
Em média, as mulheres que participaram do experimento tiveram uma associação implícita (medida pelo IAT) com a matemárica positiva e média (média 0.559, desv. padrão 0.423, N = 69). Homens tiveram uma associação positiva com a matemática, porém menor que a das mulheres (média 0.278, desv. padrão 0.434, N = 15). Houve portanto uma considerável diferença entre homens e mulheres (diferença das médias -0.2810528 (male - female), 95% CI [-0.511, -0.015]). A partir desta amostra, estimamos que mulheres têm uma associação positiva (note que apesar da diferença m - f ser negativa, ambas possuem associações positivas na média) consideravelmente mais forte, com uma diferença que provavelmente está entre 0.511 e 0.015 aproximadamente ponto na escala IAT, o suficiente para diferenciar uma associação neutra de uma forte para o lado da arts / contra a matemática.
Realize a análise e compare as conclusões obtidas nos dois casos experimentados:
O método selecionado é o Simple Percentile, ou Quantile-based, ou Approximate intervals. O cálculo é baseado nos quantis (2.5% e 97.5% para os intervalos inferiores e superiores, respectivamente, 95% CI). Após a técnica do bootstraping (sampling), os dados são ordenados e os quantis selecionados são os intervalos de confiança. Neste caso, vamos calcular os CI’s para a diferença m - f
B = 2000
results = numeric(B)
n = nrow(iat)
for(b in 1:B){
i = sample(x = 1:n, size = n, replace = TRUE) ## sampling
bootSample = iat %>% slice(i)
agrupado = bootSample %>%
group_by(sex) %>%
summarise(media = mean(d_art))
m = agrupado %>% filter(sex == "m") %>% pull(media)
f = agrupado %>% filter(sex == "f") %>% pull(media)
theta = m - f
results[b] = theta
}
quantile(results, c(0.025, 0.5, 0.975))
## 2.5% 50% 97.5%
## -0.52352623 -0.28088404 -0.03747758
A partir desta amostra, estimamos que mulheres têm uma associação positiva consideravelmente mais forte, com uma diferença que provavelmente está entre -0.518 e -0.035 aproximadamente ponto na escala IAT, o suficiente para diferenciar uma associação neutra de uma forte para o lado da arts / contra a matemática. Os IC’s gerados foram similares em ambas as abordagens (manual ou usando biblioteca).