IAT: 0.15, 0.35, and 0.65 are considered small, medium, and large level of bias for individual scores.
Positive means bias towards arts / against Math.
iat = read_csv(here::here(params$arquivo_dados), col_types = "cccdc")
iat = iat %>%
mutate(sex = factor(sex, levels = c("m", "f"), ordered = TRUE))
glimpse(iat)
## Rows: 267
## Columns: 5
## $ session_id <chr> "2478783", "2478785", "2478786", "2478787", "2478789", "24…
## $ referrer <chr> "lse", "lse", "lse", "lse", "lse", "lse", "lse", "lse", "l…
## $ sex <ord> m, f, f, f, m, m, f, m, m, f, f, f, f, f, f, f, f, f, f, m…
## $ d_art <dbl> 0.80543823, 0.31463632, 0.60437687, 0.32284672, 0.73121367…
## $ iat_exclude <chr> "Include", "Include", "Include", "Include", "Include", "In…
iat %>%
ggplot(aes(x = d_art, fill = sex)) +
geom_histogram(binwidth = .2, alpha = .5, color = "black") +
geom_rug() +
facet_grid(sex ~ ., scales = "free_y") +
theme(legend.position = "None")
iat %>%
ggplot(aes(x = sex, y = d_art)) +
geom_quasirandom(width = .1)
iat %>%
ggplot(aes(x = sex, y = d_art)) +
geom_quasirandom(width = .1) +
stat_summary(geom = "point", fun.y = "mean", color = "red", size = 5)
## Warning: The `fun.y` argument of `stat_summary()` is deprecated as of ggplot2 3.3.0.
## ℹ Please use the `fun` argument instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
iat %>%
group_by(sex) %>%
summarise(
media = mean(d_art),
desvio_padrao = sd(d_art),
N = n()
)
## # A tibble: 2 × 4
## sex media desvio_padrao N
## <ord> <dbl> <dbl> <int>
## 1 m 0.160 0.483 91
## 2 f 0.522 0.453 176
agrupado = iat %>%
group_by(sex) %>%
summarise(media = mean(d_art))
m = agrupado %>% filter(sex == "m") %>% pull(media)
f = agrupado %>% filter(sex == "f") %>% pull(media)
m - f
## [1] -0.3617526
theta <- function(d, i) {
agrupado = d %>%
slice(i) %>%
group_by(sex) %>%
summarise(media = mean(d_art))
m = agrupado %>% filter(sex == "m") %>% pull(media)
f = agrupado %>% filter(sex == "f") %>% pull(media)
m - f
}
booted <- boot(data = iat,
statistic = theta,
R = 2000)
ci = tidy(booted,
conf.level = .95,
conf.method = "bca",
conf.int = TRUE)
glimpse(ci)
## Rows: 1
## Columns: 5
## $ statistic <dbl> -0.3617526
## $ bias <dbl> 0.001594372
## $ std.error <dbl> 0.05986606
## $ conf.low <dbl> -0.4929001
## $ conf.high <dbl> -0.2501878
ci %>%
ggplot(aes(
x = "",
y = statistic,
ymin = conf.low,
ymax = conf.high
)) +
geom_pointrange() +
geom_point(size = 3) +
labs(x = "Diferença",
y = "IAT homens - mulheres")
p1 = iat %>%
ggplot(aes(x = sex, y = d_art)) +
geom_quasirandom(width = .1) +
stat_summary(geom = "point", fun.y = "mean", color = "red", size = 5)
p2 = ci %>%
ggplot(aes(
x = "",
y = statistic,
ymin = conf.low,
ymax = conf.high
)) +
geom_pointrange() +
geom_point(size = 3) +
ylim(-1, 1) +
labs(x = "Diferença",
y = "IAT homens - mulheres")
grid.arrange(p1, p2, ncol = 2)
Utilizando o Bootstrap a partir da biblioteca boot
Considerando os dados de LSE, em média, as mulheres que participaram do experimento tiveram uma associação implícita (medida pelo IAT) com a matemárica negativa e média (média 0.52, desv. padrão 0.45, N = 176). Homens tiveram uma associação positiva com a matemática, portanto maior que a das mulheres (média 0.16, desv. padrão 0.48, N = 91). Houve portanto uma considerável diferença entre homens e mulheres (diferença das médias -0.362, 95% CI [-0.487, -0.242]).
O método de intervalo de confiança (IC) adotado na implementação própria será o método percentil, escolhido devido à sua simplicidade e robustez.
bootstrap <- function(data, B = 2000, alpha = 0.05) {
diff_means <- numeric(B)
for (i in 1:B) {
boot_x <- data[sample(nrow(data), replace = TRUE), ]
men_mean <- mean(boot_x$d_art[boot_x$sex == "m"])
women_mean <- mean(boot_x$d_art[boot_x$sex == "f"])
diff_means[i] <- men_mean - women_mean
}
statistic <- mean(diff_means)
bias <- mean(diff_means) - mean(data$d_art[data$sex == "m"]) + mean(data$d_art[data$sex == "f"])
std_error <- sd(diff_means)
ci_boot <- quantile(diff_means, c(alpha / 2, 1 - alpha / 2))
results <- tibble::tibble(
statistic = statistic,
bias = bias,
std_error = std_error,
conf.low = ci_boot[1],
conf.high = ci_boot[2]
)
return(results)
}
ci_bootstrap = bootstrap(iat)
ci_bootstrap
## # A tibble: 1 × 5
## statistic bias std_error conf.low conf.high
## <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 -0.363 -0.000749 0.0606 -0.481 -0.246
ci_bootstrap %>%
ggplot(aes(
x = "",
y = statistic,
ymin = conf.low,
ymax = conf.high
)) +
geom_pointrange() +
geom_point(size = 3) +
labs(x = "Diferença",
y = "IAT homens - mulheres")
Em média, as mulheres que participaram do experimento tiveram uma associação implícita (medida pelo IAT) com a matemática negativa e média (média 0.52, desv. padrão 0.45, N = 176). Homens tiveram uma associação positiva com a matemática, portanto maior que a das mulheres (média 0.16, desv. padrão 0.48, N = 91). Houve portanto uma considerável diferença entre homens e mulheres (diferença das médias -0.361, 95% CI [-0.478, -0.239]). A partir desta amostra, estimamos que mulheres têm uma associação negativa moderadamente mais forte com a matemática, com uma diferença suficiente para indicar uma diferença nas atitudes implícitas entre os sexos.
Dada a diferença das médias nos dois métodos -0.362 (biblioteca
boot) versus -0.361 (implementação própria) e ICs
semelhantes [-0.487, -0.242] (biblioteca boot) versus [-0.478, -0.239]
(implementação própria), conclui-se que as diferenças entre os métodos
são mínimas e não impactam significativamente a conclusão geral.
Dito isso, ambas as análises indicam que mulheres têm uma associação negativa moderadamente mais forte comparado aos homens, o que evidencia uma diferença suficiente para sugerir que, no contexto da LSE, os homens tendem a preferir matemática em detrimento das artes.