Este relatório analisa os dados do Teste de Associação Implícita (IAT) da amostra de (Brasilia .csv)_ para investigar a diferença na associação implícita com a matemática entre homens e mulheres.
O DATASET ESCOLHIDO FOI brasilia.csv.
dados <- read.csv(here::here("data/brasilia .csv"), stringsAsFactors = TRUE)
head(dados)
## session_id referrer sex d_art iat_exclude
## 1 2401243 brasilia m 0.1480913 Include
## 2 2401244 brasilia m 0.6285349 Include
## 3 2401246 brasilia f 0.4977736 Include
## 4 2401249 brasilia f 0.3999447 Include
## 5 2401250 brasilia f 0.8314632 Include
## 6 2401251 brasilia m 1.1451529 Include
A interpretação da pontuação IAT (d_art) permanece a
mesma: * Pontuação > 0: Indica uma associação
implícita estereotipada (“Matemática + Masculino”). *
Magnitude: Pontuações em torno de 0.15 são “leves”,
0.35 “moderadas” e 0.65 “fortes”.
A analise descritiva dos dados de Brasília revela as seguintes estatísticas:
# Filtrar por gênero usando a coluna 'sex'
mulheres_data <- subset(dados, sex == "f")
homens_data <- subset(dados, sex == "m")
stats <- data.frame(
Grupo = c("Mulheres", "Homens"),
N = c(nrow(mulheres_data), nrow(homens_data)),
Media_IAT = c(mean(mulheres_data$d_art), mean(homens_data$d_art)),
Desvio_Padrao = c(sd(mulheres_data$d_art), sd(homens_data$d_art))
)
kable(stats, digits = 3, caption = "Estatísticas Descritivas do IAT por Gênero (Amostra de Brasília)")
| Grupo | N | Media_IAT | Desvio_Padrao |
|---|---|---|---|
| Mulheres | 65 | 0.57 | 0.423 |
| Homens | 48 | 0.40 | 0.516 |
Para estimar a confiança na diferença de médias observada para a amostra de Brasília foi utilizado dois bootstraps, um utilizando boot, e outro manual.
FOi utiliziado o método BCa, que é mais robusto, para calcular um intervalo de confiança preciso para a diferença das médias.
# Fazenndo o bootstrap
diff_means_boot <- function(data, indices) {
d <- data[indices, ]
mean_f <- mean(d$d_art[d$sex == "f"], na.rm = TRUE)
mean_m <- mean(d$d_art[d$sex == "m"], na.rm = TRUE)
return(mean_f - mean_m)
}
# Semente ultilizada
set.seed(456)
# 5000 replicçoes
boot_results <- boot(
data = dados,
statistic = diff_means_boot,
R = 5000
)
boot_ci <- boot.ci(boot_results, type = "bca")
print(boot_results)
##
## ORDINARY NONPARAMETRIC BOOTSTRAP
##
##
## Call:
## boot(data = dados, statistic = diff_means_boot, R = 5000)
##
##
## Bootstrap Statistics :
## original bias std. error
## t1* 0.1705546 0.001378955 0.09066204
print(boot_ci)
## BOOTSTRAP CONFIDENCE INTERVAL CALCULATIONS
## Based on 5000 bootstrap replicates
##
## CALL :
## boot.ci(boot.out = boot_results, type = "bca")
##
## Intervals :
## Level BCa
## 95% (-0.0148, 0.3426 )
## Calculations and Intervals on Original Scale
# Plotar a distribuição bootstrap
plot(boot_results, main = "Distribuição da Diferença de Médias (Brasília)")
Em seguida, será feito um bootstrap manual, usando o método do percentil para o intervalo de confiança.O método do percentil é uma das formas mais diretas de se extrair um intervalo de confiança de uma distribuição, ele utiliza diretamente os percentis 2.5 e 97.5
# tambem o mesmo seed e emenmo tamanho da amostra
set.seed(456)
n_iter <- 5000
diffs_manual <- numeric(n_iter)
# reamostragem usando os dados ja filtrados
for (i in 1:n_iter) {
sample_f <- sample(mulheres_data$d_art, size = nrow(mulheres_data), replace = TRUE)
sample_m <- sample(homens_data$d_art, size = nrow(homens_data), replace = TRUE)
diffs_manual[i] <- mean(sample_f) - mean(sample_m)
}
# Calcular o IC de 95% via percentis
ic_percentil <- quantile(diffs_manual, c(0.025, 0.975))
print(ic_percentil)
## 2.5% 97.5%
## -0.01215019 0.34994631
A análise com a biblioteca boot nos fornece uma
diferença de médias observada de 0.171 e um intervalo de confiança BCa
de 95% de [-0.015, 0.343]. O bootstrap manual produziu um resultado
muito similar: [-0.012, 0.35].
conclusao:
Em média as mulheres que participaram do experimento em Brasília tiveram uma associação implícita com a matemática positiva e moderada (média 0.57, desv. padrão 0.423, N = 65), desv. padrão 0.423, N = 65). Homens tiveram uma associação positiva, portanto menor que a das mulheres (média 0.4, desv. padrão 0.516, N = 48), desv. padrão 0.516, N = 48). Houve portanto uma pequena diferença entre homens e mulheres (diferença das médias 0.171, 95% CI BCa [-0.015, 0.343]).
A partir desta amostra, estimamos que: * pode não haver uma diferença entre sexos, ou se ela existir, ela provavelmente é pequena em qualquer das direções. O intervalo de confiança para a diferença ([-0.015, 0.343]) cruza o zero, o que significa que não podemos descartar a possibilidade de não haver diferença alguma entre os grupos. A diferença observada de 0.171 não é estatisticamente significativa.