Introdução e Carregamento dos Dados (Brasília)

Este relatório analisa os dados do Teste de Associação Implícita (IAT) da amostra de (Brasilia .csv)_ para investigar a diferença na associação implícita com a matemática entre homens e mulheres.

O DATASET ESCOLHIDO FOI brasilia.csv.

dados <- read.csv(here::here("data/brasilia .csv"), stringsAsFactors = TRUE)
head(dados)
##   session_id referrer sex     d_art iat_exclude
## 1    2401243 brasilia   m 0.1480913     Include
## 2    2401244 brasilia   m 0.6285349     Include
## 3    2401246 brasilia   f 0.4977736     Include
## 4    2401249 brasilia   f 0.3999447     Include
## 5    2401250 brasilia   f 0.8314632     Include
## 6    2401251 brasilia   m 1.1451529     Include

A interpretação da pontuação IAT (d_art) permanece a mesma: * Pontuação > 0: Indica uma associação implícita estereotipada (“Matemática + Masculino”). * Magnitude: Pontuações em torno de 0.15 são “leves”, 0.35 “moderadas” e 0.65 “fortes”.


Resultados e Conclusões (Brasília)

A analise descritiva dos dados de Brasília revela as seguintes estatísticas:

# Filtrar por gênero usando a coluna 'sex'
mulheres_data <- subset(dados, sex == "f")
homens_data <- subset(dados, sex == "m")

stats <- data.frame(
  Grupo = c("Mulheres", "Homens"),
  N = c(nrow(mulheres_data), nrow(homens_data)),
  Media_IAT = c(mean(mulheres_data$d_art), mean(homens_data$d_art)),
  Desvio_Padrao = c(sd(mulheres_data$d_art), sd(homens_data$d_art))
)

kable(stats, digits = 3, caption = "Estatísticas Descritivas do IAT por Gênero (Amostra de Brasília)")
Estatísticas Descritivas do IAT por Gênero (Amostra de Brasília)
Grupo N Media_IAT Desvio_Padrao
Mulheres 65 0.57 0.423
Homens 48 0.40 0.516

Novas Análises de Bootstrap (Brasília)

Para estimar a confiança na diferença de médias observada para a amostra de Brasília foi utilizado dois bootstraps, um utilizando boot, e outro manual.

1. Bootstrap com a Biblioteca boot

FOi utiliziado o método BCa, que é mais robusto, para calcular um intervalo de confiança preciso para a diferença das médias.

# Fazenndo o bootstrap
diff_means_boot <- function(data, indices) {
  d <- data[indices, ]
  mean_f <- mean(d$d_art[d$sex == "f"], na.rm = TRUE)
  mean_m <- mean(d$d_art[d$sex == "m"], na.rm = TRUE)
  return(mean_f - mean_m)
}

# Semente ultilizada
set.seed(456) 

# 5000 replicçoes
boot_results <- boot(
  data = dados,
  statistic = diff_means_boot,
  R = 5000 
)


boot_ci <- boot.ci(boot_results, type = "bca")
print(boot_results)
## 
## ORDINARY NONPARAMETRIC BOOTSTRAP
## 
## 
## Call:
## boot(data = dados, statistic = diff_means_boot, R = 5000)
## 
## 
## Bootstrap Statistics :
##      original      bias    std. error
## t1* 0.1705546 0.001378955  0.09066204
print(boot_ci)
## BOOTSTRAP CONFIDENCE INTERVAL CALCULATIONS
## Based on 5000 bootstrap replicates
## 
## CALL : 
## boot.ci(boot.out = boot_results, type = "bca")
## 
## Intervals : 
## Level       BCa          
## 95%   (-0.0148,  0.3426 )  
## Calculations and Intervals on Original Scale
# Plotar a distribuição bootstrap
plot(boot_results, main = "Distribuição da Diferença  de Médias (Brasília)")

2. Bootstrap Manual (Método do Percentil)

Em seguida, será feito um bootstrap manual, usando o método do percentil para o intervalo de confiança.O método do percentil é uma das formas mais diretas de se extrair um intervalo de confiança de uma distribuição, ele utiliza diretamente os percentis 2.5 e 97.5

# tambem o mesmo seed e emenmo tamanho da amostra
set.seed(456)
n_iter <- 5000
diffs_manual <- numeric(n_iter)

#  reamostragem usando os dados ja filtrados
for (i in 1:n_iter) {
  sample_f <- sample(mulheres_data$d_art, size = nrow(mulheres_data), replace = TRUE)
  sample_m <- sample(homens_data$d_art, size = nrow(homens_data), replace = TRUE)
  diffs_manual[i] <- mean(sample_f) - mean(sample_m)
}

# Calcular o IC de 95% via percentis
ic_percentil <- quantile(diffs_manual, c(0.025, 0.975))
print(ic_percentil)
##        2.5%       97.5% 
## -0.01215019  0.34994631

Preenchimento e Conclusão Final (Brasília)

A análise com a biblioteca boot nos fornece uma diferença de médias observada de 0.171 e um intervalo de confiança BCa de 95% de [-0.015, 0.343]. O bootstrap manual produziu um resultado muito similar: [-0.012, 0.35].

conclusao:


Em média as mulheres que participaram do experimento em Brasília tiveram uma associação implícita com a matemática positiva e moderada (média 0.57, desv. padrão 0.423, N = 65), desv. padrão 0.423, N = 65). Homens tiveram uma associação positiva, portanto menor que a das mulheres (média 0.4, desv. padrão 0.516, N = 48), desv. padrão 0.516, N = 48). Houve portanto uma pequena diferença entre homens e mulheres (diferença das médias 0.171, 95% CI BCa [-0.015, 0.343]).

A partir desta amostra, estimamos que: * pode não haver uma diferença entre sexos, ou se ela existir, ela provavelmente é pequena em qualquer das direções. O intervalo de confiança para a diferença ([-0.015, 0.343]) cruza o zero, o que significa que não podemos descartar a possibilidade de não haver diferença alguma entre os grupos. A diferença observada de 0.171 não é estatisticamente significativa.