Neste relatório, investigamos a distribuição da estatística de média amostral para amostras de diferentes tamanhos provenientes de uma população com distribuição normal, com média 10 e variância 2. Utilizamos o Teorema do Limite Central para analisar como a distribuição da média amostral se comporta conforme o tamanho da amostra aumenta.
# Definindo os parâmetros da população
mu <- 10
sigma <- sqrt(2)
# Tamanhos das amostras
tamanhos_amostra <- c(20, 50, 100, 200, 500)
# Número de amostras
n_amostras <- 1000
# Função para calcular a média amostral
calcular_media_amostral <- function(amostra) {
return(mean(amostra))
}
# Inicializando um dataframe para armazenar os resultados
resultados <- data.frame(Tamanho_Amostra = numeric(),
Media_Amostral = numeric())
# Loop sobre os tamanhos de amostra
for (n in tamanhos_amostra) {
# Inicializando um vetor para armazenar as médias amostrais
medias_amostrais <- numeric(n_amostras)
# Gerando as amostras e calculando as médias amostrais
for (i in 1:n_amostras) {
amostra <- rnorm(n, mu, sigma)
media_amostral <- calcular_media_amostral(amostra)
medias_amostrais[i] <- media_amostral
}
# Salvando as médias amostrais no dataframe de resultados
resultados <- rbind(resultados, data.frame(Tamanho_Amostra = rep(n, n_amostras),
Media_Amostral = medias_amostrais))
# Plotando o histograma
hist(medias_amostrais, breaks = 30, main = paste("Distribuição da Média Amostral (n =", n, ")", sep = ""),
xlab = "Valor", ylab = "Densidade de Probabilidade", col = "skyblue", border = "black")
# Adicionando a curva de densidade teórica (normal)
curve(dnorm(x, mean = mu, sd = sigma/sqrt(n)), add = TRUE, col = "black", lwd = 2)
# Teste de normalidade (teste de Shapiro-Wilk)
shapiro.test(medias_amostrais)
# Adicionando linha para a média populacional
media <- mean(medias_amostrais)
abline(v = media, col = "green", lwd = 2, lty = 2)
text(media, max(density(medias_amostrais)$y), round(media, 2), pos = 4, col = "green")
}
Os resultados obtidos confirmam a validade do Teorema do Limite Central. Conforme o tamanho da amostra aumenta, a distribuição da média amostral se aproxima de uma distribuição normal, independentemente da distribuição original da população. Isso é evidenciado pelos histogramas das médias amostrais, que mostram uma maior simetria e centralização em torno da média populacional para tamanhos de amostra maiores.
Além disso, os testes de normalidade de Shapiro-Wilk corroboram essa observação, indicando que as distribuições das médias amostrais são consistentes com a normalidade para tamanhos de amostra maiores.
Portanto, podemos concluir que, para inferências sobre a média populacional, a distribuição normal da média amostral é uma aproximação adequada, especialmente para tamanhos de amostra maiores. Isso tem implicações importantes para a prática estatística, uma vez que permite a aplicação de métodos baseados na distribuição normal mesmo quando a distribuição da população original é desconhecida ou não é normal.