Introdução

Neste relatório, investigamos a distribuição da estatística de média amostral para amostras de diferentes tamanhos provenientes de uma população com distribuição normal, com média 10 e variância 2. Utilizamos o Teorema do Limite Central para analisar como a distribuição da média amostral se comporta conforme o tamanho da amostra aumenta.

Código base

# Definindo os parâmetros da população
mu <- 10
sigma <- sqrt(2)

# Tamanhos das amostras
tamanhos_amostra <- c(20, 50, 100, 200, 500)

# Número de amostras
n_amostras <- 1000

# Função para calcular a média amostral
calcular_media_amostral <- function(amostra) {
  return(mean(amostra))
}

# Inicializando um dataframe para armazenar os resultados
resultados <- data.frame(Tamanho_Amostra = numeric(),
                         Media_Amostral = numeric())

# Loop sobre os tamanhos de amostra
for (n in tamanhos_amostra) {
  # Inicializando um vetor para armazenar as médias amostrais
  medias_amostrais <- numeric(n_amostras)
  
  # Gerando as amostras e calculando as médias amostrais
  for (i in 1:n_amostras) {
    amostra <- rnorm(n, mu, sigma)
    media_amostral <- calcular_media_amostral(amostra)
    medias_amostrais[i] <- media_amostral
  }
  
  # Salvando as médias amostrais no dataframe de resultados
  resultados <- rbind(resultados, data.frame(Tamanho_Amostra = rep(n, n_amostras),
                                             Media_Amostral = medias_amostrais))
  
  # Plotando o histograma
  hist(medias_amostrais, breaks = 30, main = paste("Distribuição da Média Amostral (n =", n, ")", sep = ""),
       xlab = "Valor", ylab = "Densidade de Probabilidade", col = "skyblue", border = "black")
  
  # Adicionando a curva de densidade teórica (normal)
  curve(dnorm(x, mean = mu, sd = sigma/sqrt(n)), add = TRUE, col = "black", lwd = 2)
  
  # Teste de normalidade (teste de Shapiro-Wilk)
  shapiro.test(medias_amostrais)
  
  # Adicionando linha para a média populacional
  media <- mean(medias_amostrais)
  abline(v = media, col = "green", lwd = 2, lty = 2)
  text(media, max(density(medias_amostrais)$y), round(media, 2), pos = 4, col = "green")

}

Conclusão

Os resultados obtidos confirmam a validade do Teorema do Limite Central. Conforme o tamanho da amostra aumenta, a distribuição da média amostral se aproxima de uma distribuição normal, independentemente da distribuição original da população. Isso é evidenciado pelos histogramas das médias amostrais, que mostram uma maior simetria e centralização em torno da média populacional para tamanhos de amostra maiores.

Além disso, os testes de normalidade de Shapiro-Wilk corroboram essa observação, indicando que as distribuições das médias amostrais são consistentes com a normalidade para tamanhos de amostra maiores.

Portanto, podemos concluir que, para inferências sobre a média populacional, a distribuição normal da média amostral é uma aproximação adequada, especialmente para tamanhos de amostra maiores. Isso tem implicações importantes para a prática estatística, uma vez que permite a aplicação de métodos baseados na distribuição normal mesmo quando a distribuição da população original é desconhecida ou não é normal.