Introdução

Neste exercício, exploramos a distribuição da estatística de média amostral para três distribuições diferentes: Uniforme(1,5) Bernoulli(p=0.5) Cauchy(0,1) O objetivo foi analisar como a distribuição da média amostral se comporta conforme o tamanho da amostra aumenta, conforme previsto pelo Teorema do Limite Central.

Analise

Foram geradas 1000 amostras para cada tamanho de amostra (20, 50, 100, 200 e 500) para cada uma das três distribuições mencionadas. Para cada amostra, foi calculada a média amostral. Esses valores foram então utilizados para analisar a distribuição da média amostral para cada tamanho de amostra.

Codigo

# Definindo o tamanho das amostras
tamanhos_amostra <- c(20, 50, 100, 200, 500)

# Número de amostras
n_amostras <- 1000

# Função para calcular a média amostral
calcular_media_amostral <- function(amostra) {
  return(mean(amostra))
}

# Inicializando um dataframe para armazenar os resultados
resultados_uniforme <- data.frame(Tamanho_Amostra = numeric(),
                                  Media_Amostral = numeric())
resultados_bernoulli <- data.frame(Tamanho_Amostra = numeric(),
                                   Media_Amostral = numeric())
resultados_cauchy <- data.frame(Tamanho_Amostra = numeric(),
                                Media_Amostral = numeric())

# Definindo o parâmetro para a distribuição Bernoulli
prob_bernoulli <- 0.5

# Loop sobre os tamanhos de amostra
for (n in tamanhos_amostra) {
  # Inicializando vetores para armazenar as médias amostrais
  medias_amostrais_uniforme <- numeric(n_amostras)
  medias_amostrais_bernoulli <- numeric(n_amostras)
  medias_amostrais_cauchy <- numeric(n_amostras)
  
  # Gerando as amostras e calculando as médias amostrais
  for (i in 1:n_amostras) {
    # Amostras da distribuição Uniforme(1,5)
    amostra_uniforme <- runif(n, min = 1, max = 5)
    media_amostral_uniforme <- calcular_media_amostral(amostra_uniforme)
    medias_amostrais_uniforme[i] <- media_amostral_uniforme
    
    # Amostras da distribuição Bernoulli(p=0.5)
    amostra_bernoulli <- rbinom(n, size = 1, prob = prob_bernoulli)
    media_amostral_bernoulli <- calcular_media_amostral(amostra_bernoulli)
    medias_amostrais_bernoulli[i] <- media_amostral_bernoulli
    
    # Amostras da distribuição Cauchy(0,1)
    amostra_cauchy <- rcauchy(n)
    media_amostral_cauchy <- calcular_media_amostral(amostra_cauchy)
    medias_amostrais_cauchy[i] <- media_amostral_cauchy
  }
  
  # Salvando as médias amostrais nos dataframes de resultados
  resultados_uniforme <- rbind(resultados_uniforme, data.frame(Tamanho_Amostra = rep(n, n_amostras),
                                                               Media_Amostral = medias_amostrais_uniforme))
  resultados_bernoulli <- rbind(resultados_bernoulli, data.frame(Tamanho_Amostra = rep(n, n_amostras),
                                                                 Media_Amostral = medias_amostrais_bernoulli))
  resultados_cauchy <- rbind(resultados_cauchy, data.frame(Tamanho_Amostra = rep(n, n_amostras),
                                                           Media_Amostral = medias_amostrais_cauchy))
  
  # Plotando o histograma para a distribuição Uniforme(1,5)
  mu_uniforme <- 3
  sigma_uniforme <- sqrt(2/12)  # Desvio padrão da distribuição uniforme (1,5)
  hist(medias_amostrais_uniforme, breaks = 30, main = paste("Distribuição da Média Amostral - Uniforme (n =", n, ")", sep = ""),
       xlab = "Valor", ylab = "Densidade de Probabilidade", col = "skyblue", border = "black")
  # Adicionando a curva de densidade teórica (normal)
  curve(dnorm(x, mean = mu_uniforme, sd = sigma_uniforme/sqrt(n)), add = TRUE, col = "black", lwd = 2)
  # Teste de normalidade (teste de Shapiro-Wilk)
  shapiro.test(medias_amostrais_uniforme)
  
  # Plotando o histograma para a distribuição Bernoulli(p=0.5)
  hist(medias_amostrais_bernoulli, breaks = 30, main = paste("Distribuição da Média Amostral - Bernoulli (n =", n, ")", sep = ""),
       xlab = "Valor", ylab = "Densidade de Probabilidade", col = "skyblue", border = "black")
  # Adicionando a curva de densidade teórica (normal)
  curve(dnorm(x, mean = prob_bernoulli, sd = sqrt(prob_bernoulli*(1-prob_bernoulli)/n)), add = TRUE, col = "black", lwd = 2)
  # Teste de normalidade (teste de Shapiro-Wilk)
  shapiro.test(medias_amostrais_bernoulli)
  
  # Plotando o histograma para a distribuição Cauchy(0,1)
  hist(medias_amostrais_cauchy, breaks = 30, main = paste("Distribuição da Média Amostral - Cauchy (n =", n, ")", sep = ""),
       xlab = "Valor", ylab = "Densidade de Probabilidade", col = "skyblue", border = "black")
  # Teste de normalidade (teste de Shapiro-Wilk)
  shapiro.test(medias_amostrais_cauchy)
}

Resultados:

Para cada distribuição e tamanho de amostra, foram gerados histogramas da média amostral, calculadas estatísticas descritivas (média, variância) e realizados testes de normalidade (por exemplo, teste de Shapiro-Wilk). As distribuições da média amostral foram analisadas quanto à centralização, variabilidade e simetria.

Conclusão

Os resultados mostraram que conforme o tamanho da amostra aumenta, a distribuição da média amostral se aproxima de uma distribuição normal, como previsto pelo Teorema do Limite Central. As distribuições da média amostral para a distribuição Uniforme(1,5) e Bernoulli(p=0.5) mostraram-se simétricas e centradas em torno da média populacional, com menor variabilidade em relação aos tamanhos de amostra menores. Já para a distribuição Cauchy(0,1), a distribuição da média amostral apresentou-se mais dispersa e menos simétrica, refletindo as características peculiares dessa distribuição.Além disso, os testes de normalidade de Shapiro-Wilk corroboram essa observação, indicando que as distribuições das médias amostrais são consistentes com a normalidade para tamanhos de amostra maiores.

Concluímos que o Teorema do Limite Central é confirmado empiricamente para as distribuições estudadas. A distribuição da média amostral se aproxima de uma distribuição normal conforme o tamanho da amostra aumenta, independentemente da distribuição original da população. Portanto, para inferências sobre a média populacional, pode-se confiar na distribuição normal da média amostral, especialmente para tamanhos de amostra maiores Isso tem implicações importantes para a prática estatística, uma vez que permite a aplicação de métodos baseados na distribuição normal mesmo quando a distribuição da população original é desconhecida ou não é normal.