Neste exercício, exploramos a distribuição da estatística de média amostral para três distribuições diferentes: Uniforme(1,5) Bernoulli(p=0.5) Cauchy(0,1) O objetivo foi analisar como a distribuição da média amostral se comporta conforme o tamanho da amostra aumenta, conforme previsto pelo Teorema do Limite Central.
Foram geradas 1000 amostras para cada tamanho de amostra (20, 50, 100, 200 e 500) para cada uma das três distribuições mencionadas. Para cada amostra, foi calculada a média amostral. Esses valores foram então utilizados para analisar a distribuição da média amostral para cada tamanho de amostra.
# Definindo o tamanho das amostras
tamanhos_amostra <- c(20, 50, 100, 200, 500)
# Número de amostras
n_amostras <- 1000
# Função para calcular a média amostral
calcular_media_amostral <- function(amostra) {
return(mean(amostra))
}
# Inicializando um dataframe para armazenar os resultados
resultados_uniforme <- data.frame(Tamanho_Amostra = numeric(),
Media_Amostral = numeric())
resultados_bernoulli <- data.frame(Tamanho_Amostra = numeric(),
Media_Amostral = numeric())
resultados_cauchy <- data.frame(Tamanho_Amostra = numeric(),
Media_Amostral = numeric())
# Definindo o parâmetro para a distribuição Bernoulli
prob_bernoulli <- 0.5
# Loop sobre os tamanhos de amostra
for (n in tamanhos_amostra) {
# Inicializando vetores para armazenar as médias amostrais
medias_amostrais_uniforme <- numeric(n_amostras)
medias_amostrais_bernoulli <- numeric(n_amostras)
medias_amostrais_cauchy <- numeric(n_amostras)
# Gerando as amostras e calculando as médias amostrais
for (i in 1:n_amostras) {
# Amostras da distribuição Uniforme(1,5)
amostra_uniforme <- runif(n, min = 1, max = 5)
media_amostral_uniforme <- calcular_media_amostral(amostra_uniforme)
medias_amostrais_uniforme[i] <- media_amostral_uniforme
# Amostras da distribuição Bernoulli(p=0.5)
amostra_bernoulli <- rbinom(n, size = 1, prob = prob_bernoulli)
media_amostral_bernoulli <- calcular_media_amostral(amostra_bernoulli)
medias_amostrais_bernoulli[i] <- media_amostral_bernoulli
# Amostras da distribuição Cauchy(0,1)
amostra_cauchy <- rcauchy(n)
media_amostral_cauchy <- calcular_media_amostral(amostra_cauchy)
medias_amostrais_cauchy[i] <- media_amostral_cauchy
}
# Salvando as médias amostrais nos dataframes de resultados
resultados_uniforme <- rbind(resultados_uniforme, data.frame(Tamanho_Amostra = rep(n, n_amostras),
Media_Amostral = medias_amostrais_uniforme))
resultados_bernoulli <- rbind(resultados_bernoulli, data.frame(Tamanho_Amostra = rep(n, n_amostras),
Media_Amostral = medias_amostrais_bernoulli))
resultados_cauchy <- rbind(resultados_cauchy, data.frame(Tamanho_Amostra = rep(n, n_amostras),
Media_Amostral = medias_amostrais_cauchy))
# Plotando o histograma para a distribuição Uniforme(1,5)
mu_uniforme <- 3
sigma_uniforme <- sqrt(2/12) # Desvio padrão da distribuição uniforme (1,5)
hist(medias_amostrais_uniforme, breaks = 30, main = paste("Distribuição da Média Amostral - Uniforme (n =", n, ")", sep = ""),
xlab = "Valor", ylab = "Densidade de Probabilidade", col = "skyblue", border = "black")
# Adicionando a curva de densidade teórica (normal)
curve(dnorm(x, mean = mu_uniforme, sd = sigma_uniforme/sqrt(n)), add = TRUE, col = "black", lwd = 2)
# Teste de normalidade (teste de Shapiro-Wilk)
shapiro.test(medias_amostrais_uniforme)
# Plotando o histograma para a distribuição Bernoulli(p=0.5)
hist(medias_amostrais_bernoulli, breaks = 30, main = paste("Distribuição da Média Amostral - Bernoulli (n =", n, ")", sep = ""),
xlab = "Valor", ylab = "Densidade de Probabilidade", col = "skyblue", border = "black")
# Adicionando a curva de densidade teórica (normal)
curve(dnorm(x, mean = prob_bernoulli, sd = sqrt(prob_bernoulli*(1-prob_bernoulli)/n)), add = TRUE, col = "black", lwd = 2)
# Teste de normalidade (teste de Shapiro-Wilk)
shapiro.test(medias_amostrais_bernoulli)
# Plotando o histograma para a distribuição Cauchy(0,1)
hist(medias_amostrais_cauchy, breaks = 30, main = paste("Distribuição da Média Amostral - Cauchy (n =", n, ")", sep = ""),
xlab = "Valor", ylab = "Densidade de Probabilidade", col = "skyblue", border = "black")
# Teste de normalidade (teste de Shapiro-Wilk)
shapiro.test(medias_amostrais_cauchy)
}
Para cada distribuição e tamanho de amostra, foram gerados histogramas da média amostral, calculadas estatísticas descritivas (média, variância) e realizados testes de normalidade (por exemplo, teste de Shapiro-Wilk). As distribuições da média amostral foram analisadas quanto à centralização, variabilidade e simetria.
Os resultados mostraram que conforme o tamanho da amostra aumenta, a distribuição da média amostral se aproxima de uma distribuição normal, como previsto pelo Teorema do Limite Central. As distribuições da média amostral para a distribuição Uniforme(1,5) e Bernoulli(p=0.5) mostraram-se simétricas e centradas em torno da média populacional, com menor variabilidade em relação aos tamanhos de amostra menores. Já para a distribuição Cauchy(0,1), a distribuição da média amostral apresentou-se mais dispersa e menos simétrica, refletindo as características peculiares dessa distribuição.Além disso, os testes de normalidade de Shapiro-Wilk corroboram essa observação, indicando que as distribuições das médias amostrais são consistentes com a normalidade para tamanhos de amostra maiores.
Concluímos que o Teorema do Limite Central é confirmado empiricamente para as distribuições estudadas. A distribuição da média amostral se aproxima de uma distribuição normal conforme o tamanho da amostra aumenta, independentemente da distribuição original da população. Portanto, para inferências sobre a média populacional, pode-se confiar na distribuição normal da média amostral, especialmente para tamanhos de amostra maiores Isso tem implicações importantes para a prática estatística, uma vez que permite a aplicação de métodos baseados na distribuição normal mesmo quando a distribuição da população original é desconhecida ou não é normal.