# Visualizar o dataset VADeaths
print("Dataset VADeaths:")
## [1] "Dataset VADeaths:"
print(VADeaths)
## Rural Male Rural Female Urban Male Urban Female
## 50-54 11.7 8.7 15.4 8.4
## 55-59 18.1 11.7 24.3 13.6
## 60-64 26.9 20.3 37.0 19.3
## 65-69 41.0 30.9 54.6 35.1
## 70-74 66.0 54.3 71.1 50.0
# Criar o gráfico de barras empilhadas agrupadas
barplot(VADeaths,
beside = TRUE, # Barras agrupadas lado a lado
col = c("lightblue", "lightgreen", "salmon", "gold", "purple"),
main = "Taxas de Mortalidade na Virgínia (1940)",
xlab = "Grupos Demográficos",
ylab = "Taxa de Mortalidade (por 1000)",
legend.text = rownames(VADeaths),
args.legend = list(x = "topright", title = "Faixa Etária"))
Descrição: Este gráfico mostra as taxas de mortalidade na Virgínia em 1940, organizadas por faixa etária (nas cores diferentes) e grupo demográfico (eixo X). As barras estão agrupadas lado a lado para facilitar a comparação entre os diferentes grupos.
# Dados dos pacientes
dados <- c("moderado", "leve", "leve", "severo", "leve", "moderado",
"moderado", "moderado", "leve", "leve", "severo", "leve",
"moderado", "moderado", "leve", "severo", "moderado",
"moderado", "moderado", "leve")
# Criar tabela de frequências
tabela_freq <- table(dados)
print("Frequência dos estágios da doença:")
## [1] "Frequência dos estágios da doença:"
print(tabela_freq)
## dados
## leve moderado severo
## 8 9 3
# Calcular porcentagens
porcentagens <- round(100 * tabela_freq / sum(tabela_freq), 1)
# Criar labels com porcentagens
labels <- paste(names(tabela_freq), "\n", porcentagens, "%", sep="")
# Definir cores para as fatias
cores <- c("lightgreen", "yellow", "red")
# Criar gráfico de pizza
pie(tabela_freq,
labels = labels,
col = cores,
main = "Distribuição da Classificação da Doença",
cex = 1.2)
# Adicionar legenda
legend("topright",
legend = names(tabela_freq),
fill = cores,
title = "Estágio",
cex = 0.9)
Resumo:
# Carregar o dataset flu
flu <- read.csv("flu.csv")
# (1) Histograma e curva de densidade do conjunto de dados original
hist(flu$age,
probability = TRUE,
main = "Distribuição das Idades - População (Gripe Espanhola 1918)",
xlab = "Idade",
ylab = "Densidade",
col = "lightblue",
border = "white")
# Adicionar curva de densidade
lines(density(flu$age), col = "red", lwd = 2)
# Estatísticas da população
cat("\nEstatísticas da População Original:\n")
##
## Estatísticas da População Original:
cat("Média:", mean(flu$age), "\n")
## Média: 43.21765
cat("Desvio Padrão:", sd(flu$age), "\n")
## Desvio Padrão: 26.34562
cat("Mediana:", median(flu$age), "\n")
## Mediana: 43
# (2) Criar 200 médias de amostras com n = 35
set.seed(123) # Para reprodutibilidade
n_amostras <- 200
tamanho_amostra <- 35
medias_amostrais <- numeric(n_amostras)
for(i in 1:n_amostras) {
amostra <- sample(flu$age, size = tamanho_amostra, replace = TRUE)
medias_amostrais[i] <- mean(amostra)
}
# (3) Histograma com curva de densidade das médias amostrais
hist(medias_amostrais,
probability = TRUE,
main = "Distribuição das Médias Amostrais (n=35, 200 amostras)",
xlab = "Média Amostral",
ylab = "Densidade",
col = "lightgreen",
border = "white")
# Adicionar curva de densidade
lines(density(medias_amostrais), col = "blue", lwd = 2)
# Adicionar curva normal teórica
curve(dnorm(x, mean = mean(medias_amostrais), sd = sd(medias_amostrais)),
add = TRUE,
col = "red",
lwd = 2,
lty = 2)
legend("topright",
legend = c("Densidade Observada", "Normal Teórica"),
col = c("blue", "red"),
lwd = 2,
lty = c(1, 2))
# Estatísticas das médias amostrais
cat("\nEstatísticas das Médias Amostrais:\n")
##
## Estatísticas das Médias Amostrais:
cat("Média das médias:", mean(medias_amostrais), "\n")
## Média das médias: 42.86329
cat("Desvio padrão das médias:", sd(medias_amostrais), "\n")
## Desvio padrão das médias: 4.164951
cat("Erro padrão teórico:", sd(flu$age)/sqrt(tamanho_amostra), "\n")
## Erro padrão teórico: 4.453223
Conclusão: O Teorema do Limite Central afirma que, independentemente da distribuição original da população, a distribuição das médias amostrais tende a uma distribuição normal à medida que o tamanho da amostra aumenta. Podemos observar que: