VADeaths

# Carregar dataset VADeaths

data("VADeaths")
df <- as.data.frame(VADeaths)
df$Grupo <- rownames(df)

# transformar para longo

df_long <- df %>%
pivot_longer(cols = -Grupo,
names_to = "Categoria",
values_to = "Taxa")
# Gráfico 1: Barras agrupadas (lado a lado) por Categoria, cor por Grupo

ggplot(df_long, aes(x = Categoria, y = Taxa, fill = Grupo)) +
geom_col(position = position_dodge(width = 0.8), width = 0.7) +
labs(
title = "VADeaths — Taxas por Grupo e Faixa Etária",
subtitle = "Barras agrupadas por faixa etária; cores diferentes para cada grupo",
x = "Faixa etária",
y = "Taxa de mortalidade (por 1000?)",
fill = "Grupo"
) +
theme_minimal(base_size = 13) +
theme(
plot.title = element_text(face = "bold", size = 14),
plot.subtitle = element_text(size = 11),
axis.text.x = element_text(angle = 0, vjust = 0.5)
) +
scale_fill_brewer(palette = "Set2")

# Gráfico 2: Barras empilhadas por Categoria (opcional, para ver soma)

ggplot(df_long, aes(x = Categoria, y = Taxa, fill = Grupo)) +
geom_col(position = "stack", width = 0.7) +
labs(
title = "VADeaths — Visualização empilhada por faixa etária",
x = "Faixa etária",
y = "Taxa de mortalidade (soma por categoria)",
fill = "Grupo"
) +
theme_minimal(base_size = 13) +
scale_fill_brewer(palette = "Set2")

ClassificaçãoDoença

Teorema

flu <- read.csv("flu.csv", header = TRUE)
flu$age <- as.numeric(flu$age)

flu_idades <- flu$age

hist(flu_idades,
     breaks = 20,
     probability = TRUE,
     main = "Distribuição original das idades (flu.csv)",
     xlab = "Idade")
lines(density(flu_idades), col = "red", lwd = 2)

set.seed(123)

n <- 35
k <- 200

medias <- numeric(k)

for (i in 1:k) {
  amostra <- sample(flu_idades, size = n, replace = TRUE)
  medias[i] <- mean(amostra)
}

head(medias)
## [1] 38.88571 42.94286 48.51429 42.48571 40.34286 42.14286
hist(medias,
     breaks = 20,
     probability = TRUE,
     main = "Distribuição das médias (200 amostras de n = 35)",
     xlab = "Média das idades")
lines(density(medias), col = "blue", lwd = 2)