Questões
VADeaths
df <- as.data.frame(VADeaths) %>%
rownames_to_column("AgeGroup") %>%
pivot_longer(-AgeGroup, names_to = "Group", values_to = "Deaths") %>%
separate(Group, into = c("Location","Sex"), sep = " ")
df$AgeGroup <- factor(df$AgeGroup, levels = rownames(VADeaths))
df$Location <- factor(df$Location, levels = c("Rural","Urban"))
df$Sex <- factor(df$Sex, levels = c("Male","Female"))
library(ggplot2)
df <- as.data.frame(VADeaths) %>%
rownames_to_column("FaixaEtaria") %>%
pivot_longer(-FaixaEtaria, names_to = "GrupoOriginal", values_to = "Taxa") %>%
separate(GrupoOriginal, into = c("Localidade","Sexo"), sep = " ")
df$FaixaEtaria <- factor(df$FaixaEtaria, levels = rownames(VADeaths))
df$Localidade[df$Localidade == "Rural"] <- "Rural"
df$Localidade[df$Localidade == "Urban"] <- "Urbana"
df$Sexo[df$Sexo == "Male"] <- "Homens"
df$Sexo[df$Sexo == "Female"] <- "Mulheres"
df$Grupo <- paste(df$Localidade, df$Sexo, sep = " - ")
ggplot(df, aes(x = FaixaEtaria, y = Taxa,
fill = Grupo,
group = Grupo)) +
geom_bar(stat = "identity", position = position_dodge(width = 0.9)) +
labs(
title = "Taxas de mortalidade por faixa etária, sexo e localidade",
x = "Faixa etária",
y = "Taxa de mortalidade",
fill = "Grupo"
) +
scale_fill_manual(values = c(
"Rural - Homens" = "#c0392b",
"Rural - Mulheres" = "#e67e22",
"Urbana - Homens" = "#2980b9",
"Urbana - Mulheres" = "#27ae60"
)) +
theme_minimal() +
theme(plot.title = element_text(hjust = 0.5))

ClassificaçãoDoença
observacoes <- c(
"moderado", "leve", "leve", "severo", "leve", "moderado", "moderado", "moderado",
"leve", "leve", "severo", "leve", "moderado", "moderado", "leve", "severo",
"moderado", "moderado", "moderado", "leve"
)
observacoes <- factor(observacoes, levels = c("leve", "moderado", "severo"))
contagens <- table(observacoes)
porcent <- round(100 * contagens / sum(contagens), 1)
rotulos <- paste0(porcent, "%")
# Cores
cores <- c("#66c2a5", "#fc8d62", "#8da0cb")
pie(contagens,
labels = rotulos,
col = cores,
main = "Distribuição dos estágios da doença",
clockwise = TRUE,
cex = 0.9)
legend("topright",
legend = paste0(names(contagens), " — ", as.vector(contagens), " (", porcent, "%)"),
fill = cores,
bty = "n")

Teorema
library(tidyverse)
flu <- read.csv("flu.csv")
idade <- flu$age
# (1) Histograma da população
hist(idade,
probability = TRUE,
main = "Histograma da idade (população)",
xlab = "Idade de morte",
col = "lightblue",
border = "white")
lines(density(idade), col = "red", lwd = 2)

# (2) Criar 200 médias amostrais com n = 35
set.seed(123)
media_amostras <- replicate(200, mean(sample(idade, size = 35, replace = TRUE)))
# (3) Histograma das médias das amostras
df_media <- data.frame(media_amostras)
library(ggplot2)
min_x <- floor(min(media_amostras) / 5) * 5
max_x <- ceiling(max(media_amostras) / 5) * 5
ggplot(df_media, aes(x = media_amostras)) +
geom_histogram(aes(y = ..density..),
bins = 15,
fill = "#b3e6b3",
color = "white") +
stat_function(fun = dnorm,
args = list(mean = mean(media_amostras),
sd = sd(media_amostras)),
color = "red",
linewidth = 1.5) +
scale_x_continuous(breaks = seq(min_x, max_x, by = 5),
limits = c(min_x, max_x)) +
labs(
title = "Distribuição das médias amostrais (n = 35, k = 200)",
x = "Média das idades",
y = "Densidade"
) +
theme_minimal() +
theme(
plot.title = element_text(hjust = 0.5, face = "bold")
)
