Questões

VADeaths

df <- as.data.frame(VADeaths) %>%
rownames_to_column("AgeGroup") %>%
pivot_longer(-AgeGroup, names_to = "Group", values_to = "Deaths") %>%
separate(Group, into = c("Location","Sex"), sep = " ")


df$AgeGroup <- factor(df$AgeGroup, levels = rownames(VADeaths))
df$Location <- factor(df$Location, levels = c("Rural","Urban"))
df$Sex <- factor(df$Sex, levels = c("Male","Female"))


library(ggplot2)

df <- as.data.frame(VADeaths) %>%
  rownames_to_column("FaixaEtaria") %>%
  pivot_longer(-FaixaEtaria, names_to = "GrupoOriginal", values_to = "Taxa") %>%
  separate(GrupoOriginal, into = c("Localidade","Sexo"), sep = " ")

df$FaixaEtaria <- factor(df$FaixaEtaria, levels = rownames(VADeaths))

df$Localidade[df$Localidade == "Rural"] <- "Rural"
df$Localidade[df$Localidade == "Urban"] <- "Urbana"

df$Sexo[df$Sexo == "Male"] <- "Homens"
df$Sexo[df$Sexo == "Female"] <- "Mulheres"

df$Grupo <- paste(df$Localidade, df$Sexo, sep = " - ")

ggplot(df, aes(x = FaixaEtaria, y = Taxa,
               fill = Grupo,
               group = Grupo)) +
  geom_bar(stat = "identity", position = position_dodge(width = 0.9)) +
  labs(
    title = "Taxas de mortalidade por faixa etária, sexo e localidade",
    x = "Faixa etária",
    y = "Taxa de mortalidade",
    fill = "Grupo"
  ) +
  scale_fill_manual(values = c(
    "Rural - Homens" = "#c0392b",     
    "Rural - Mulheres" = "#e67e22",   
    "Urbana - Homens" = "#2980b9",    
    "Urbana - Mulheres" = "#27ae60"   
  )) +
  theme_minimal() +
  theme(plot.title = element_text(hjust = 0.5))

ClassificaçãoDoença

observacoes <- c(
  "moderado", "leve", "leve", "severo", "leve", "moderado", "moderado", "moderado",
  "leve", "leve", "severo", "leve", "moderado", "moderado", "leve", "severo",
  "moderado", "moderado", "moderado", "leve"
)

observacoes <- factor(observacoes, levels = c("leve", "moderado", "severo"))

contagens <- table(observacoes)
porcent <- round(100 * contagens / sum(contagens), 1)

rotulos <- paste0(porcent, "%")

# Cores
cores <- c("#66c2a5", "#fc8d62", "#8da0cb")

pie(contagens,
    labels = rotulos,
    col = cores,
    main = "Distribuição dos estágios da doença",
    clockwise = TRUE,
    cex = 0.9)

legend("topright",
       legend = paste0(names(contagens), " — ", as.vector(contagens), " (", porcent, "%)"),
       fill = cores,
       bty = "n")

Teorema

library(tidyverse)

flu <- read.csv("flu.csv")  

idade <- flu$age

# (1) Histograma da população

hist(idade,
     probability = TRUE,
     main = "Histograma da idade (população)",
     xlab = "Idade de morte",
     col = "lightblue",
     border = "white")

lines(density(idade), col = "red", lwd = 2)

# (2) Criar 200 médias amostrais com n = 35

set.seed(123)  

media_amostras <- replicate(200, mean(sample(idade, size = 35, replace = TRUE)))

# (3) Histograma das médias das amostras


df_media <- data.frame(media_amostras)

library(ggplot2)

min_x <- floor(min(media_amostras) / 5) * 5
max_x <- ceiling(max(media_amostras) / 5) * 5

ggplot(df_media, aes(x = media_amostras)) +
  geom_histogram(aes(y = ..density..),
                 bins = 15,
                 fill = "#b3e6b3",
                 color = "white") +
  stat_function(fun = dnorm,
                args = list(mean = mean(media_amostras),
                            sd = sd(media_amostras)),
                color = "red",
                linewidth = 1.5) +
  scale_x_continuous(breaks = seq(min_x, max_x, by = 5),
                     limits = c(min_x, max_x)) +
  labs(
    title = "Distribuição das médias amostrais (n = 35, k = 200)",
    x = "Média das idades",
    y = "Densidade"
  ) +
  theme_minimal() +
  theme(
    plot.title = element_text(hjust = 0.5, face = "bold")
  )