Bibliotecas

library(tidyverse)
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ dplyr     1.1.4     ✔ readr     2.1.5
## ✔ forcats   1.0.1     ✔ stringr   1.5.2
## ✔ ggplot2   4.0.0     ✔ tibble    3.3.0
## ✔ lubridate 1.9.4     ✔ tidyr     1.3.1
## ✔ purrr     1.1.0     
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag()    masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
library(ggplot2)

Questões

VADeaths

Dados

df <- as.data.frame(as.table(VADeaths))
names(df) <- c("Grupo", "FaixaEtaria", "Taxa")

Gráfico

ggplot(df, aes(x = Grupo, y = Taxa, fill = FaixaEtaria)) +
  geom_bar(stat = "identity", position = "stack") +
  scale_fill_brewer(palette = "Set3") +
  labs(
    title = "Taxas de Mortalidade na Virgínia (VADeaths)",
    x = "Grupo Populacional",
    y = "Taxa de Mortalidade",
    fill = "Faixa Etária"
  ) +
  theme_minimal(base_size = 14)

ClassificaçãoDoença

Dados

dados <- c(
  "moderado","leve","leve","severo","leve","moderado","moderado","moderado",
  "leve","leve","severo","leve","moderado","moderado","leve","severo",
  "moderado","moderado","moderado","leve"
)

Gráfico

# Contagem por categoria
tab <- table(dados)

# Porcentagens
pct <- round(tab / sum(tab) * 100, 1)

# Rótulos com porcentagem
labels <- paste0(names(tab), " - ", pct, "%")

# Cores
cores <- c("lightblue", "lightgreen", "tomato")

# Gráfico de pizza
pie(
  tab,
  labels = labels,
  col = cores,
  main = "Classificação da Doença nos Pacientes"
)

# Legenda
legend(
  "topright",
  legend = names(tab),
  fill = cores,
  cex = 0.9,
  bty = "n"
)

Teorema

flu <- read.csv("flu.csv")

idade <- flu[[1]]

Histograma + curva de densidade da POPULAÇÃO

hist(
  idade,
  probability = TRUE,
  col = "lightblue",
  main = "Histograma da População (Idade das Mortes por Gripe Espanhola)",
  xlab = "Idade"
)
lines(density(idade), col = "red", lwd = 2)

Criar 200 médias de amostras (n = 35)

set.seed(123)  

n_amostra <- 35
num_medias <- 200

medias <- replicate(num_medias, mean(sample(idade, n_amostra, replace = TRUE)))
hist(
  medias,
  probability = TRUE,
  col = "lightblue",
  main = "Distribuição das Médias Amostrais (n = 35, 200 amostras)",
  xlab = "Média da Idade"
)
lines(density(medias), col = "red", lwd = 2)