Bibliotecas
library(tidyverse)
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ dplyr 1.1.4 ✔ readr 2.1.5
## ✔ forcats 1.0.1 ✔ stringr 1.5.2
## ✔ ggplot2 4.0.0 ✔ tibble 3.3.0
## ✔ lubridate 1.9.4 ✔ tidyr 1.3.1
## ✔ purrr 1.1.0
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag() masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
library(ggplot2)
Questões
VADeaths
Dados
df <- as.data.frame(as.table(VADeaths))
names(df) <- c("Grupo", "FaixaEtaria", "Taxa")
Gráfico
ggplot(df, aes(x = Grupo, y = Taxa, fill = FaixaEtaria)) +
geom_bar(stat = "identity", position = "stack") +
scale_fill_brewer(palette = "Set3") +
labs(
title = "Taxas de Mortalidade na Virgínia (VADeaths)",
x = "Grupo Populacional",
y = "Taxa de Mortalidade",
fill = "Faixa Etária"
) +
theme_minimal(base_size = 14)

ClassificaçãoDoença
Dados
dados <- c(
"moderado","leve","leve","severo","leve","moderado","moderado","moderado",
"leve","leve","severo","leve","moderado","moderado","leve","severo",
"moderado","moderado","moderado","leve"
)
Gráfico
# Contagem por categoria
tab <- table(dados)
# Porcentagens
pct <- round(tab / sum(tab) * 100, 1)
# Rótulos com porcentagem
labels <- paste0(names(tab), " - ", pct, "%")
# Cores
cores <- c("lightblue", "lightgreen", "tomato")
# Gráfico de pizza
pie(
tab,
labels = labels,
col = cores,
main = "Classificação da Doença nos Pacientes"
)
# Legenda
legend(
"topright",
legend = names(tab),
fill = cores,
cex = 0.9,
bty = "n"
)

Teorema
flu <- read.csv("flu.csv")
idade <- flu[[1]]
Histograma + curva de densidade da POPULAÇÃO
hist(
idade,
probability = TRUE,
col = "lightblue",
main = "Histograma da População (Idade das Mortes por Gripe Espanhola)",
xlab = "Idade"
)
lines(density(idade), col = "red", lwd = 2)

Criar 200 médias de amostras (n = 35)
set.seed(123)
n_amostra <- 35
num_medias <- 200
medias <- replicate(num_medias, mean(sample(idade, n_amostra, replace = TRUE)))
hist(
medias,
probability = TRUE,
col = "lightblue",
main = "Distribuição das Médias Amostrais (n = 35, 200 amostras)",
xlab = "Média da Idade"
)
lines(density(medias), col = "red", lwd = 2)
