Visualização de Dados
VADeaths
# 1. Carregar as bibliotecas necessárias
library(ggplot2)
library(tidyr)
library(tibble)
data("VADeaths")
# Tratamento dos dados para formato longo (necessário para ggplot)
vadeaths_df <- as.data.frame(VADeaths) %>%
rownames_to_column(var = "Faixa_Etaria") %>%
pivot_longer(cols = -Faixa_Etaria,
names_to = "Categoria",
values_to = "Taxa_Mortalidade")
# Cores para cada categoria
cores <- c("Rural Male" = "#1b9e77",
"Rural Female" = "#d95f02",
"Urban Male" = "#7570b3",
"Urban Female" = "#e7298a")
# Gráfico de barras agrupadas
ggplot(vadeaths_df, aes(x = Faixa_Etaria, y = Taxa_Mortalidade, fill = Categoria)) +
geom_bar(stat = "identity", position = "dodge", color = "black", width = 0.7) +
geom_text(aes(label = Taxa_Mortalidade),
position = position_dodge(width = 0.7),
vjust = -0.5, size = 3) +
scale_fill_manual(values = cores) +
labs(title = "Taxas de Mortalidade na Virgínia (1940)",
x = "Faixa Etária",
y = "Taxa (por 1000 hab.)",
fill = "Grupo") +
theme_minimal() +
theme(legend.position = "top")

ClassificaçãoDoença
# Dados da questão
pacientes <- c("moderado", "leve", "leve", "severo", "leve", "moderado",
"moderado", "moderado", "leve", "leve", "severo", "leve",
"moderado", "moderado", "leve", "severo", "moderado",
"moderado", "moderado", "leve")
# Frequências e porcentagens
freq <- table(pacientes)
pct <- round(prop.table(freq) * 100, 1)
# Rótulos do gráfico
labels_pizza <- paste(pct, "%", sep = "")
# Cores (Leve, Moderado, Severo)
cores_pizza <- c("lightgreen", "gold", "indianred1")
# Gráfico
pie(freq,
labels = labels_pizza,
col = cores_pizza,
main = "Classificação de Estágios da Doença (n=20)")
legend("topright",
legend = names(freq),
fill = cores_pizza,
title = "Estágio",
bty = "n")

Teorema
library(ggplot2)
# Carregando dados
flu <- read.csv("flu.csv")
# 1. Histograma da População
ggplot(flu, aes(x = age)) +
geom_histogram(aes(y = after_stat(density)), bins = 30, fill = "lightblue", color = "black") +
geom_density(color = "red", linewidth = 1) +
labs(title = "Distribuição da População (Gripe Espanhola)",
x = "Idade",
y = "Densidade") +
theme_minimal()

# 2. Simulação das Médias (TLC)
n <- 35
n_simulacoes <- 200
medias <- numeric(n_simulacoes)
set.seed(123)
for (i in 1:n_simulacoes) {
amostra <- sample(flu$age, n, replace = TRUE)
medias[i] <- mean(amostra)
}
dados_simulados <- data.frame(media = medias)
# 3. Histograma das Médias Amostrais
ggplot(dados_simulados, aes(x = media)) +
geom_histogram(aes(y = after_stat(density)), bins = 20, fill = "lightgreen", color = "black") +
geom_density(color = "blue", linewidth = 1) +
# Curva normal de referência
stat_function(fun = dnorm,
args = list(mean = mean(dados_simulados$media), sd = sd(dados_simulados$media)),
linetype = "dashed", color = "darkgray") +
labs(title = "Distribuição das Médias (n=35)",
x = "Média de Idade",
y = "Densidade") +
theme_minimal()
