Visualização de Dados

VADeaths

# 1. Carregar as bibliotecas necessárias
library(ggplot2)
library(tidyr)
library(tibble)
data("VADeaths")

# Tratamento dos dados para formato longo (necessário para ggplot)
vadeaths_df <- as.data.frame(VADeaths) %>%
  rownames_to_column(var = "Faixa_Etaria") %>%
  pivot_longer(cols = -Faixa_Etaria, 
               names_to = "Categoria", 
               values_to = "Taxa_Mortalidade")

# Cores para cada categoria
cores <- c("Rural Male" = "#1b9e77", 
           "Rural Female" = "#d95f02", 
           "Urban Male" = "#7570b3", 
           "Urban Female" = "#e7298a")

# Gráfico de barras agrupadas
ggplot(vadeaths_df, aes(x = Faixa_Etaria, y = Taxa_Mortalidade, fill = Categoria)) +
  geom_bar(stat = "identity", position = "dodge", color = "black", width = 0.7) +
  geom_text(aes(label = Taxa_Mortalidade), 
            position = position_dodge(width = 0.7), 
            vjust = -0.5, size = 3) +
  scale_fill_manual(values = cores) +
  labs(title = "Taxas de Mortalidade na Virgínia (1940)",
       x = "Faixa Etária",
       y = "Taxa (por 1000 hab.)",
       fill = "Grupo") +
  theme_minimal() +
  theme(legend.position = "top")

ClassificaçãoDoença

# Dados da questão
pacientes <- c("moderado", "leve", "leve", "severo", "leve", "moderado", 
               "moderado", "moderado", "leve", "leve", "severo", "leve", 
               "moderado", "moderado", "leve", "severo", "moderado", 
               "moderado", "moderado", "leve")

# Frequências e porcentagens
freq <- table(pacientes)
pct <- round(prop.table(freq) * 100, 1)

# Rótulos do gráfico
labels_pizza <- paste(pct, "%", sep = "")

# Cores (Leve, Moderado, Severo)
cores_pizza <- c("lightgreen", "gold", "indianred1")

# Gráfico
pie(freq, 
    labels = labels_pizza, 
    col = cores_pizza, 
    main = "Classificação de Estágios da Doença (n=20)")

legend("topright", 
       legend = names(freq), 
       fill = cores_pizza, 
       title = "Estágio", 
       bty = "n")

Teorema

library(ggplot2)

# Carregando dados
flu <- read.csv("flu.csv")

# 1. Histograma da População
ggplot(flu, aes(x = age)) +
  geom_histogram(aes(y = after_stat(density)), bins = 30, fill = "lightblue", color = "black") +
  geom_density(color = "red", linewidth = 1) +
  labs(title = "Distribuição da População (Gripe Espanhola)",
       x = "Idade",
       y = "Densidade") +
  theme_minimal()

# 2. Simulação das Médias (TLC)
n <- 35
n_simulacoes <- 200
medias <- numeric(n_simulacoes)

set.seed(123)
for (i in 1:n_simulacoes) {
  amostra <- sample(flu$age, n, replace = TRUE)
  medias[i] <- mean(amostra)
}

dados_simulados <- data.frame(media = medias)

# 3. Histograma das Médias Amostrais
ggplot(dados_simulados, aes(x = media)) +
  geom_histogram(aes(y = after_stat(density)), bins = 20, fill = "lightgreen", color = "black") +
  geom_density(color = "blue", linewidth = 1) +
  # Curva normal de referência
  stat_function(fun = dnorm, 
                args = list(mean = mean(dados_simulados$media), sd = sd(dados_simulados$media)), 
                linetype = "dashed", color = "darkgray") +
  labs(title = "Distribuição das Médias (n=35)",
       x = "Média de Idade",
       y = "Densidade") +
  theme_minimal()