Visualização de Dados

VADeaths

Aqui apresentamos a visualização do dataset VADeaths com as barras agrupadas lado a lado.

# 1. Carregar os dados (já existente no R Base)
data(VADeaths)

# 2. Definir uma paleta de cores para os grupos (Faixas etárias)
# O dataset tem 5 linhas (faixas etárias), então precisamos de 5 cores
cores <- c("#1f77b4", "#ff7f0e", "#2ca02c", "#d62728", "#9467bd")

# 3. Criar o Gráfico de Barras
# O parâmetro 'beside = TRUE' é o que coloca as barras lado a lado (agrupadas)
barplot(VADeaths, 
        beside = TRUE,                      # Barras lado a lado
        col = cores,                        # Cores definidas acima
        main = "Mortalidade na Virgínia (1940)", # Título
        xlab = "Grupos Populacionais",      # Nome do Eixo X
        ylab = "Taxa de Mortalidade (por 1000)", # Nome do Eixo Y
        legend.text = rownames(VADeaths),   # Legenda com as faixas etárias
        args.legend = list(x = "topright", bty = "n", inset=c(-0.05, -0.15)) # Ajuste da legenda
)

ClassificaçãoDoença

Nesta seção, analisamos a classificação do estágio da doença em 20 pacientes.

# 1. Criação do vetor de dados
pacientes <- c("moderado", "leve", "leve", "severo", "leve", "moderado", 
               "moderado", "moderado", "leve", "leve", "severo", "leve", 
               "moderado", "moderado", "leve", "severo", "moderado", 
               "moderado", "moderado", "leve")

# 2. Tabela de frequências (contagem)
contagem <- table(pacientes)

# 3. Cálculo das porcentagens
porcentagens <- round(100 * contagem / sum(contagem), 1)

# 4. Criação dos rótulos para as fatias (apenas a porcentagem)
rotulos <- paste(porcentagens, "%", sep = "")

# 5. Definição das cores (Leve, Moderado, Severo - ordem alfabética do R)
# O R ordena: Leve, Moderado, Severo. Vamos atribuir cores semânticas:
cores_doenca <- c("lightgreen", "gold", "indianred1")

# 6. Gráfico de Pizza
pie(contagem, 
    labels = rotulos,       # Mostra apenas a % na fatia
    col = cores_doenca,     # Cores definidas
    main = "Classificação de Doenças (20 Pacientes)", # Título
    radius = 1              # Tamanho do gráfico
)

# 7. Adicionando a Legenda (Categorias)
legend("topright", 
       legend = names(contagem), # Nomes: Leve, Moderado, Severo
       fill = cores_doenca,      # Caixinhas coloridas
       title = "Estágio",
       cex = 0.8,                # Tamanho da fonte da legenda
       bty = "n"                 # Remove a caixa em volta da legenda
)

Teorema

Nesta seção, demonstramos o Teorema do Limite Central usando o dataset da gripe espanhola.

# 1. Importar o arquivo local "flu.csv"
# Certifique-se de que o arquivo flu.csv está na mesma pasta do projeto no Posit Cloud
flu <- read.csv("flu.csv")

# Nota: Assumimos que a coluna com as idades se chama "age". 
# Se der erro, verifique o nome da coluna com names(flu) e ajuste abaixo.
populacao <- flu$age 

# CONFIGURAÇÃO DO LAYOUT: 1 linha, 2 colunas para mostrar os gráficos lado a lado
par(mfrow = c(1, 2))

# --- PASSO 1: Histograma e Densidade da População ---
# O parâmetro prob=TRUE é essencial para permitir a curva de densidade sobreposta
hist(populacao, 
     prob = TRUE, 
     main = "População (Original)", 
     xlab = "Idade das Mortes", 
     col = "lightblue",
     border = "white")

# Adicionar curva de densidade (linha vermelha)
lines(density(populacao, na.rm = TRUE), col = "red", lwd = 2)


# --- PASSO 2: Criar 200 médias de amostras (n=35) ---
# Usamos replicate() para repetir o processo de amostragem e média 200 vezes
n <- 35
num_simulacoes <- 200

medias_amostrais <- replicate(num_simulacoes, {
  amostra <- sample(populacao, n, replace = TRUE) # Tira uma amostra de 35
  mean(amostra, na.rm = TRUE)                     # Calcula a média dessa amostra
})


# --- PASSO 3: Histograma e Densidade das Médias ---
hist(medias_amostrais, 
     prob = TRUE, 
     main = "Médias das Amostras (TLC)", 
     xlab = "Média de Idade", 
     col = "lightgreen",
     border = "white")

# Adicionar curva de densidade (linha azul escura)
lines(density(medias_amostrais), col = "darkblue", lwd = 2)

# Restaurar layout gráfico padrão
par(mfrow = c(1, 1))