Aqui apresentamos a visualização do dataset VADeaths com
as barras agrupadas lado a lado.
# 1. Carregar os dados (já existente no R Base)
data(VADeaths)
# 2. Definir uma paleta de cores para os grupos (Faixas etárias)
# O dataset tem 5 linhas (faixas etárias), então precisamos de 5 cores
cores <- c("#1f77b4", "#ff7f0e", "#2ca02c", "#d62728", "#9467bd")
# 3. Criar o Gráfico de Barras
# O parâmetro 'beside = TRUE' é o que coloca as barras lado a lado (agrupadas)
barplot(VADeaths,
beside = TRUE, # Barras lado a lado
col = cores, # Cores definidas acima
main = "Mortalidade na Virgínia (1940)", # Título
xlab = "Grupos Populacionais", # Nome do Eixo X
ylab = "Taxa de Mortalidade (por 1000)", # Nome do Eixo Y
legend.text = rownames(VADeaths), # Legenda com as faixas etárias
args.legend = list(x = "topright", bty = "n", inset=c(-0.05, -0.15)) # Ajuste da legenda
)
Nesta seção, analisamos a classificação do estágio da doença em 20 pacientes.
# 1. Criação do vetor de dados
pacientes <- c("moderado", "leve", "leve", "severo", "leve", "moderado",
"moderado", "moderado", "leve", "leve", "severo", "leve",
"moderado", "moderado", "leve", "severo", "moderado",
"moderado", "moderado", "leve")
# 2. Tabela de frequências (contagem)
contagem <- table(pacientes)
# 3. Cálculo das porcentagens
porcentagens <- round(100 * contagem / sum(contagem), 1)
# 4. Criação dos rótulos para as fatias (apenas a porcentagem)
rotulos <- paste(porcentagens, "%", sep = "")
# 5. Definição das cores (Leve, Moderado, Severo - ordem alfabética do R)
# O R ordena: Leve, Moderado, Severo. Vamos atribuir cores semânticas:
cores_doenca <- c("lightgreen", "gold", "indianred1")
# 6. Gráfico de Pizza
pie(contagem,
labels = rotulos, # Mostra apenas a % na fatia
col = cores_doenca, # Cores definidas
main = "Classificação de Doenças (20 Pacientes)", # Título
radius = 1 # Tamanho do gráfico
)
# 7. Adicionando a Legenda (Categorias)
legend("topright",
legend = names(contagem), # Nomes: Leve, Moderado, Severo
fill = cores_doenca, # Caixinhas coloridas
title = "Estágio",
cex = 0.8, # Tamanho da fonte da legenda
bty = "n" # Remove a caixa em volta da legenda
)
Nesta seção, demonstramos o Teorema do Limite Central usando o dataset da gripe espanhola.
# 1. Importar o arquivo local "flu.csv"
# Certifique-se de que o arquivo flu.csv está na mesma pasta do projeto no Posit Cloud
flu <- read.csv("flu.csv")
# Nota: Assumimos que a coluna com as idades se chama "age".
# Se der erro, verifique o nome da coluna com names(flu) e ajuste abaixo.
populacao <- flu$age
# CONFIGURAÇÃO DO LAYOUT: 1 linha, 2 colunas para mostrar os gráficos lado a lado
par(mfrow = c(1, 2))
# --- PASSO 1: Histograma e Densidade da População ---
# O parâmetro prob=TRUE é essencial para permitir a curva de densidade sobreposta
hist(populacao,
prob = TRUE,
main = "População (Original)",
xlab = "Idade das Mortes",
col = "lightblue",
border = "white")
# Adicionar curva de densidade (linha vermelha)
lines(density(populacao, na.rm = TRUE), col = "red", lwd = 2)
# --- PASSO 2: Criar 200 médias de amostras (n=35) ---
# Usamos replicate() para repetir o processo de amostragem e média 200 vezes
n <- 35
num_simulacoes <- 200
medias_amostrais <- replicate(num_simulacoes, {
amostra <- sample(populacao, n, replace = TRUE) # Tira uma amostra de 35
mean(amostra, na.rm = TRUE) # Calcula a média dessa amostra
})
# --- PASSO 3: Histograma e Densidade das Médias ---
hist(medias_amostrais,
prob = TRUE,
main = "Médias das Amostras (TLC)",
xlab = "Média de Idade",
col = "lightgreen",
border = "white")
# Adicionar curva de densidade (linha azul escura)
lines(density(medias_amostrais), col = "darkblue", lwd = 2)
# Restaurar layout gráfico padrão
par(mfrow = c(1, 1))