VADeaths

Preparação dos dados

library(ggplot2) # pacote utilizado na visualização dos gráficos

# Conversão do dataset VADeaths para data frame
df <- as.data.frame(VADeaths)

# coluna contendo os nomes dos grupos
df$Grupo <- rownames(df)

# Conversão para formato longo. Este formato é utilizado pelo pacote ggplot2
dados_long <- reshape(
  df,
  varying = colnames(df)[1:4],
  v.names = "Taxa_Mortalidade",
  timevar = "Faixa_Etaria",
  times = colnames(df)[1:4],
  direction = "long"
)

# Ajuste dos nomes das linhas e ordenação
rownames(dados_long) <- NULL
dados_long <- dados_long[, c("Grupo", "Faixa_Etaria", "Taxa_Mortalidade")]

# exibição dos primeiras linhas dos dados em questão
head(dados_long)
##   Grupo Faixa_Etaria Taxa_Mortalidade
## 1 50-54   Rural Male             11.7
## 2 55-59   Rural Male             18.1
## 3 60-64   Rural Male             26.9
## 4 65-69   Rural Male             41.0
## 5 70-74   Rural Male             66.0
## 6 50-54 Rural Female              8.7

exibição das primeiras linhas dos dados obtidos com o uso da função head().

Gráfico de barras agrupadas:

# construção do gráfico de barras agrupadas lado a lado
ggplot(dados_long, aes(x = Faixa_Etaria,
y = Taxa_Mortalidade,
fill = Grupo)) +
geom_bar(stat = "identity", position = "dodge") +
scale_fill_brewer(palette = "Set2") +
labs(
title = "Taxas de Mortalidade na Virgínia (VADeaths)",
x = "Faixa Etária",
y = "Taxa de Mortalidade",
fill = "Grupo"
) +
theme_minimal() +
theme(
plot.title = element_text(size = 20, face = "bold"),
axis.text = element_text(size = 14),
axis.title = element_text(size = 16)
)

ClassificaçãoDoença

Gráfico de pizza:

# Vetor contendo estágios dos pacientes
estagios <- c("moderado", "leve", "leve", "severo", "leve",
              "moderado", "moderado", "moderado", "leve", "leve",
              "severo", "leve", "moderado", "moderado", "leve",
              "severo", "moderado", "moderado", "moderado", "leve")

# contagem de cada categoria (frequência)
freq_estagios <- table(estagios)

# cálculo das porcentagens com duas casas decimais
porcentagens <- round(prop.table(freq_estagios) * 100, 2)

# criação dos rótulos para exibir no gráfico: nome + porcentagem
rotulos <- paste(names(freq_estagios), "-", porcentagens, "%")

# coloração para cada fatia
cores <- c("tomato", "lightgreen", "royalblue")

# criação do gráfico de pizza
pie(freq_estagios,
    labels = rotulos,
    col = cores,
    main = "Classificação da Doença por Estágio")

# inclusão da legenda no gráfico utlizando função legend()
legend("topright",
       legend = names(freq_estagios),
       fill = cores,
       title = "Estágios")

Teorema

PASSO 1: Mostre o histograma e a curva de densidade do conjunto de dados “flu”

# carregando o conjunto de dados flu do arquivo .csv
flu <- read.csv("flu.csv")

# Extraição da coluna age como vetor numérico
populacao <- flu$age


#  Histograma e curva de densidade da população
hist(populacao,
     breaks = 50,               # várias barras por causa do grande número de observações
     probability = TRUE,        # densidade
     col = "lightblue",
     border = "white",
     main = "Histograma das Idades das Mortes (População)",
     xlab = "Idade")

# curva de densidade
lines(density(populacao), col = "red", lwd = 2)

# Legenda
legend("topright",
       legend = c("Densidade"),
       col = c("red"),
       lwd = 2,
       bty = "n")

PASSO 2: Crie 200 médias de amostras da população com tamanho n = 35

set.seed(1205)  # para reproducibilidade

n_amostra <- 35
n_medias <- 200

medias_amostrais <- numeric(n_medias)  # vetor vazio para armazenar médias

for (i in 1:n_medias) {
  amostra <- sample(populacao, size = n_amostra, replace = TRUE)  # amostragem com reposição
  medias_amostrais[i] <- mean(amostra)
}

PASSO 3: Mostre o histograma com a curva de densidade para a médias das amostras

hist(medias_amostrais,
     breaks = 20,
     probability = TRUE,
     col = "darkorange",
     border = "aliceblue",
     main = "Histograma das Médias Amostrais (n = 35)",
     xlab = "Média das idades")

# Curva de densidade
lines(density(medias_amostrais), col = "blue", lwd = 2)

# Legenda
legend("topright",
       legend = c("Densidade"),
       col = c("blue"),
       lwd = 2,
       bty = "n")