library(ggplot2) # pacote utilizado na visualização dos gráficos
# Conversão do dataset VADeaths para data frame
df <- as.data.frame(VADeaths)
# coluna contendo os nomes dos grupos
df$Grupo <- rownames(df)
# Conversão para formato longo. Este formato é utilizado pelo pacote ggplot2
dados_long <- reshape(
df,
varying = colnames(df)[1:4],
v.names = "Taxa_Mortalidade",
timevar = "Faixa_Etaria",
times = colnames(df)[1:4],
direction = "long"
)
# Ajuste dos nomes das linhas e ordenação
rownames(dados_long) <- NULL
dados_long <- dados_long[, c("Grupo", "Faixa_Etaria", "Taxa_Mortalidade")]
# exibição dos primeiras linhas dos dados em questão
head(dados_long)
## Grupo Faixa_Etaria Taxa_Mortalidade
## 1 50-54 Rural Male 11.7
## 2 55-59 Rural Male 18.1
## 3 60-64 Rural Male 26.9
## 4 65-69 Rural Male 41.0
## 5 70-74 Rural Male 66.0
## 6 50-54 Rural Female 8.7
exibição das primeiras linhas dos dados obtidos com o uso da função
head().
# construção do gráfico de barras agrupadas lado a lado
ggplot(dados_long, aes(x = Faixa_Etaria,
y = Taxa_Mortalidade,
fill = Grupo)) +
geom_bar(stat = "identity", position = "dodge") +
scale_fill_brewer(palette = "Set2") +
labs(
title = "Taxas de Mortalidade na Virgínia (VADeaths)",
x = "Faixa Etária",
y = "Taxa de Mortalidade",
fill = "Grupo"
) +
theme_minimal() +
theme(
plot.title = element_text(size = 20, face = "bold"),
axis.text = element_text(size = 14),
axis.title = element_text(size = 16)
)
# Vetor contendo estágios dos pacientes
estagios <- c("moderado", "leve", "leve", "severo", "leve",
"moderado", "moderado", "moderado", "leve", "leve",
"severo", "leve", "moderado", "moderado", "leve",
"severo", "moderado", "moderado", "moderado", "leve")
# contagem de cada categoria (frequência)
freq_estagios <- table(estagios)
# cálculo das porcentagens com duas casas decimais
porcentagens <- round(prop.table(freq_estagios) * 100, 2)
# criação dos rótulos para exibir no gráfico: nome + porcentagem
rotulos <- paste(names(freq_estagios), "-", porcentagens, "%")
# coloração para cada fatia
cores <- c("tomato", "lightgreen", "royalblue")
# criação do gráfico de pizza
pie(freq_estagios,
labels = rotulos,
col = cores,
main = "Classificação da Doença por Estágio")
# inclusão da legenda no gráfico utlizando função legend()
legend("topright",
legend = names(freq_estagios),
fill = cores,
title = "Estágios")
# carregando o conjunto de dados flu do arquivo .csv
flu <- read.csv("flu.csv")
# Extraição da coluna age como vetor numérico
populacao <- flu$age
# Histograma e curva de densidade da população
hist(populacao,
breaks = 50, # várias barras por causa do grande número de observações
probability = TRUE, # densidade
col = "lightblue",
border = "white",
main = "Histograma das Idades das Mortes (População)",
xlab = "Idade")
# curva de densidade
lines(density(populacao), col = "red", lwd = 2)
# Legenda
legend("topright",
legend = c("Densidade"),
col = c("red"),
lwd = 2,
bty = "n")
set.seed(1205) # para reproducibilidade
n_amostra <- 35
n_medias <- 200
medias_amostrais <- numeric(n_medias) # vetor vazio para armazenar médias
for (i in 1:n_medias) {
amostra <- sample(populacao, size = n_amostra, replace = TRUE) # amostragem com reposição
medias_amostrais[i] <- mean(amostra)
}
hist(medias_amostrais,
breaks = 20,
probability = TRUE,
col = "darkorange",
border = "aliceblue",
main = "Histograma das Médias Amostrais (n = 35)",
xlab = "Média das idades")
# Curva de densidade
lines(density(medias_amostrais), col = "blue", lwd = 2)
# Legenda
legend("topright",
legend = c("Densidade"),
col = c("blue"),
lwd = 2,
bty = "n")