# Preparar os dados do dataset VADeaths para o ggplot
df_vadeaths <- as.data.frame(VADeaths) %>%
tibble::rownames_to_column("Faixa Etaria") %>%
pivot_longer(
cols = -`Faixa Etaria`,
names_to = "Grupo",
values_to = "Mortalidade"
)
# Criar o gráfico de barras agrupadas com ggplot2
ggplot(df_vadeaths, aes(x = `Faixa Etaria`, y = Mortalidade, fill = Grupo)) +
geom_bar(stat = "identity", position = position_dodge(width = 0.8), width = 0.7) +
scale_fill_brewer(palette = "Pastel1") +
labs(
title = "Taxas de Mortalidade por Grupo Etário e Região (Virginia, 1940)",
x = "Faixa Etária",
y = "Mortes por 1000 Habitantes",
fill = "Categoria"
) +
theme_minimal(base_size = 12) +
theme(
plot.title = element_text(hjust = 0.5, face = "bold", size = 16),
legend.position = "bottom",
axis.text.x = element_text(angle = 45, hjust = 1)
)
Gráfico de barras agrupadas mostrando as taxas de mortalidade na Virgínia em 1940.
# Dados dos pacientes
dados_pacientes <- c(
"moderado", "leve", "leve", "severo", "leve", "moderado", "moderado",
"moderado", "leve", "leve", "severo", "leve", "moderado", "moderado",
"leve", "severo", "moderado", "moderado", "moderado", "leve"
)
# Calcular frequências e porcentagens
frequencias <- table(dados_pacientes)
df_doenca <- as.data.frame(frequencias) %>%
rename(Estagio = dados_pacientes) %>%
mutate(
porcentagem = Freq / sum(Freq) * 100,
rotulo = paste0(Estagio, "\n", sprintf("%.1f%%", porcentagem))
)
# Criar o gráfico de pizza com ggplot2
ggplot(df_doenca, aes(x = "", y = porcentagem, fill = Estagio)) +
geom_bar(width = 1, stat = "identity") +
coord_polar("y", start = 0) +
geom_text(aes(label = rotulo), position = position_stack(vjust = 0.5), color = "white", size = 4) +
scale_fill_manual(values = c("leve" = "#4e79a7", "moderado" = "#f28e2b", "severo" = "#e15759")) +
labs(
title = "Distribuição de Estágios da Doença (n = 20 pacientes)",
fill = "Estágio"
) +
theme_void() +
theme(
plot.title = element_text(hjust = 0.5, face = "bold", size = 16),
legend.position = "right"
)
Gráfico de pizza mostrando a distribuição percentual dos estágios da doença.
# **CORREÇÃO FINAL: LENDO O ARQUIVO DO CAMINHO COMPLETO FORNECIDO**
# Define o caminho completo para o arquivo
caminho_arquivo_flu <- "/home/ianlucasalmeida/Mestrado/CPAD/flu.csv"
tryCatch({
# Ler o arquivo localmente do caminho absoluto
flu <- read.csv(caminho_arquivo_flu)
}, error = function(e) {
# Se o arquivo não for encontrado, esta mensagem de erro aparecerá.
stop(paste("ERRO: O arquivo não foi encontrado no caminho especificado:", caminho_arquivo_flu, ". Por favor, verifique se o caminho está correto e se o arquivo 'flu.csv' realmente existe nesse local."))
})
# O restante do código permanece o mesmo.
idades <- flu$age
# Configurar a área de plotagem para dois gráficos lado a lado
par(mfrow = c(1, 2))
# 1. Histograma da população original
hist(idades,
breaks = 15,
main = "Distribuição Original das Idades",
xlab = "Idade",
ylab = "Densidade",
col = "lightblue",
probability = TRUE)
lines(density(idades, na.rm = TRUE), col = "red", lwd = 2)
# 2. Gerar 200 médias de amostras com tamanho n = 35
set.seed(123)
medias_amostrais <- replicate(200, mean(sample(idades, 35, replace = TRUE)))
# 3. Histograma da distribuição das médias amostrais
hist(medias_amostrais,
breaks = 15,
main = "Distribuição das Médias Amostrais",
xlab = "Média das Idades (n=35)",
ylab = "Densidade",
col = "lightgreen",
probability = TRUE)
lines(density(medias_amostrais), col = "blue", lwd = 2)
Comparação da distribuição original das idades com a distribuição normal das médias amostrais.
# Resetar o layout da área de plotagem
par(mfrow = c(1, 1))