Neste gráfico, visualizamos as taxas de mortalidade na VirgÃnia em
1940, separadas por grupos etários e sexo, entre áreas rurais e urbanas.
Os dados são fornecidos pelo dataset VADeaths, já incluÃdo
no R.
# Carregar dataset incluÃdo no R
data("VADeaths")
# Carregar bibliotecas
library(tidyr)
library(dplyr)##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(ggplot2)
library(knitr)
# Converter para data.frame e adicionar coluna de grupo
df <- as.data.frame(VADeaths)
df$Grupo <- rownames(df)
# Reorganizar para formato longo
df_long <- pivot_longer(df, cols = -Grupo, names_to = "Categoria", values_to = "Taxa")
kable(head(df_long, 10), caption = "Tabela 1: Taxas de Mortalidade na VirgÃnia")| Grupo | Categoria | Taxa |
|---|---|---|
| 50-54 | Rural Male | 11.7 |
| 50-54 | Rural Female | 8.7 |
| 50-54 | Urban Male | 15.4 |
| 50-54 | Urban Female | 8.4 |
| 55-59 | Rural Male | 18.1 |
| 55-59 | Rural Female | 11.7 |
| 55-59 | Urban Male | 24.3 |
| 55-59 | Urban Female | 13.6 |
| 60-64 | Rural Male | 26.9 |
| 60-64 | Rural Female | 20.3 |
ggplot(df_long, aes(x = Categoria, y = Taxa, fill = Grupo)) +
geom_bar(stat = "identity", position = "dodge") +
labs(
title = "Taxas de Mortalidade na VirgÃnia - 1940",
x = "Categoria",
y = "Taxa por 1000 habitantes",
fill = "Grupo Etário"
) +
scale_fill_brewer(palette = "Set2") +
theme_minimal()# Dados de classificação dos pacientes
estagios <- c(
"moderado", "leve", "leve", "severo", "leve",
"moderado", "moderado", "moderado", "leve", "leve",
"severo", "leve", "moderado", "moderado", "leve",
"severo", "moderado", "moderado", "moderado", "leve"
)
# Tabela de frequências
tabela <- table(estagios)
# Cores para cada estágio
cores <- c("leve" = "lightblue", "moderado" = "orange", "severo" = "red")
# Porcentagens
porcentagens <- round(100 * tabela / sum(tabela), 1)
# Labels com porcentagens
labels <- paste(names(tabela), "-", porcentagens, "%")
# Gráfico de Pizza
pie(tabela,
col = cores[names(tabela)],
labels = labels,
main = "Classificação da Doença entre Pacientes"
)
# Legenda
legend("topright", legend = names(tabela), fill = cores[names(tabela)], title = "Estágio")##
## Attaching package: 'MASS'
## The following object is masked from 'package:dplyr':
##
## select
library(ggplot2)
library(dplyr)
set.seed(123)
flu_local <- read.csv('/Users/lucasaraujo/Projects/R_Projects/CPAD/flu.csv', header = TRUE)
# Se quiser só a coluna 'age'
flu_df <- data.frame(idade = flu_local$age)
# Confirme que está numérico
flu_df$idade <- as.numeric(flu_df$idade)
ggplot(flu_df, aes(x = idade)) +
geom_histogram(aes(y = ..density..), bins = 30, fill = "lightblue", color = "black") +
geom_density(color = "red", size = 1) +
labs(title = "Histograma e Curva de Densidade - População (Idades das Mortes)",
x = "Idade (anos)",
y = "Densidade") +
theme_minimal()## Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
## ℹ Please use `linewidth` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
## Warning: The dot-dot notation (`..density..`) was deprecated in ggplot2 3.4.0.
## ℹ Please use `after_stat(density)` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
library(knitr)
n <- 35 # tamanho da amostra
k <- 200 # número de amostras
medias <- replicate(k, mean(sample(flu_df$idade, size = n, replace = TRUE)))
medias_df <- data.frame(media_amostral = medias)
kable(head(medias_df, 10), caption = "Tabela 2: Médias Amostrais (n=35, 200 amostras)")| media_amostral |
|---|
| 38.88571 |
| 42.94286 |
| 48.51429 |
| 42.48571 |
| 40.34286 |
| 42.14286 |
| 44.94286 |
| 37.05714 |
| 48.14286 |
| 42.08571 |
ggplot(medias_df, aes(x = media_amostral)) +
geom_histogram(aes(y = ..density..), bins = 30, fill = "lightgreen", color = "black") +
geom_density(color = "blue", size = 1) +
labs(title = "Histograma e Curva de Densidade - Médias Amostrais (n=35, 200 amostras)",
x = "Média Amostral",
y = "Densidade") +
theme_minimal()