VADeaths

Neste gráfico, visualizamos as taxas de mortalidade na Virgínia em 1940, separadas por grupos etários e sexo, entre áreas rurais e urbanas. Os dados são fornecidos pelo dataset VADeaths, já incluído no R.

# Carregar dataset incluído no R
data("VADeaths")

# Carregar bibliotecas
library(tidyr)
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(ggplot2)
library(knitr)

# Converter para data.frame e adicionar coluna de grupo
df <- as.data.frame(VADeaths)
df$Grupo <- rownames(df)

# Reorganizar para formato longo
df_long <- pivot_longer(df, cols = -Grupo, names_to = "Categoria", values_to = "Taxa")
kable(head(df_long, 10), caption = "Tabela 1: Taxas de Mortalidade na Virgínia")
Tabela 1: Taxas de Mortalidade na Virgínia
Grupo Categoria Taxa
50-54 Rural Male 11.7
50-54 Rural Female 8.7
50-54 Urban Male 15.4
50-54 Urban Female 8.4
55-59 Rural Male 18.1
55-59 Rural Female 11.7
55-59 Urban Male 24.3
55-59 Urban Female 13.6
60-64 Rural Male 26.9
60-64 Rural Female 20.3
ggplot(df_long, aes(x = Categoria, y = Taxa, fill = Grupo)) +
  geom_bar(stat = "identity", position = "dodge") +
  labs(
    title = "Taxas de Mortalidade na Virgínia - 1940",
    x = "Categoria",
    y = "Taxa por 1000 habitantes",
    fill = "Grupo Etário"
  ) +
  scale_fill_brewer(palette = "Set2") +
  theme_minimal()

Classificação de Doenças

# Dados de classificação dos pacientes
estagios <- c(
  "moderado", "leve", "leve", "severo", "leve",
  "moderado", "moderado", "moderado", "leve", "leve",
  "severo", "leve", "moderado", "moderado", "leve",
  "severo", "moderado", "moderado", "moderado", "leve"
)

# Tabela de frequências
tabela <- table(estagios)

# Cores para cada estágio
cores <- c("leve" = "lightblue", "moderado" = "orange", "severo" = "red")

# Porcentagens
porcentagens <- round(100 * tabela / sum(tabela), 1)

# Labels com porcentagens
labels <- paste(names(tabela), "-", porcentagens, "%")

# Gráfico de Pizza
pie(tabela,
    col = cores[names(tabela)],
    labels = labels,
    main = "Classificação da Doença entre Pacientes"
)

# Legenda
legend("topright", legend = names(tabela), fill = cores[names(tabela)], title = "Estágio")

Teorema do limite central

Distribuição da população (idades das mortes)

library(flexdashboard)
library(MASS)
## 
## Attaching package: 'MASS'
## The following object is masked from 'package:dplyr':
## 
##     select
library(ggplot2)
library(dplyr)
set.seed(123)

flu_local <- read.csv('/Users/lucasaraujo/Projects/R_Projects/CPAD/flu.csv', header = TRUE)

# Se quiser só a coluna 'age'
flu_df <- data.frame(idade = flu_local$age)

# Confirme que está numérico
flu_df$idade <- as.numeric(flu_df$idade)


ggplot(flu_df, aes(x = idade)) +
  geom_histogram(aes(y = ..density..), bins = 30, fill = "lightblue", color = "black") +
  geom_density(color = "red", size = 1) +
  labs(title = "Histograma e Curva de Densidade - População (Idades das Mortes)",
       x = "Idade (anos)",
       y = "Densidade") +
  theme_minimal()
## Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
## ℹ Please use `linewidth` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
## Warning: The dot-dot notation (`..density..`) was deprecated in ggplot2 3.4.0.
## ℹ Please use `after_stat(density)` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.

Amostras e Médias Amostrais (n = 35, 200 amostras)

library(knitr)

n <- 35       # tamanho da amostra
k <- 200      # número de amostras

medias <- replicate(k, mean(sample(flu_df$idade, size = n, replace = TRUE)))

medias_df <- data.frame(media_amostral = medias)
kable(head(medias_df, 10), caption = "Tabela 2: Médias Amostrais (n=35, 200 amostras)")
Tabela 2: Médias Amostrais (n=35, 200 amostras)
media_amostral
38.88571
42.94286
48.51429
42.48571
40.34286
42.14286
44.94286
37.05714
48.14286
42.08571

Histograma das Médias Amostrais com Curva de Densidade

ggplot(medias_df, aes(x = media_amostral)) +
  geom_histogram(aes(y = ..density..), bins = 30, fill = "lightgreen", color = "black") +
  geom_density(color = "blue", size = 1) +
  labs(title = "Histograma e Curva de Densidade - Médias Amostrais (n=35, 200 amostras)",
       x = "Média Amostral",
       y = "Densidade") +
  theme_minimal()