Questões

VADeaths

Visualize o dataset VADeaths (já incluído no R) e crie um gráfico de barras empilhadas desses dados, de modo que as barras estejam agrupadas (lado a lado) para cada categoria. Também defina uma cor diferente para cada grupo das categorias. Por fim, adicione título, legenda e nomes nos eixos.

# VADeaths dataset 

data("VADeaths")

# gráfico de barras empilhadas
VADeaths_long <- melt(VADeaths)
ggplot(VADeaths_long, aes(x = Var2, y = value, fill = Var1)) +
  geom_bar(stat = "identity", position = "dodge") +
  labs(title = "Taxas de Mortalidade na Virgínia - 1940",
       x = "Grupo Etário",
       y = "Taxa de Mortalidade",
       fill = "Categoria") +
  theme_minimal() +
  scale_fill_brewer(palette = "Set3")

Classificação Doença

Uma doença pode ser classificada em três estágios (leve, moderado e severo). Foram examinados 20 pacientes e obtidos os dados: moderado, leve, leve, severo, leve, moderado, moderado, moderado, leve, leve, severo,leve, moderado, moderado, leve, severo, moderado, moderado, moderado,leve. Com base nestes dados crie um gráfico de piza. Inclua a porcentagem de cada fatia, as cores das fatias e o nome do gráfico.

# dados dos pacientes(cdp)
cdp <- c("moderado", "leve", "leve", "severo", "leve", "moderado", "moderado", "moderado", "leve", "leve", "severo", "leve", "moderado", "moderado", "leve", "severo", "moderado", "moderado", "moderado", "leve")

# contagem de cada
contagem <- table(cdp)

# % de cada estágio
porcentagem <- round(100 * contagem / sum(contagem), 1)
labels <- paste(names(contagem), porcentagem, "%")

# cores de cada um
cores <- c("leve" = "lightblue", "moderado" = "pink", "severo" = "red")

# gráfico
pie(contagem, labels = labels, col = cores, main = "Gráfico de distribuição dos Estágios da Doença")

# legenda
legend("topright", legend = names(contagem), fill = cores)

Teorema

Nesta questão, demonstre o uso do teorema do limite central, usando o conjunto de dados “flu” que é altamente não normal. Esse dataset contém as frequências das idades das mortes durante a epidemia de gripe espanhola na Suíça em 1918. Considere a idade das mortes como a população. Execute os passos a seguir. (1) Mostre o histograma e a curva de densidade do conjunto de dados “flu”.

# dados
flu <- read.csv("C:/Users/Mille/Desktop/CPAD/flu.csv")

# histograma e a curva de densidade
ggplot(flu, aes(x = age)) +
  geom_histogram(aes(y = after_stat(density)), bins = 30, fill = "violet", color = "white") +
  geom_density(color = "red", linewidth = 1) +
  labs(title = " Curva e Histograma de Densidade das Idades das Mortes",
       x = "Idade",
       y = "Densidade") +
  theme_minimal()

  1. Crie 200 médias de amostras da população com tamanho n = 35.
n <- 35
num_amostras <- 200

# função para calcular a média das amostras
calcular_media_amostral <- function() {
  amostra <- sample(flu$age, n, replace = TRUE)
  return(mean(amostra))
}

# médias amostras
medias_amostrais <- replicate(num_amostras, calcular_media_amostral())
print(medias_amostrais)
##   [1] 38.65714 41.94286 40.08571 46.25714 37.77143 38.00000 44.42857 42.02857
##   [9] 46.85714 43.54286 39.31429 37.40000 35.54286 34.88571 46.85714 35.65714
##  [17] 42.57143 50.42857 50.20000 51.77143 43.11429 37.34286 41.68571 35.68571
##  [25] 48.80000 34.91429 42.02857 39.02857 37.54286 41.71429 39.51429 42.02857
##  [33] 40.85714 42.80000 47.80000 37.51429 42.11429 42.74286 38.22857 46.34286
##  [41] 46.40000 45.14286 39.37143 50.08571 45.65714 43.25714 48.51429 37.88571
##  [49] 40.91429 35.85714 43.62857 52.14286 50.74286 42.11429 42.68571 42.40000
##  [57] 40.37143 45.54286 41.31429 40.94286 41.88571 47.40000 50.82857 42.31429
##  [65] 38.74286 42.51429 47.57143 44.22857 40.65714 39.00000 44.31429 42.80000
##  [73] 40.60000 38.71429 44.02857 36.80000 43.54286 45.17143 42.91429 46.51429
##  [81] 43.45714 46.37143 40.48571 53.20000 35.05714 42.17143 40.51429 40.14286
##  [89] 43.71429 39.05714 45.00000 46.11429 53.85714 41.22857 45.51429 30.02857
##  [97] 51.68571 38.42857 37.57143 43.54286 47.11429 43.11429 53.82857 38.45714
## [105] 47.11429 41.57143 44.14286 40.94286 50.94286 40.97143 42.71429 41.22857
## [113] 44.88571 38.48571 42.14286 39.91429 48.28571 44.60000 47.62857 43.85714
## [121] 44.88571 39.88571 49.94286 42.60000 37.17143 44.11429 47.00000 49.42857
## [129] 45.48571 44.80000 50.45714 38.91429 43.11429 40.60000 43.37143 43.22857
## [137] 48.48571 33.91429 49.20000 38.62857 42.02857 34.45714 44.14286 40.25714
## [145] 43.34286 44.42857 39.94286 43.51429 39.97143 52.68571 53.77143 48.20000
## [153] 43.74286 43.20000 31.80000 35.14286 36.45714 40.31429 43.17143 45.40000
## [161] 49.97143 46.94286 36.45714 46.42857 47.48571 52.88571 43.11429 41.68571
## [169] 42.11429 42.97143 47.82857 41.08571 43.11429 38.65714 40.85714 43.31429
## [177] 41.97143 44.48571 51.11429 36.40000 36.57143 48.17143 43.51429 38.45714
## [185] 42.31429 41.80000 39.51429 49.34286 39.77143 40.48571 45.02857 45.00000
## [193] 36.08571 45.91429 49.60000 36.11429 38.45714 46.82857 47.31429 44.62857
  1. Mostre o histograma com a curva de densidade para a médias das amostras.
# histograma e a curva de densidade das das amostras
ggplot(data.frame(Media = medias_amostrais), aes(x = Media)) +
  geom_histogram(aes(y = after_stat(density)), bins = 30, fill = "pink", color = "white") +
  geom_density(color = "blue", linewidth = 1) +
  labs(title = "Curva e Histograma de Densidade das Médias das Amostras",
       x = "Média Amostras",
       y = "Densidade") +
  theme_minimal()