Visualize o dataset VADeaths (já incluído no R) e crie um gráfico de barras empilhadas desses dados, de modo que as barras estejam agrupadas (lado a lado) para cada categoria. Também defina uma cor diferente para cada grupo das categorias. Por fim, adicione título, legenda e nomes nos eixos.
# VADeaths dataset
data("VADeaths")
# gráfico de barras empilhadas
VADeaths_long <- melt(VADeaths)
ggplot(VADeaths_long, aes(x = Var2, y = value, fill = Var1)) +
geom_bar(stat = "identity", position = "dodge") +
labs(title = "Taxas de Mortalidade na Virgínia - 1940",
x = "Grupo Etário",
y = "Taxa de Mortalidade",
fill = "Categoria") +
theme_minimal() +
scale_fill_brewer(palette = "Set3")
Uma doença pode ser classificada em três estágios (leve, moderado e severo). Foram examinados 20 pacientes e obtidos os dados: moderado, leve, leve, severo, leve, moderado, moderado, moderado, leve, leve, severo,leve, moderado, moderado, leve, severo, moderado, moderado, moderado,leve. Com base nestes dados crie um gráfico de piza. Inclua a porcentagem de cada fatia, as cores das fatias e o nome do gráfico.
# dados dos pacientes(cdp)
cdp <- c("moderado", "leve", "leve", "severo", "leve", "moderado", "moderado", "moderado", "leve", "leve", "severo", "leve", "moderado", "moderado", "leve", "severo", "moderado", "moderado", "moderado", "leve")
# contagem de cada
contagem <- table(cdp)
# % de cada estágio
porcentagem <- round(100 * contagem / sum(contagem), 1)
labels <- paste(names(contagem), porcentagem, "%")
# cores de cada um
cores <- c("leve" = "lightblue", "moderado" = "pink", "severo" = "red")
# gráfico
pie(contagem, labels = labels, col = cores, main = "Gráfico de distribuição dos Estágios da Doença")
# legenda
legend("topright", legend = names(contagem), fill = cores)
Nesta questão, demonstre o uso do teorema do limite central, usando o conjunto de dados “flu” que é altamente não normal. Esse dataset contém as frequências das idades das mortes durante a epidemia de gripe espanhola na Suíça em 1918. Considere a idade das mortes como a população. Execute os passos a seguir. (1) Mostre o histograma e a curva de densidade do conjunto de dados “flu”.
# dados
flu <- read.csv("C:/Users/Mille/Desktop/CPAD/flu.csv")
# histograma e a curva de densidade
ggplot(flu, aes(x = age)) +
geom_histogram(aes(y = after_stat(density)), bins = 30, fill = "violet", color = "white") +
geom_density(color = "red", linewidth = 1) +
labs(title = " Curva e Histograma de Densidade das Idades das Mortes",
x = "Idade",
y = "Densidade") +
theme_minimal()
n <- 35
num_amostras <- 200
# função para calcular a média das amostras
calcular_media_amostral <- function() {
amostra <- sample(flu$age, n, replace = TRUE)
return(mean(amostra))
}
# médias amostras
medias_amostrais <- replicate(num_amostras, calcular_media_amostral())
print(medias_amostrais)
## [1] 38.65714 41.94286 40.08571 46.25714 37.77143 38.00000 44.42857 42.02857
## [9] 46.85714 43.54286 39.31429 37.40000 35.54286 34.88571 46.85714 35.65714
## [17] 42.57143 50.42857 50.20000 51.77143 43.11429 37.34286 41.68571 35.68571
## [25] 48.80000 34.91429 42.02857 39.02857 37.54286 41.71429 39.51429 42.02857
## [33] 40.85714 42.80000 47.80000 37.51429 42.11429 42.74286 38.22857 46.34286
## [41] 46.40000 45.14286 39.37143 50.08571 45.65714 43.25714 48.51429 37.88571
## [49] 40.91429 35.85714 43.62857 52.14286 50.74286 42.11429 42.68571 42.40000
## [57] 40.37143 45.54286 41.31429 40.94286 41.88571 47.40000 50.82857 42.31429
## [65] 38.74286 42.51429 47.57143 44.22857 40.65714 39.00000 44.31429 42.80000
## [73] 40.60000 38.71429 44.02857 36.80000 43.54286 45.17143 42.91429 46.51429
## [81] 43.45714 46.37143 40.48571 53.20000 35.05714 42.17143 40.51429 40.14286
## [89] 43.71429 39.05714 45.00000 46.11429 53.85714 41.22857 45.51429 30.02857
## [97] 51.68571 38.42857 37.57143 43.54286 47.11429 43.11429 53.82857 38.45714
## [105] 47.11429 41.57143 44.14286 40.94286 50.94286 40.97143 42.71429 41.22857
## [113] 44.88571 38.48571 42.14286 39.91429 48.28571 44.60000 47.62857 43.85714
## [121] 44.88571 39.88571 49.94286 42.60000 37.17143 44.11429 47.00000 49.42857
## [129] 45.48571 44.80000 50.45714 38.91429 43.11429 40.60000 43.37143 43.22857
## [137] 48.48571 33.91429 49.20000 38.62857 42.02857 34.45714 44.14286 40.25714
## [145] 43.34286 44.42857 39.94286 43.51429 39.97143 52.68571 53.77143 48.20000
## [153] 43.74286 43.20000 31.80000 35.14286 36.45714 40.31429 43.17143 45.40000
## [161] 49.97143 46.94286 36.45714 46.42857 47.48571 52.88571 43.11429 41.68571
## [169] 42.11429 42.97143 47.82857 41.08571 43.11429 38.65714 40.85714 43.31429
## [177] 41.97143 44.48571 51.11429 36.40000 36.57143 48.17143 43.51429 38.45714
## [185] 42.31429 41.80000 39.51429 49.34286 39.77143 40.48571 45.02857 45.00000
## [193] 36.08571 45.91429 49.60000 36.11429 38.45714 46.82857 47.31429 44.62857
# histograma e a curva de densidade das das amostras
ggplot(data.frame(Media = medias_amostrais), aes(x = Media)) +
geom_histogram(aes(y = after_stat(density)), bins = 30, fill = "pink", color = "white") +
geom_density(color = "blue", linewidth = 1) +
labs(title = "Curva e Histograma de Densidade das Médias das Amostras",
x = "Média Amostras",
y = "Densidade") +
theme_minimal()