Visualize o dataset VADeaths (já incluído no R) e crie um gráfico de barras empilhadas desses dados, de modo que as barras estejam agrupadas (lado a lado) para cada categoria. Também defina uma cor diferente para cada grupo das categorias. Por fim, adicione título, legenda e nomes nos eixos. Abaixo submeta o link do RPubs com o resultado dessa questão. Ela deve ficar dentro de uma aba chamada de “VADeaths”.
print(VADeaths)
## Rural Male Rural Female Urban Male Urban Female
## 50-54 11.7 8.7 15.4 8.4
## 55-59 18.1 11.7 24.3 13.6
## 60-64 26.9 20.3 37.0 19.3
## 65-69 41.0 30.9 54.6 35.1
## 70-74 66.0 54.3 71.1 50.0
barplot(
VADeaths,
beside = TRUE, # Agrupar as barras lado a lado
col = c("#1b9e77", "#d95f02", "#7570b3", "#e7298a"), # Cores para cada faixa etária
legend.text = TRUE, # Adicionar legenda automaticamente
args.legend = list(title = "Faixa Etária", x = "topright"),
main = "Taxas de Mortalidade na Virgínia (1940)",
xlab = "Grupo",
ylab = "Taxa de Mortalidade (por 1000)"
)
count_diseases <- c(8, 9, 3)
labels <- c("leve", "moderado", "severo")
percent <- round(count_diseases / sum(count_diseases) * 100)
lbls <- paste(percent, "%", sep = "")
pie(count_diseases, labels = lbls, main = "Gráfico de Estágios da Doença", col = rainbow(4))
legend("topright",
legend = labels,
cex = 0.8,
fill = rainbow(length(count_diseases)))
Nesta questão, demonstre o uso do teorema do limite central, usando o conjunto de dados “flu” que é altamente não normal. Esse dataset contém as frequências das idades das mortes durante a epidemia de gripe espanhola na Suíça em 1918. Considere a idade das mortes como a população. Execute os passos a seguir. (1)Mostre o histograma e a curva de densidade do conjunto de dados “flu”. (2) Crie 200 médias de amostras da população com tamanho n = 35. (3) Mostre o histograma com a curva de densidade para a médias das amostras. 4) Submeta o link do RPubs com o resultado das etapas anteriores . Essa questão deve ficar dentro de uma aba chamada de “Teorema”. Note que apenas um link do RPubs é necessário. Basta repetir o link abaixo se você já tiver submetido para outras questões.
flu <- read.csv("flu.csv")
flu_age <- flu$age
hist(flu_age, probability = TRUE, main = "Distribuição das Idades (População)",
xlab = "Idade", col = "lightblue", border = "black")
lines(density(flu_age), col = "red", lwd = 2)
### Amostragem
n <- 200
n_sample <- 35
# Inicializar um vetor para armazenar as médias
xbar <- rep(NA, n)
for (i in 1:n) {
sample <- sample(flu$age, size = n_sample, replace = TRUE)
xbar[i] <- mean(sample)
}
head(xbar)
## [1] 41.25714 44.65714 40.71429 46.22857 43.88571 42.77143
hist(xbar, probability = TRUE)
lines(density(xbar), col = "red", lwd = 2)