2ª VA Computação para análise de dados
VADeaths
# Convertendo a matriz em um dataframe
VADeaths <- as.data.frame(VADeaths)
# Adicionando uma coluna para a idade
VADeaths$Age <- rownames(VADeaths)
# Convertendo os dados de formato largo para longo (tidy format) usando tidyr
VADeaths_tidy <- gather(VADeaths, Category, value, -Age)
# Criando o gráfico de barras empilhadas agrupadas
ggplot(VADeaths_tidy, aes(x = Age, y = value, fill = Category)) +
geom_bar(stat = "identity", position = "dodge") +
labs(title = "Numero de mortes por idade e categoria",
x = "Idade",
y = "Numero de Mortes",
fill = "Categoria") +
scale_fill_brewer(palette = "Set3") + # Escolha de cores
theme_minimal()

Classificação Doença
# Criando o vetor com os estágios da doença
dados <- c("moderado", "leve", "leve", "severo", "leve", "moderado", "moderado", "moderado", "leve", "leve", "severo", "leve", "moderado", "moderado", "leve", "severo", "moderado", "moderado", "moderado", "leve")
# Criando um dataframe com os dados
dados_df <- data.frame(Estagio = dados)
# Plot do gráfico
ggplot() +
geom_bar(data = dados_df, aes(x = "", fill = Estagio), width = 1) +
coord_polar("y", start = 0) +
scale_fill_manual(values = c("moderado" = "blue", "leve" = "green", "severo" = "red")) +
labs(title = "Distribuicao dos estagios da doenca") +
theme_void() +
theme(legend.position = "bottom") +
guides(fill = guide_legend(title = "Estagio"))

Teorema
# Carregar o conjunto de dados "flu"
flu <- read.csv(file = "flu.csv",
header = T,
strip.white = T,
na.strings = "",
sep = ";")
# Passo 1: Mostrar o histograma e a curva de densidade do conjunto de dados "flu"
hist(flu$age, breaks = 20, main = "Histograma da Idade das Mortes", xlab = "Idade", ylab = "Frequencia", col = "lightblue", border = "white")
lines(density(flu$age), col = "red", lwd = 2)

# Passo 2: Criar 200 médias de amostras da população com tamanho n = 35
n <- 35
n_samples <- 200
sample_means <- replicate(n_samples, mean(sample(flu$age, n)))
# Passo 3: Mostrar o histograma com a curva de densidade para as médias das amostras
hist(sample_means, breaks = 20, main = "Histograma das Medias das Amostras", xlab = "Medias", ylab = "Frequencia", col = "lightblue", border = "white")
lines(density(sample_means), col = "red", lwd = 2)
