2 VA
VADeaths
library(ggplot2)
library(reshape2)
## Warning: pacote 'reshape2' foi compilado no R versão 4.5.2
# Dataset pedido
data("VADeaths")
df <- as.data.frame(VADeaths)
df$Faixa <- rownames(df)
df_long <- melt(df, id.vars = "Faixa",
variable.name = "Grupo",
value.name = "Taxa")
# grafico das barras cruzando faixa etária e a taxa de mortalidade de cada grupo
ggplot(df_long, aes(x = Faixa, y = Taxa, fill = Grupo)) +
geom_bar(stat = "identity") +
labs(
title = "Mortalidade na Virgínia – Barras Empilhadas",
x = "Faixa Etária",
y = "Taxa",
fill = "Grupo"
) +
theme_bw()

ClassificaçãoDoença
# Dados
doenca <- c(
"moderado", "leve", "leve", "severo", "leve", "moderado", "moderado", "moderado", "leve", "leve", "severo","leve", "moderado", "moderado", "leve", "severo", "moderado", "moderado", "moderado","leve")
# Frequências
tab <- table(doenca)
# Porcentagens
pct <- round(tab / sum(tab) * 100, 2)
# Labels com porcentagem
lbl <- paste(names(tab), "-", pct, "%")
# Cores
cores <- c("yellow", "orange", "red")
# Gráfico de pizza
pie(
tab,
labels = lbl,
col = cores,
main = "Classificação dos Pacientes"
)
# Legenda
legend(
"topright",
legend = names(tab),
fill = cores,
cex = 1
)

Teorema
# 1. Carregar dataset
flu <- read.csv("flu.csv")
idade <- flu$age
# 1) Histograma e densidade da população
hist(idade,
breaks = 30,
freq = FALSE,
col = "lightgray",
main = "Distribuição das Idades",
xlab = "Idade",
ylab = "quantidade de mortes")
lines(density(idade), col = "red", lwd = 2)

# 2) Criando as 200 médias de amostras com n = 35
set.seed(123)
medias <- replicate(200, mean(sample(idade, 35, replace = TRUE)))
# 3) Histograma e a densidade das médias
hist(medias,
breaks = 15,
freq = FALSE,
col = "lightblue",
main = "Distribuição das Médias Amostrais",
xlab = "Média da Idade",
ylab = "Quantidade de mortes")
lines(density(medias), col = "darkblue", lwd = 2)

Peso dos gatos da Ruralinda
N <- 300 # numero de gatos da amostra
Z <- 2.575829 #Z obtido da tabela valor crítico da distribuição normal para 99%
sigma <- 0.5 #valor desvio-padrão para 0.5
E <- 0.1 #Valor maximo de erro amostral
n <- (N * (Z^2) * (sigma^2)) / (E^2 * (N - 1) + (Z^2) * (sigma^2))
n
## [1] 107.0438
Quantidade de comida ingerida no RU
alunos <- 1 - pnorm(500, mean = 400, sd = 45)
alunos <- alunos*100
alunos
## [1] 1.313415
bdims.RData
load("bdims.RData")
# filtrar só as mulheres
mulheres <- subset(bdims, sex == 0)
# a média
media <- mean(mulheres$hgt)
# o desvio padrão
desvio <- sd(mulheres$hgt)
# tamanho da amostra
n <- length(mulheres$hgt)
# nível 98.5%
z <- qnorm(0.9925) #obtido de1-0.985, sobrando 0.015, dai divide por /2 ficando 0.0075, com isso subtrai 1- 0.0075 = 0.9925, seguindo a logica estatistica de probabilidade acumulada
# margem de erro pedida
ME <- z * desvio / sqrt(n)
# intervalo de confiança
IC_inferior <- media - ME
IC_superior <- media + ME
IC_inferior
## [1] 163.8851
IC_superior
## [1] 165.8596