Respostas da 2ª VA de CPAD


VADeath

# Carregando dataset
data("VADeaths")
VADeaths
##       Rural Male Rural Female Urban Male Urban Female
## 50-54       11.7          8.7       15.4          8.4
## 55-59       18.1         11.7       24.3         13.6
## 60-64       26.9         20.3       37.0         19.3
## 65-69       41.0         30.9       54.6         35.1
## 70-74       66.0         54.3       71.1         50.0
# Gerando gráfico de barras empilhadas agrupadas
barplot(
  VADeaths,
  beside = TRUE,                  # barras lado a lado
  col = rainbow(nrow(VADeaths)),  # cores diferentes para cada grupo
  main = "Mortalidade na Virgínia (VADeaths)",
  xlab = "Categorias",
  ylab = "Taxas de Mortalidade por 100 mil"
)

# Adicionando legenda
legend(
  "topright",
  legend = rownames(VADeaths),
  fill = rainbow(nrow(VADeaths)),
  title = "Grupos"
)

ClassificaçãoDoença

# Dados dos estágios
estagios <- c(
  "moderado", "leve", "leve", "severo", "leve",
  "moderado", "moderado", "moderado", "leve", "leve",
  "severo", "leve", "moderado", "moderado", "leve",
  "severo", "moderado", "moderado", "moderado", "leve"
)

# Contagem das categorias
tab <- table(estagios)

# Cores das fatias
cores <- c("skyblue", "orange", "tomato")

# Porcentagens
pct <- round(tab / sum(tab) * 100, 1)
labels_pie <- paste(names(tab), "-", pct, "%")

# Gráfico de pizza
pie(
  tab,
  labels = labels_pie,
  col = cores,
  main = "Distribuição dos Estágios da Doença"
)

# Legenda
legend(
  "topright",
  legend = names(tab),
  fill = cores,
  title = "Estágios"
)

Teorema

flu <- read.csv("C:\\Users\\carlo\\Downloads\\flu.csv")

# Extraindo o vetor de idades
idades <- flu$age


# 1) Histograma + densidade da população (idades reais)

# A distribuição é bem irregular e longe de normal
hist(
  idades,
  breaks = 20,
  probability = TRUE,
  col = "lightblue",
  main = "Distribuição das Idades (População)",
  xlab = "Idade"
)

# Curva de densidade
lines(
  density(idades),
  col = "red",
  lwd = 2
)

# 2) Criar 200 médias amostrais com n = 35

set.seed(123)  # resultados reproduzíveis

n <- 35
num_amostras <- 200

medias_amostrais <- replicate(
  num_amostras,
  mean(sample(idades, n, replace = TRUE))
)

# 3) Histograma das médias + densidade

hist(
  medias_amostrais,
  probability = TRUE,
  breaks = 20,
  col = "lightgreen",
  main = "Distribuição das Médias Amostrais (n = 35)",
  xlab = "Média das Amostras"
)

lines(
  density(medias_amostrais),
  col = "blue",
  lwd = 2
)

Peso médio dos gatos da Ruralinda

# Dados do problema
N <- 300
sigma <- 0.5
E <- 0.1
Z <- 2.575   # 99% de confiança

# Cálculo do tamanho da amostra sem correção
n0 <- ((Z * sigma) / E)^2
n0
## [1] 165.7656
# Cálculo com correção para população finita
n <- (N * n0) / (N + n0 - 1)
n
## [1] 106.9995
# Duas casas decimais sem arredondar
n_duas_casas <- floor(n * 100) / 100
n_duas_casas
## [1] 106.99

Proporção de alunos comem acima de 500 gramas

# Média e desvio-padrão
mu <- 400
sigma <- 45

# Proporção acima de 500g
p <- 1 - pnorm(500, mean = mu, sd = sigma)
p
## [1] 0.01313415
# Convertendo para porcentagem com duas casas sem arredondar
p_pct <- floor(p * 10000) / 100
paste0(p_pct, "%")
## [1] "1.31%"

Intervalo de confiança de 98.5% da média de alturas das mulheres

# Carregar o arquivo
load("bdims.RData")

# Filtrar somente mulheres (sex == 0)
mulheres <- subset(bdims, sex == 0)

# Estatísticas básicas
media <- mean(mulheres$hgt)
sd <- sd(mulheres$hgt)
n <- nrow(mulheres)

# Nível de confiança 98.5%
alpha <- 1 - 0.985
z <- qnorm(1 - alpha/2)

# Intervalo de confiança
erro <- z * sd / sqrt(n)
lower <- media - erro
upper <- media + erro

# Mostrar no formato exigido
paste0("[",
       sprintf("%.2f", lower),
       "-",
       sprintf("%.2f", upper),
       "]")
## [1] "[163.89-165.86]"