2 VA
VADeaths
library(tidyverse)
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ dplyr 1.1.3 ✔ readr 2.1.4
## ✔ forcats 1.0.0 ✔ stringr 1.5.0
## ✔ ggplot2 3.4.4 ✔ tibble 3.2.1
## ✔ lubridate 1.9.3 ✔ tidyr 1.3.0
## ✔ purrr 1.0.2
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag() masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
data(VADeaths)
df <- as.data.frame(VADeaths)
df$AgeGroup <- rownames(df)
cores <- c("Rural Male" = "DarkGreen", "Rural Female" = "LightGreen", "Urban Male" = "DarkGray", "Urban Female" = "LightGray")
df_long <- df %>%
pivot_longer(cols = -AgeGroup, names_to = "Category", values_to = "Frequency")
ggplot(df_long, aes(x = AgeGroup, y = Frequency, fill = Category)) +
geom_bar(stat = "identity", position = "dodge") +
scale_fill_manual(values = cores) +
labs(title = "Mortes por Categoria", x = "Faixa Etária", y = "Frequência", fill = "Categoria") +
theme_minimal()

ClassificaçãoDoença
pacientes <- c("moderado", "leve", "leve", "severo", "leve", "moderado", "moderado", "moderado", "leve", "leve", "severo","leve", "moderado", "moderado", "leve", "severo", "moderado", "moderado", "moderado","leve")
freq <- table(pacientes)
cores <- c("leve" = "orange", "moderado" = "red", "severo" = "purple")
pie(freq, labels = paste0(names(freq), "\n", round(prop.table(freq) * 100, 1), "%"), col = cores[names(freq)], main = "Estágios da doença")
legend("topright", legend = names(freq), fill = cores[names(freq)])

Teorema
library(ggplot2)
flu <- read_csv("flu.csv")
## Rows: 75034 Columns: 1
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ","
## dbl (1): age
##
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
ggplot(flu, aes(x = age)) +
geom_histogram(aes(y = ..density..), bins = 30, fill = "lightgreen", color = "black") +
geom_density(color = "red") +
theme_minimal() +
labs(title = "Histograma e Densidade do Conjunto de Dados 'flu'", x = "Idade", y = "Densidade")

num_samples <- 200
sample_size <- 35
sample_means <- numeric(num_samples)
set.seed(123)
for (i in 1:num_samples) {
sample <- sample(flu$age, size = sample_size)
sample_means[i] <- mean(sample)
}
head(sample_means)
## [1] 38.88571 42.94286 48.51429 42.48571 40.34286 42.14286
sample_means_df <- data.frame(sample_means = sample_means)
ggplot(sample_means_df, aes(x = sample_means)) +
geom_histogram(aes(y = ..density..), bins = 30, fill = "lightgreen", color = "black") +
geom_density(color = "red") +
theme_minimal() +
labs(title = "Histograma e Densidade das Médias das Amostras", x = "Média da Amostra", y = "Densidade")

Amostra
Z <- 2.576 # Valor Z para um nível de confiança de 99%
sigma <- 0.5 # Desvio padrão da população
E <- 0.1 # Erro amostral desejado
N <- 300 # Tamanho da população
n <- (Z * sigma / E)^2
if (n > N * 0.05) {
n <- n / (1 + (n - 1) / N)
}
n <- round(n, 2)
cat("O tamanho da amostra é", n)
## O tamanho da amostra é 107.05
Porcentagem
x <- 500 # Pontuação bruta
mu <- 400 # Média da população
sigma <- 45 # Desvio padrão da população
z <- (x - mu) / sigma
p_less_than_x <- pnorm(z)
p_more_than_x <- 1 - p_less_than_x
p_more_than_x_percent <- round(p_more_than_x * 100, 2)
cat(p_more_than_x_percent,"%")
## 1.31 %
Bdims
load("bdims.RData")
women_data <- subset(bdims, sex == 0)
result <- t.test(women_data$hgt, conf.level = 0.985)
ci <- round(result$conf.int, 2)
ci_formatted <- paste0("Intervalo de Confianca: ","[", sprintf("%.2f", ci[1]), "-", sprintf("%.2f", ci[2]), "]")
ci_formatted
## [1] "Intervalo de Confianca: [163.88-165.87]"