library(pacman)
p_load("base64enc", "htmltools", "mime", "xfun", "prettydoc","readr", "knitr","DT","dplyr", "ggplot2")
Prueba de la inferencia estadistica
Usando el set de datos incluidos en R llamados “cars”, haremos el ejercicio de muestreo
carros <- data.frame(cars)
dim(carros)
## [1] 50 2
Si queremos muestrear una n de 30
set.seed(123) #numero semilla para obtener los mismos resultados
n <- 30
muestramia <- sample(1:nrow(carros), size = n, replace = FALSE)
#replace sirve para indicar si las muestras se repetiran o no
muestramia
## [1] 31 15 14 3 42 43 37 48 25 26 27 5 40 28 9 29 8 41 7 10 36 19 4 45 17
## [26] 11 32 21 12 49
Ordenar los datos
sort(muestramia, decreasing = FALSE)
## [1] 3 4 5 7 8 9 10 11 12 14 15 17 19 21 25 26 27 28 29 31 32 36 37 40 41
## [26] 42 43 45 48 49
datatable(carros)
Esta es una herramienta del tidyverse
Muestreo aleatorio simple sin reemplazo con dplyr
carrosmuestramia <- carros %>%
sample_n(size=n, replace = FALSE)
head(carrosmuestramia)
## speed dist
## 1 18 42
## 2 20 56
## 3 23 54
## 4 10 18
## 5 10 34
## 6 20 52
Muestreo aleatorio simple con reemplazo usando dplyr
carrosmuestramia1 <- carros %>%
sample_n(size=n, replace = TRUE)
head(carrosmuestramia1)
## speed dist
## 1 15 54
## 2 17 50
## 3 13 26
## 4 17 40
## 5 9 10
## 6 20 64
carrosmuestramia2 <- carros %>%
sample_n(size=n, weight = dist)
head(carrosmuestramia2)
## speed dist
## 1 24 93
## 2 15 20
## 3 14 36
## 4 25 85
## 5 20 52
## 6 10 18
CanCarros <- data.frame(cars)
n <- 50
carros <- sample(1:nrow(CanCarros), size=n, replace=FALSE)
head(carros)
## [1] 46 17 50 35 40 30
carros.dist <- CanCarros %>%
sample_frac(0.04)
head(carros.dist); dim(carros.dist)
## speed dist
## 1 22 66
## 2 14 60
## [1] 2 2