Inferencia estadistica

Prueba de la inferencia estadistica

Muestreo

Usando el set de datos incluidos en R llamados “cars”, haremos el ejercicio de muestreo

carros <- data.frame(cars)
dim(carros)

## [1] 50  2

Muestreo simple aleatorio

Si queremos muestrear una n de 30

set.seed(123) #numero semilla para obtener los mismos resultados 
n <- 30
muestramia <- sample(1:nrow(carros), size = n, replace = FALSE)
#replace sirve para indicar si las muestras se repetiran o no
muestramia

##  [1] 31 15 14  3 42 43 37 48 25 26 27  5 40 28  9 29  8 41  7 10 36 19  4 45 17
## [26] 11 32 21 12 49

Ordenar los datos

sort(muestramia, decreasing = FALSE)

##  [1]  3  4  5  7  8  9 10 11 12 14 15 17 19 21 25 26 27 28 29 31 32 36 37 40 41
## [26] 42 43 45 48 49

Tabla de datos

datatable(carros)

Muestreo de datos con dplyr

Esta es una herramienta del tidyverse

Muestreo aleatorio simple sin reemplazo con dplyr

carrosmuestramia <- carros %>%
  sample_n(size=n, replace = FALSE)
head(carrosmuestramia)

##   speed dist
## 1    18   42
## 2    20   56
## 3    23   54
## 4    10   18
## 5    10   34
## 6    20   52

Muestreo aleatorio simple con reemplazo usando dplyr

carrosmuestramia1 <- carros %>%
  sample_n(size=n, replace = TRUE)
head(carrosmuestramia1)

##   speed dist
## 1    15   54
## 2    17   50
## 3    13   26
## 4    17   40
## 5     9   10
## 6    20   64

muestreo ponderado (con pesos)

carrosmuestramia2 <- carros %>%
    sample_n(size=n, weight = dist)
head(carrosmuestramia2)

##   speed dist
## 1    24   93
## 2    15   20
## 3    14   36
## 4    25   85
## 5    20   52
## 6    10   18

Muestreo con ponderacion usando la fraccion

CanCarros <- data.frame(cars)
n <- 50
carros <- sample(1:nrow(CanCarros), size=n, replace=FALSE)
head(carros)

## [1] 46 17 50 35 40 30

Para muestrear una fraccion de 0.04 de la cantidad

carros.dist <- CanCarros %>%
  sample_frac(0.04)
head(carros.dist); dim(carros.dist)

##   speed dist
## 1    22   66
## 2    14   60

## [1] 2 2

AI2UC1_4

Jesus Omar Hernandez Iturbe

9/17/2021