muestreo_aleatorio.R

#Cre una base de datos aleatorio para el ejemplo
#Esta tiene 50000 datos de dos variables: letras y números
datos <- data.frame(letter = sample(LETTERS, 50000, replace = TRUE), number = sample (1:10, 50000, replace = TRUE))
nrow(datos) #Vemos erl número de filas

## [1] 50000

head(datos) #Esta función muestra un fragmento de la base

##   letter number
## 1      Q      4
## 2      T      1
## 3      X      4
## 4      W      1
## 5      M      2
## 6      P      7

##Primera opción##
#Realizamos un muestro aletorio de 100 filas sin remplazo
#Necesitamos instalar un paquete llamado "dplyr" y cargarlo
require(dplyr) #Recuerda que si no lo tienes lo instalas con install.packages("dplyr")

## Loading required package: dplyr

## Warning: package 'dplyr' was built under R version 3.3.3

## 
## Attaching package: 'dplyr'

## The following objects are masked from 'package:stats':
## 
##     filter, lag

## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union

#Ahora si muestreamos
muestreo1 <- sample_n(datos, size= 100)
nrow(muestreo1)

## [1] 100

head(muestreo1)

##       letter number
## 38498      M      3
## 39971      C      3
## 28219      G      4
## 32014      P      6
## 2292       X      8
## 4252       S     10

##Segunda opción##
#generamos 100 números al azar para seleccionar las filas que necesitamos
#Recuerda que si nuestra base es de 50000 registros los números aleatorios deberan de ir de 1 a 50000

filas.random <- sample(1:50000, 100, replace= F)
filas.random

##   [1]  4642   363 29817 32332 18009  8086 33979  2715 11080  4328 23795
##  [12] 25982  5970  2083 19975 48766 10410 44585  3775 12236  5356 21674
##  [23]   418  1271 39784  5537  8167  2572 14322 27649  9781   124 38656
##  [34] 32611 22948 19302 48351  2873 10554 29026 45550 11674 21644 41512
##  [45] 20585 44037   185 45614 20336 47912 13507 30372 28856 34455  8290
##  [56] 28919 28879  3641 29818  2881 42438 44435  3239    75 23749   877
##  [67] 49176  6906 30102 46222 47032  3014 27897 24063 31016 42557 38709
##  [78] 23400  5914 25515 31614 31755 45134 10073 42414 17155 33912 16329
##  [89]  8579 35580 22202 18625 27694 22102 17684 21211 42420 38708 10640
## [100]  9823

#Selecionamnos los registros aleatorio

muestreo2 <- as.data.frame(datos[filas.random,])
nrow(muestreo2)

## [1] 100

head(muestreo2)

##       letter number
## 4642       F      1
## 363        L     10
## 29817      D      3
## 32332      A      1
## 18009      K      1
## 8086       F      1

muestreo_aleatorio.R

LeoPC

Thu Feb 21 12:41:49 2019