#Cre una base de datos aleatorio para el ejemplo
#Esta tiene 50000 datos de dos variables: letras y números
datos <- data.frame(letter = sample(LETTERS, 50000, replace = TRUE), number = sample (1:10, 50000, replace = TRUE))
nrow(datos) #Vemos erl número de filas
## [1] 50000
head(datos) #Esta función muestra un fragmento de la base
## letter number
## 1 Q 4
## 2 T 1
## 3 X 4
## 4 W 1
## 5 M 2
## 6 P 7
##Primera opción##
#Realizamos un muestro aletorio de 100 filas sin remplazo
#Necesitamos instalar un paquete llamado "dplyr" y cargarlo
require(dplyr) #Recuerda que si no lo tienes lo instalas con install.packages("dplyr")
## Loading required package: dplyr
## Warning: package 'dplyr' was built under R version 3.3.3
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
#Ahora si muestreamos
muestreo1 <- sample_n(datos, size= 100)
nrow(muestreo1)
## [1] 100
head(muestreo1)
## letter number
## 38498 M 3
## 39971 C 3
## 28219 G 4
## 32014 P 6
## 2292 X 8
## 4252 S 10
##Segunda opción##
#generamos 100 números al azar para seleccionar las filas que necesitamos
#Recuerda que si nuestra base es de 50000 registros los números aleatorios deberan de ir de 1 a 50000
filas.random <- sample(1:50000, 100, replace= F)
filas.random
## [1] 4642 363 29817 32332 18009 8086 33979 2715 11080 4328 23795
## [12] 25982 5970 2083 19975 48766 10410 44585 3775 12236 5356 21674
## [23] 418 1271 39784 5537 8167 2572 14322 27649 9781 124 38656
## [34] 32611 22948 19302 48351 2873 10554 29026 45550 11674 21644 41512
## [45] 20585 44037 185 45614 20336 47912 13507 30372 28856 34455 8290
## [56] 28919 28879 3641 29818 2881 42438 44435 3239 75 23749 877
## [67] 49176 6906 30102 46222 47032 3014 27897 24063 31016 42557 38709
## [78] 23400 5914 25515 31614 31755 45134 10073 42414 17155 33912 16329
## [89] 8579 35580 22202 18625 27694 22102 17684 21211 42420 38708 10640
## [100] 9823
#Selecionamnos los registros aleatorio
muestreo2 <- as.data.frame(datos[filas.random,])
nrow(muestreo2)
## [1] 100
head(muestreo2)
## letter number
## 4642 F 1
## 363 L 10
## 29817 D 3
## 32332 A 1
## 18009 K 1
## 8086 F 1