Yandira Cuvero
2017 - 11 - 30
En esta clase estudiaremos:
Población objetivo
La totalidad de los elementos bajo discusión y sobre los cuales se desea contar con información se conoce como población objetivo.
Muestra
Se llama muestra a cualquier subconjunto de la población objetivo.
Unidad de muestreo
Es el objetivo a ser seleccionado en la muestra que permitirá el acceso a la unidad de observación.
Unidad de observación
Es el objetivo sobre el que finalmente se realiza la medición.
Variable de interés
Es la característica propia de los individuos sobre la que se realiza la inferencia para resolver los objetivos de la investigación.
No probabilísticas No permiten cuantificar el error de muestreo. Ejemplos de este caso:
Cuotas
La versión no probabilística del muestreo estratificado.
Conveniencia
Los individuos empleados en la investigación se seleccionan porque están fácilmente disponibles.
Voluntarios
Los individuos, voluntariamente, suministra información sin ser seleccionado.
Probabilísticas
El muestreo trata, con investigaciones parciales sobre la población, inferir los resultados sobre la población completa.
Es el error que resulta al investigar solo una parte de la población.
#ventajas
Una buena muestra refleja de manera muy cercana las características de interés de la población evaluada.
Variable de interés Es la característica propia de los individuos sobre la que se realiza la inferencia para resolver los objetivos de la investigación.
Unidad de muestreo es el elemento de la población a investigar y la unión de todas ellas forma la población a investigar.
Marco muestral es una lista de las unidades de muestreo, el cual se utiliza para seleccionar una parte de la población, denominada muestra.
Un buen marco muestral cumple las siguientes características:
Consideremos un estudio en el que buscamos determinar las características de las flores de lirio, la cual se divide en tres tipos: setosa, versicolor y virginica. Para saber más…
dim(iris) #dimensión de la base
[1] 150 5
head(iris) #primeros elementos de la base
Sepal.Length Sepal.Width Petal.Length Petal.Width Species
1 5.1 3.5 1.4 0.2 setosa
2 4.9 3.0 1.4 0.2 setosa
3 4.7 3.2 1.3 0.2 setosa
4 4.6 3.1 1.5 0.2 setosa
5 5.0 3.6 1.4 0.2 setosa
6 5.4 3.9 1.7 0.4 setosa
Al construir el marco muestral se debe evitar el sesgo de selección el cual ocurre cuando una parte de la población objetivo no está en el marco muestral. La muestra se sesga porque es más fácil seleccionar una unidad que otras o las unidades seleccionadas no representan a la población.
#tipos dentro de una variable categórica
levels(as.factor(iris$Species))
[1] "setosa" "versicolor" "virginica"
lirios <- iris
lirios$id <- 1:150
lirios[1:5,4:6]
Petal.Width Species id
1 0.2 setosa 1
2 0.2 setosa 2
3 0.2 setosa 3
4 0.2 setosa 4
5 0.2 setosa 5
Se consideran diseños de muestreo simple los siguientes:
Diseños de muestreo complejos son los que combinan dos o más diseños simples.
Consiste en seleccionar n unidades de manera completamente aleatoria de la población N. Puede realizarse con o sin reposición. En el muestreo con reposición las unidades de la población pueden figurar más de una vez en la muestra. En el muestreo sin reposición, cada unidad de la muestra sólo puede figurar una vez en ella.
En R el código correspondiente es:
#asignación de semilla
set.seed(20170704)
sample(lirios$id, size = 6, replace = FALSE)
[1] 21 3 74 4 63 88
sample(lirios$id, size = 6, replace = TRUE)
[1] 119 118 75 77 58 106
Las unidades de la población se dividen en grupos llamados clusters o conglomerados formando estos una nueva población (de unidades agregadas). Para seleccionar la muestra de estas nuevas unidades, se eligen conglomerados (por ejemplo, por muestreo aleatorio simple) y la muestra de unidades resulta de censar a todas las unidades dentro del conglomerado.
set.seed(20170701)
x <- 1:7 ; x
[1] 1 2 3 4 5 6 7
sample(x, size = 3,
replace = FALSE)
[1] 2 5 6