En un muestreo aleatorio simple todos los individuos tienen la misma probabilidad de ser seleccionados. La seleccion de la muestra puede realizarse a traves de cualquier mecanismo probabilistico en el que todos los elementos tengan las mismas opciones de salir.
Suponga que la siguiente figura representa su unidad de muestreo. Los cuadros naranjas, representan donde estan distribuidos las variables aleatorias de interes.
Suponga que los datos representan los pesos de una variable aleatoria. Extraiga una muestra aleatoria de al menos un 40% de los datos.
#Escriba la siguiente funciomn en R.
#Permite estimar el intervalo de confianza de la poblacion
msa.m=function(N,n,media,desv)
{ f=n/N
varmed=(desv^2/n)*(1-f)
desmed=sqrt(varmed)
a1=media-1.96*desmed
b1=media+1.96*desmed
a2=N*a1
b2=N*b1
cat("media: IC = ",a1, "--",b1,"\n")
cat("total: IC = ",a2, "--",b2,"\n")
}
#Esto incluye todos los datos de la poblacion real.
msa.m(208,13,5.38461,2.18092)
## media: IC = 4.236695 -- 6.532525
## total: IC = 881.2325 -- 1358.765
Ejemplo. De las 208 parcelas disponibles, se muestrearon 40, del cual se obtuvo una media de 4.75 y una desviacion estandar de 3.2.
msa.m(208,40, 4.75,3.2)
## media: IC = 3.858751 -- 5.641249
## total: IC = 802.6202 -- 1173.38
Utilice la funcion de “Sample”, para extraer un porcentaje de la muestra. Compare sus resultados del calculo del intervalo de confianza.
#Suponer que voy a extraer un 30% de la muestra
(30*208)/100
## [1] 62.4
sample(208,62, replace = F)
## [1] 167 42 51 125 105 171 98 36 202 178 96 196 86 134 83 73 24
## [18] 35 53 84 90 89 93 166 58 22 139 68 141 31 107 48 80 82
## [35] 182 78 172 146 26 43 5 74 46 16 192 152 113 62 151 45 79
## [52] 6 94 204 183 92 2 25 150 66 81 29
mstr.m=function(N,n,media,s)
{ Ntot=sum(N)
f=n/N
mestr=crossprod(N,media)/Ntot
varm=(s^2/n)*(1-f)
vstr=crossprod(N^2,varm)/Ntot^2
setr=sqrt(vstr)
a1=mestr-1.96*setr
b1=mestr+1.96*setr
a2=Ntot*a1
b2=Ntot*b1
cat("media: IC = ",a1, "--",b1,"\n")
cat("total: IC = ",a2, "--",b2,"\n")
}
Ejemplo 2.
Una pequena ciudad contiene un total de 1800 hogares. La ciudad esta dividida en tres distritos que contienen 820, 540 y 440 hogares, respectivamente. Una muestra aleatoria estratificada de 310 hogares contiene 120, 100 y 90 hogares, respectivamente de estos tres distritos. Se pide a los miembros de la muestra que calculen su factura total de electricidad consumida en los meses de invierno. Las respectivas medias muestrales son $290, $352 y $427, y las respectivas desviaciones estandar muestrales son $47, $61 y $93.
#Datos
N=c(820,540,440)
n=c(120,100,90)
media=c(290,352,427)
s=c(47,61,93)
mstr.m(N,n,media,s)
## media: IC = 335.7203 -- 348.4574
## total: IC = 604296.6 -- 627223.4
Interpretacion: El intervalo encontrado brinda un 95% de contener al verdadero valor del parimetro, promedio del pago de electricidad consumida en los meses de invierno.