\[Taller\ De\ Muestreo\]
1) Realizar un cuadro comparativo (pros y contras) dentro del muestreo probabilístico y tipos de muestreo no probabilistico
\[Ventajas\ y\ Desventajas\ del\ Muestreo\ Probabilistico\]
| Ventajas | Desventajas |
|---|---|
| En el muestreo probabilistico aleatorio estratificado es posible reprentar a las poblaciones con un alto nivel de precisión | Uno de los requerimientos del muestreo probabilistico aleatorio estratificado es el conocimiento de la distribución de la población lo que en algunos casos requiere ponderación y dificulta el análisis |
| El muestreo probabilistico por conglomerado permite representar de manera precisa muestras dispersas y grandes | En el muestreo probabilistico por conglomerado el error estandar tiende a ser mayor que al usar muestreos conglomerados o simples además no tiene un nivel de precisión en poblaciones |
| En el muestreo probabilistico sistemático no es indispensable tener la población enlistada, sin embargo, si la población se encuentra ordenada se obtendrá una tendencia conocida | En el muestreo sistematico se pueden dar estimaciones con un nivel sesgado |
| El muestreo aleatorio simple es considerado de comprensión sencilla ya que las medias y las varianzas se calculan rapidamente y el análisis de resultados se basa en datos estadísticos | El muestreo aleatorio simpre requiere de un listado de la población previo al análisis además, si la muestra es pequeña en la mayoria de los casos no es representativa |
\[Ventajas\ y\ Desventajas\ del\ Muestreo\ No\ Probabilistico \]
| Ventajas | Desventajas |
|---|---|
| En el muestreo por conveniencia son seleccionados aquellos casos a los que se tiene acceso y/o permiten ser incluidos | En el muestreo por conveniencia solamente se tiene en cuenta el acceso y la proximidad para el investigador |
| En el muestreo intencional es posible seleccionar los casos caracteristicos de una población teniendo en cuenta que el escenario donde se encuentra esta es variable | En el muestreo intencional la muestra se limita a los casos seleccionados |
| En el muestreo accidental se toman casos hasta que se completa el numero necesario para el muestreo y su elección se hace de manera casual | En el muestreo accidental solo son incluidos los casos accesibles para ser parte de la muestra |
2) Consultar tipos de muestreo probabilistico y seleccionar el más acorde a su proyecto (Argumentar el porqué)
a) Aleatorio simple - simple al azar:
En este muestreo cada sujeto tiene una probabilidad igual de ser seleccionado para el estudio para lo cual es necesario: 1) Una lista que permita numerar (de 1 a \(n\)) las unidades de la población que se quiere muestrear 2) Determinar el tamaño de la muestra 3) Con ayuda de tablas de numeros aleatorios son elegidas unidades al azar de modo que se cumpla la regla de probabilidad igual (azar).
b) Aleatorio sistemático:
En este muestreo cada sujeto tiene una probabilidad igual de ser seleccionado para el estudio. Para la elección de la muestra se toman todos los individuos de la lista y se utiliza un numero al azar. Por ejemplo:
\[Población\ (N): 12.000\] \[Muestra\ requerida\ (n):600\] \[Calculo\ del\ intervalo\ de\ muestreo\ (k)\] \[(k)=12.000/600=20\] \[Escoger\ el\ 1er\ número\ al\ azar\ [1-20] \Rightarrow 1era \ unidad \] \[Añadir\ (k)\ para\ escoger\ la\ siguiente\ unidad\ hasta\ completar\ (n)\] c) Estratificado:
Este muestreo se realiza cuando la muestra tiene subgrupos representativos o ESTRATOS de los elementos de estudio con características específicas. Para obtener el tamoño de cada muestra por estrato se utiliza el muestreo aleatorio o sistemático.
d) Conglomerado:
El muestreo por Racimos, Cluster o Conglomerado hace uso de unidades geográficas ya que las poblaciones o muestras se encuentran en lugares físicos o geográficos especificos. La selección de la unidad de análisis se realiza en dos etapas: 1) Son seleccionados los racimos o conglomerados 2) En los conglomerados es seleccionada la muestra.
Teniendo en cuenta lo anterior, es posible afirmar que para el proyecto del grupo #2 en donde se evalua el crecimiento de la especie Polylepis quadrijuga a partir de la alteración de dos variables independientses que son la luminocidad y concentración en la fertililiación, el tipo de muestreo probabilistico que más se adapta es el aleatorio simple ya que en este experimento todos los individuos tienen la misma probabilidad de ser selccionados para la toma de las variables de crecimiento, además la población nos permite enlistar y numerar a la población de forma que se cumpla la regla del azar.
3) Consultar como calcular el \(n\) muestral
Poblaciones Finitas:
Para el calculo del \(n\) muestral en poblaciones contables es utilizada la formula:
\[n= \frac {N \cdot Z^{2}_{a} p\cdot q}{d^2 \cdot(N-1)+Z^{2}_{a}\cdot p \cdot q}\]
Donde:
N = Población total \(Z_a\)= 1.96 al cuadrado (Si el nivel de confianza es del 95%) p = Proporción esperada (5% = 0.05) en la mayoria de los casos q = 1-p (1-0.005 = 5%) d = Precisión (En investigación se usa un 5%)
Poblaciones Infinitas:
Para el calculo del \(n\) muestral en poblaciones infinitas, es decir, cuando se desconoce el total de unidades de observación que la integran o cuando la población es mayor a 10.000 se utiliza la siguiente formula:
\[n = \frac{Z^2 \cdot S^2}{d^2}\]
Donde:
n = Tamaño de la muestra Z = Nivel de confianza S = Varianza de una población en estudio (Es el cuadrado de la desviación estandar y puede ser obtenido de estudios similares previos o pruebas piloto) d = Amplitud del intervalo de confianza deseado en la determinación del valor promedio de la variable de estudio, tambien llamado \(Nivel\ de\ precisión\ absoluta\)
\[Formula\ de\ muestreo\ con\ piloto\]
\[ n= \frac{Np(1-p)}{(N-1) \frac{e^2}{z}+p(1-p)}\]
4.1) Realizar un código para muestreo sistemático y aleatorio usando la formula mencionada anteriormente y graficarlos
\(Muestreo\ Aleatorio\)
Para el uso de este codigo debe definir:
sample (1:63,33, replace = F)
## [1] 52 6 23 32 62 54 18 48 36 20 11 26 45 38 41 51 61 59 4 31 10 19 1 39 22
## [26] 49 40 58 25 3 63 42 35
\(Muestreo\ Sistematico\)
Nota: Para el uso de esta función es necesario definir el numero de muestra \(n\) y la tendencia o patron (\(k\) = Intervalo de puntos en el patron)
\(k= \frac{N}{n}\)
Donde:
\(k\) = Intervalo de la muestra sistematica \(N\) = Tamaño de la población \(n\) = Tamaño de la muestra
n.muestra.p <- function(N, p, e, z = 1.96){
n=ceiling(N*p*(1-p)/((N-1)*(e/z)^2+p*(1-p)))
muestras<-sample(N,n,replace = F)
xy<-expand.grid(x=seq(1,25),y=seq(1,20))
muestras2<-(seq(5,250,3));length(muestras2)
plot(xy[muestras2,], pch = 18,col="green")
points(xy[-muestras2,])
return(length(muestras))
}
n=n.muestra.p(N=250, p=0.25,e=0.07);n
## [1] 93
4.2) Supongamos que fuimos a muestrear 91 gallinas para evaluar la prevalencia de la enfermedad y conseguimos que 35 gallinas mostraron los signos de la enfermedad, esto significa que la prevalencia estimada es:
\[\hat{pre}<-100*35/91 = 38.46\]
Interprete la ecuación de intervalo de confianza para la prevalencia ¿Cuál es su en un muestreo con 95% de confianza?
\[Prob\left({\hat{p}-z~\sqrt{{{p(1-p)}\over{n}}{(1-{n\over{N}}})}< prev< \hat{p}+z~\sqrt{{{p(1-p)}\over{n}}{(1-{n\over{N}}})}}\right)= 0.95\] Función:
icprev=function(N,n,p,z=1.96){
li=p-z*(sqrt((p*(1-p)/n)*(1-n/N)))
ls=p+z*(sqrt((p*(1-p)/n)*(1-n/N)))
return(list(li=li,ls=ls))
}
icprev(N = 500,n = 91,p = 0.3846)
## $li
## [1] 0.2941944
##
## $ls
## [1] 0.4750056
Determinar el intervalo de confianza del 80% para la prevalencia de la enfermedad
icprev(N = 500,n = 91,p = 0.80)
## $li
## [1] 0.7256687
##
## $ls
## [1] 0.8743313
% = Los dos ultimos numeros de su cédula = 53
icprev(N = 500,n = 91,p = 0.53)
## $li
## [1] 0.4372532
##
## $ls
## [1] 0.6227468
\[Muestreo\ estratificado\ no\ espacial\]
4.3) Se desea evaluar la proporción de productores de papa que hacen un manejo adecuado a los residuos asociados tanto al cultivo como a los envases de los productos utilizados. Suponiendo que hay 3 estratos asociados a la propiedad de la tierra:
TOTAL = 240
Se desea estimar el tamaño de la muestra necesaria para responder a la pregunta de investigación ¿Cuál podría ser un manejo adecuado de los residuos?
Interprete la formula
\[n={\sum_{i=1}^3 N_{i}^2 p_{i}(1-p_{i})/w_{i}\over{\sum_{i=1}^3 N_{i}p_{i}(1-p_{i})}+({Ne\over{z}})^2}\]
Pista: $N1 =80; N2=40; N3=120; e=0.05;z=1.96: N=240 $
| Estrato | Población | Proporción (\(p\)) | Peso (\(w\)) |
|---|---|---|---|
| 1 | 80 | 0.5 | 0.33 |
| 2 | 40 | 0.5 | 0.50 |
| 3 | 120 | 0.5 | 0.50 |
\(Función\ de\ la\ formula\)
ne=function(N,p,z=1.96,e=0.05){
Nt=sum(N)
wi<<-N/Nt
numerador<<-(N[1]^2*p[1]*(1-p[1])/wi[1])+(N[2]^2*p[2]*(1-p[2])/wi[2])+(N[3]^2*p[3]*(1-p[3])/wi[3])
denominador<<-(N[1]*p[1]*(1-p[1]))+(N[2]*p[2]*(1-p[2]))+(N[3]*p[3]*(1-p[3]))+(Nt*e/z)^2
n=ceiling(numerador/denominador)
return(n)}
\(Asignación\ proporcional\)
Esto se hace con el fin de tomar el \(n\) muestral y distribuirlo entre los diferentes estratos para que estos sean proporcionales.
ne(N=c(80,40,120),p=c(0.5,0.5,0.5))
## [1] 148
asiganacion<-round(wi*148);asiganacion
## [1] 49 25 74
\(Referencias\)
Muñoz Loayza, B.A. (2018). Ventajas y desventajas del muestreo probabilístico y no probabilístico en investigaciones científicas. (Examen Complexivo). Universidad Técnica de Machala, Machala, Ecuador. http://repositorio.utmachala.edu.ec/handle/48000/12838
Espinoza, I. (2016). Tipos de muestreo. Unidad de investigación científica facultad de ciencias médicas. http://www.bvs.hn/Honduras/Embarazo/Tipos.de.Muestreo.Marzo.2016.pdf
Herrera, M. (2011). Formula para cálculo de la muestra poblaciones finitas. https://investigacionpediahr.files.wordpress.com/2011/01/formula-para-cc3a1lculo-de-la-muestra-poblaciones-finitas-var-categorica.pdf