Marzo, 2018
Modelos bajo la estadística
* Modelos teóricos * Modelos prácticos
* Se trata de establecer una convención que permite identificar (nombrar) la incertidumbre asociada a la ocurrencia de eventos (observables o no) que, para el actual momento, son desconocidos.
Una manera es definir una función que a cada valor posible, le asigna un "infinitesimal" de probabilidad, de manera que la probabilidad total (que algún valor sea observado) sea igual a uno.
La población es el conjunto de entes cuyas características se desea medir con un fin claramente especificado.
No se puede medir la o las características a todos los miembros de la población, pero sí se podría medir en un subconjunto de la población. Ese subconjunto lo llamamos muestra.
Cuando se dice que la muestra es "representativa" se quiere señalar que los resumenes sobre las caracteristicas, que son calculados a partir de las mediciones realizados a los miembros de la muestra, no difieren de manera importante con los de la población.
Con qué precisión se quiere/puede medir?
Cómo se pueden cuantificar a priori, los errores de muestreo ?
Característica a medir:
\(\rho\): Proporción de personas mayores de 18 años, inscritas en el registro electoral, que piensan acudir a la votación de mayo.
Cómo medir?
Pregunta en linea con: va a ir a votar?
Respuestas:
- *SI* - NO - No sabe/No contesta
Experimento parecido a lo de lanzar una moneda; la respuesta del í-ésimo encuestado la puedo codificar como:
\[ p = \frac{1}{n} \sum X_i \]
Error muestral:
Una medida puede ser la diferencia entre \(\rho\) y la proporción estimada con la muestra \(p\), es decir \[\rho - p \]
Margen de error:
Diferencia máxima entre lo estimado y lo "real" que se está dispuesto a aceptar, llámelo \(\varepsilon\), número positivo pequeño.
\[ -\varepsilon \leq \rho - p \leq \varepsilon \]
Si podemos medir a toda la población no hay error muestral …
De que tamaño debe ser la muestra para "garantizar" que el error muestral sea menor que el margen de error DECIDIDO al planificar el estudio.
No hay garantía, resultado sujeto a incertidumbre
Se requiere un nivel de "credibilidad" o "confianza"
\[ Prob \{ | \rho - p | \leq \varepsilon \} = \alpha\]
Es decir, que si se revisan 100 muestras, se espera que en 100 \(\times (1 - \alpha)\) de ellas nuestro error muestral sea MAYOR que el margen de error.
Usualmente cuando se habla de una muestra aleatoria simple, se está diciendo que los datos fueron obtenidos de "unidades similares", en "condiciones similares" (en un tiempo, espacio y/o características similares) y de manera "independiente".
En los libros a eso se lo llama una muestra independiente, identicamente distribuida
Modelo ideal y tamaño muestral
* Definición clara del problema * Preguntas * Sesgos por cobertura * Fallas en definición de universo muestral * No respuesta * Respuestas involuntaria o voluntariamente erroneas
* Sesgos asociados directamente al encuestador * Sesgos asociados directamente al encuestado * Interacción encuestado - ente encuestador * Fallas en el procesamiento de datos * Fallas en la comunicación de resultados * Fallas en la interpretación de resultados
Cea D'Ancona, Mª Ángeles. (2005). La senda tortuosa de la "Calidad" de la encuesta.
Revista española de investigaciones sociológicas, ISSN 0210-5233, Nº 111, 2005, pags. 75-104. 1. 10.2307/40184700.
http://www.reis.cis.es/REIS/PDF/REIS_111_051168262751380.pdf
https://www.ucab.edu.ve/wp-content/uploads/sites/2/2018/02/Ficha-T%C3%A9cnica.pdf