CE 8411: Estadística para ciencias políticas

Marzo, 2018

Especialización "Opinión Publica y Comunicación Política"

Estadística

Thinking: fast and slow

Modelaje

Modelos bajo la estadística

* Modelos teóricos 

* Modelos prácticos

Modelos teóricos

Están fundamentados en la teoría de la probabilidad.

    * Se trata de establecer una convención que permite identificar 
    (nombrar) la incertidumbre asociada a la  ocurrencia de
    eventos (observables o no) que, para el actual momento, 
    son desconocidos.

Cálculo de probabilidad

Una manera es definir una función que a cada valor posible, le asigna un "infinitesimal" de probabilidad, de manera que la probabilidad total (que algún valor sea observado) sea igual a uno.

Enciclopedia de distribuciones de probabilidad

Bernoulli

Binomial

Poisson

Gauss (Normal)

Chi-cuadrado

Weibull

Muestra vs. Población

La población es el conjunto de entes cuyas características se desea medir con un fin claramente especificado.

No se puede medir la o las características a todos los miembros de la población, pero sí se podría medir en un subconjunto de la población. Ese subconjunto lo llamamos muestra.

Cuando se dice que la muestra es "representativa" se quiere señalar que los resumenes sobre las caracteristicas, que son calculados a partir de las mediciones realizados a los miembros de la muestra, no difieren de manera importante con los de la población.

QUÉ SE QUIERE MEDIR

Con qué precisión se quiere/puede medir?
Cómo se pueden cuantificar a priori, los errores de muestreo ?

Característica a medir:

\(\rho\): Proporción de personas mayores de 18 años, inscritas en el registro electoral, que piensan acudir a la votación de mayo.

Cómo medir?

Pregunta en linea con: va a ir a votar?

Respuestas:
```
- *SI*

- NO

- No sabe/No contesta
```

Experimento parecido a lo de lanzar una moneda; la respuesta del í-ésimo encuestado la puedo codificar como:

\(X_i = 1\) si responde afirmativamente

\(X_i = 0\) en otro caso

\[ p = \frac{1}{n} \sum X_i \]

Margen de error

Error muestral:

Una medida puede ser la diferencia entre \(\rho\) y la proporción estimada con la muestra \(p\), es decir \[\rho - p \]

Margen de error:

Diferencia máxima entre lo estimado y lo "real" que se está dispuesto a aceptar, llámelo \(\varepsilon\), número positivo pequeño.

\[ -\varepsilon \leq \rho - p \leq \varepsilon \]

Si podemos medir a toda la población no hay error muestral …

De que tamaño debe ser la muestra para "garantizar" que el error muestral sea menor que el margen de error DECIDIDO al planificar el estudio.

No hay garantía, resultado sujeto a incertidumbre

Se requiere un nivel de "credibilidad" o "confianza"

Confianza

Termino con significado técnico específico.

Usando la interpretación frecuentista de la probabilidad, decir que la confianza es 100 \(\times \alpha\) %, quiere decir que se espera que el error muestral es menor que el margen de error con una frecuencia igual a \(\alpha\)

\[ Prob \{ | \rho - p | \leq \varepsilon \} = \alpha\]

Es decir, que si se revisan 100 muestras, se espera que en 100 \(\times (1 - \alpha)\) de ellas nuestro error muestral sea MAYOR que el margen de error.

Muestras "ideales"

Usualmente cuando se habla de una muestra aleatoria simple, se está diciendo que los datos fueron obtenidos de "unidades similares", en "condiciones similares" (en un tiempo, espacio y/o características similares) y de manera "independiente".

En los libros a eso se lo llama una muestra independiente, identicamente distribuida

Misma población que se "extrae al azar"
Misma variable que se mide en cada unidad muestral

Modelo ideal y tamaño muestral

https://www.surveysystem.com/sscalc.htm

http://www.raosoft.com/samplesize.html

Encuestas y su fiabilidad

Error muestral

Fallas

    * Definición clara del problema
    
    * Preguntas
    
    * Sesgos por cobertura
    
            * Fallas en definición de universo muestral
            
            * No respuesta 
            
    * Respuestas involuntaria o voluntariamente erroneas

Fallas

    * Sesgos asociados directamente  al encuestador
    
    * Sesgos asociados directamente al encuestado
    
    * Interacción encuestado - ente encuestador
    
    * Fallas en el procesamiento de datos
    
    * Fallas en la comunicación de resultados
    
    * Fallas en la interpretación de resultados

Lectura recomendada

Cea D'Ancona, Mª Ángeles. (2005). La senda tortuosa de la "Calidad" de la encuesta.

Revista española de investigaciones sociológicas, ISSN 0210-5233, Nº 111, 2005, pags. 75-104. 1. 10.2307/40184700.

http://www.reis.cis.es/REIS/PDF/REIS_111_051168262751380.pdf

Ficha técnica

Encovi 2017

https://www.ucab.edu.ve/wp-content/uploads/sites/2/2018/02/Ficha-T%C3%A9cnica.pdf