Marzo, 2018

Especialización "Opinión Publica y Comunicación Política"

MEDIR

El DRAE nos dice que viene del latín metīri.

Como verbo transitivo uno de sus significados es:

"Comparar una cantidad con su respectiva unidad, con el fin de averiguar cuántas veces la segunda está contenida en la primera."

En la acción de medir se busca reducir la incertidumbre del conocimiento sobre el ente y/o cosa tratada.

Tambíén al medir se comprende mejor la variabilidad.

Variabilidad e incertidumbre van de la mano

Lo que diferencia los tiempos modernos de los antiguos es la conquista del riesgo. (Berstein, Against the gods).

Para obtener información útil para la toma de decisiones sobre un sistema que se analiza, hace falta entender las relaciones entre los componentes y planificar para hacer seguimiento y medición de las fuentes percibidas de variabilidad.

Dos maneras de nombrar la incertidumbre

ALEATORIO: Procede del latín, "alea" que significa suerte.

ESTOCÁSTICO: Procede del griego: "στοχαστικές", que significa hábil en conjeturar. La diferencia en el nombre indica diferencia en el conocimiento.

Modelaje

MODELO (DRAE)

(Del it. modello).

1. m. Arquetipo o punto de referencia para imitarlo o reproducirlo. 2. m. En las obras de ingenio y en las acciones morales, ejemplar que por su perfección se debe seguir e imitar. 3. m. Representación en pequeño de alguna cosa.

4. m. Esquema teórico, generalmente en forma matemática, de un sistema o de una realidad compleja, como la evolución económica de un país, que se elabora para facilitar su comprensión y el estudio de su comportamiento.

5. m. Objeto, aparato, construcción, etc., o conjunto de ellos realizados con arreglo a un mismo diseño. Auto modelo 1976. Lavadora último modelo. 6. m. Vestido con características únicas, …

Modelaje

  • Modelos bajo la estadística

    * Modelos teóricos 
    
    * Modelos prácticos

Modelos teóricos

  • Están fundamentados en la teoría de la probabilidad.
    * Se trata de establecer una convención que permite identificar 
    (nombrar) la incertidumbre asociada a la  ocurrencia de
    eventos (observables o no) que, para el actual momento, son desconocidos.
  • Es necesario diferenciar los términos:
    * Evento verosimil / posible
    
    * Evento probable 

Modelos teóricos

Históricamente se dieron tres aproximaciones que conducen al mismo esquema teórico para medir la incertidumbre

  • A través de los juegos de azar

  • A través de la observación de fenómenos naturales y medición de variables de interés

  • A través de la síntesis (en la red neuronal personal) de la valoración de la verosimilitud de ocurrencia de eventos futuros.

La probabilidad de un evento simple \(P(E)\) es una medida de la verosimilitud de que el evento ocurra, una vez que el experimentose haya realizado. Esto se puede interpretar de dos formas:

  • Frecuentistamente: Repetir el experimento un número grande de veces y observar la proporción de veces que ocurre el evento. Cuando el número de repeticiones es grande, la proporción tiende a \(P(E)\).

  • Subjetivamente: \(P(E)\) es la cantidad que estamos dispuestos a apostar a favor de que \(E\) ocurra, en un juego en el cual ganamos una unidad si \(E\) ocurre.

Cualquiera de las dos interpretaciones lleva a:

\(0 \leq P(E) \leq 1\)

\(\sum P(E_i ) = 1\)

Esta última ecuación vale cuando los eventos son disjuntos

Probabilidad de eventos discretos

(finito, definición clásica)

Si \(A\) es un evento, se calcula la probabilidad como la suma de los eventos simples que lo componen. En caso que los eventos simples sean equiprobables, entonces la probabilidad se puede calcular como:

\(P(A)= \frac{\mbox{# Eventos simples en }A}{\mbox{# Eventos simples en la población}}\)

Esta es la fórmula que se usa para calcular la probabilidad de resultados en juegos de azar tipo dados, ruleta o cartas.

Simulemos 100 lanzamientos de un dado de 6 caras usando el computador

caras<-c(1,2,3,4,5,6)

lanzamientos<- sample(caras,size=100,replace=T)

barplot(table(lanzamientos),col="green")

Lo mismo, pero con mas valores

caras<-c(1,2,3,4,5,6)

lanzamientos<- sample(caras,size=10000,replace=T)

barplot(table(lanzamientos),col="green")

Variables continuas

  • Tiempos de falla
  • Tiempo de reparación
  • Estatura de hombres mayores de 21 años
  • Cantidad de precipitación en un lugar durante un tiempo determinado

Cómo establecer una convención para calcular la probabilidad en este caso?

Una manera es definir una función que a cada valor posible, le asigna un "infinitesimal" de probabilidad, de manera que la probabilidad total (que algún valor sea observado) sea igual a uno.

Estadística

Muestra vs. Población

La población es el universo de posibles resultados que puede tener un "experimento" (teórico o real).

No se puede observar así que se "muestrea"

Usualmente cuando se habla de una muestra, se está diciendo que los datos fueron obtenidos de "unidades similares", en "condiciones similares" y de manera "independiente".

En los libros a eso se lo llama una muestra independiente, identicamente distribuida

  • Misma población que se "extrae al azar"
  • Misma variable que se mide en cada unidad muestral

Otra pregunta

Cómo, a partir de los datos, obtengo información sobre una característica o atributo de la población en cuanto a:

  • Su localización o valor central (estimado con la media, mediana, moda(s))
  • Su dispersión (variancia, rango intercuartil)
  • Su asimetría con respecto al valor central (Skewness, tercer momento centrado)
  • Sus "colas" (curtosis)

Teoricamente basta con proponer una distribución de probabilidad apropiada para los datos observados

Y hay que entender las diferencias entre los parámetros (propios de la población) y los estadísticos (propios de la muestra)

Pensamiento estadístico

Thinking: fast and slow

La intuición es una manifestación del "sistema rápido" de pensamiento.