Probabilidad y distribuciones

Maestría en Gobierno y Políticas Públicas

Diego Solís Delgadillo

Probabilidad Clásica

Conceptos clave

Resultados: son los casos individuales de lo que puede suceder
Eventos: un resultado en particular dentro de un grupo de posibles resultados
Espacio muestral: el conjunto de todos sus posibles resultados

Resultados

Ejemplos resultados

En un dado cada uno de los números es un resultado
En una moneda, cada una de las caras es un resultado
En una baraja de poker es cada una de las cartas

Eventos

📌 Los eventos pueden referirse a un resultado o una combinación

Ejemplo

Obtener una suma de siete en dos dados
Obtener pares

Combinación de tres letras

Si tengo los elementos {a,b,c,d,e} y genero la combinación de tres letras, los resultados posibles son
{abc, abd, abe, acd, ace, ade, bed, bce, bde, cde}
La probabilidad de obtener la combinación abe es de 1/10

Tipos de eventos

Dos tipos de eventos

Suceden con cierto grado de probabilidad bajo ciertas condiciones
Suceden (o no suceden) con certidumbre dadas ciertas condiciones

Los primeros eventos son como los conocidos como aleatorios o estocásticos

Warning

La probabilidad solamente aplica a eventos estocásticos

Espacio muestral

Important

Es el conjunto de todos los posibles resultados de un experimento aleatorio
Se calcula elevando el número de resultados por el número de intentos

Espacio muestral volado

El espacio muestral de tres volados sería=

\[ 2 \times 2 \times 2 = 8 \]

S= {CCC, CCS, CSC, SCC, SSC, SCS, CSS, SSS}

Espacio muestral

Lanzamiento de dado

Si lanzamos tres veces un dado, cada lanzamiento tiene 6 posibles resultados.
🔢 Número total de resultados posibles: \[ 6 \times 6 \times 6 = 216 \]
Algunos elementos del espacio muestral: \[ S = \{ (1,1,1), (1,1,2), (1,1,3), \dots, (6,6,6) \} \]

Probabilidad de un evento

La probabilidad clásica de un evento es:

\[ Pr(e) = \frac{\text{Número de resultados en el evento } e}{\text{Número de resultados en el espacio muestral}} \]

Ejemplo

La probabilidad de obtener un cinco en un dado justo es:

\[ Pr(e) = \frac{1}{6} \]

La probabilidad de que ocurra un evento \(A\) se representa como:

\[ Pr(A) \]

Rango de la probabilidad

¿Qué es el rango de probabilidad?

El rango de probabilidad se refiere a los valores que una probabilidad puede tomar, que siempre están entre 0 y 1.

\[ Pr(A) \in [0,1] \] 📌 Reglas clave:

0 significa que el evento es imposible.
1 significa que el evento es seguro.
Cualquier probabilidad está en el intervalo 0,1.

Note

Para calcular la probabilidad de obtener un 7 en la suma de dos tiros de un dado, consideramos todas las combinaciones posibles.

Dado que cada dado tiene 6 caras, el total de combinaciones posibles es:

\[ 6 \times 6 = 36 \]

Cálculo de la probabilidad:

\[ Pr(7) = \frac{6}{36} = \frac{1}{6} \]

¿Qué significan esas probabilidades?

Probabilidad y número de experimentos

Con un número limitado de tiros (por ejemplo, 10), la proporción de 6s puede fluctuar mucho.
Si simulamos un número muy grande de tiros de dados, la proporción acumulada para el número 6 se va a acercar a \(\frac{1}{6}\).

Ley de los grandes números 🔢

En fenómenos aleatorios, la proporción de veces que algo ocurre es altamente aleatoria y variable en el corto plazo.
Sin embargo, en el largo plazo, esta proporción se vuelve muy predecible.

Jacob Bernoulli 💡

En el siglo XVII, Jacob Bernoulli demostró que conforme el número de pruebas incrementa, la proporción de ocurrencias de un resultado se acerca a un número en particular.
Sus resultados fueron conocidos como la Ley de los Grandes Números.

Simulación dado en R

Aplicación

Pruebas médicas y diagnósticos

Una prueba médica tiene una precisión del 95%
- No significa que siempre acertará en cada paciente.
Pero si se realizan miles de pruebas, la tasa de aciertos se acercará al 95% esperado.

️Distribuciones de probabilidad

Métodos Cuantitativos

Variable aleatoria

Es una variable cuyo valor es determinado por un experimento aleatorio

Ejemplo lanzamiento de dado🎲

Espacio muestral: \(\Omega = \{1, 2, 3, 4, 5, 6\}\)
Variable aleatoria \(X\): “Número obtenido en el dado”
Posibles valores: \(X = \{1, 2, 3, 4, 5, 6\}\)

Variable aleatoria

Ejemplo lanzamiento de moneda🪙

Espacio muestral: \(\Omega = \{\text{cara}, \text{cruz}\}\)
Definimos \(X\) como:
- \(X(\text{cara}) = 1\)
- \(X(\text{cruz}) = 0\)
- Aquí, \(X\) es una variable aleatoria discreta.

Tiempo espera en una fila⏳

Variable aleatoria \(X\): “Tiempo (en minutos) hasta ser atendido”
Puede tomar cualquier valor real positivo (\(X \in \mathbb{R}^+\))
Es un ejemplo de variable aleatoria continua.

Distribuciones

Las distribuciones nos dan una probabilidad de que las variables aleatorias tomen determinados valores.
Ejemplo: La distribución normal describe la probabilidad de cada posible valor.
Cada posible resultado de una variable aleatoria se llama realización.

Notación de variables aleatoria

Para referirnos a las variables aleatorias, usamos letras mayúsculas.
Para las realizaciones, usamos letras minúsculas.
Ejemplo:
\(x \in X, \quad [0,1]\)

Soporte

El soporte (support) es el conjunto de todos los valores que tienen una probabilidad distinta de 0.
Ejemplo 🎲: \(S_X = \{1, 2, 3, 4, 5, 6\}\)

Distribuciones discretas

Una variable aleatoria es discreta cuando toma valores separados, como 0, 1, 2, 3.
Su distribución de probabilidades asigna una probabilidad a cada posible valor:
\(P(x)\)

Propiedades de las Variables Discretas

Cada probabilidad está en el rango \([0,1]\).
La suma de todas las probabilidades debe ser 1.

Ejemplo lanzamiento de tres moneda

Las ocho combinaciones posibles de resultados al lanzar tres monedas son:

\[\begin{aligned} \text{Cruz - Cruz - Cruz} \quad &(0 \text{ caras}) \\ \text{Cruz - Cruz - Cara} \quad &(1 \text{ cara}) \\ \text{Cruz - Cara - Cruz} \quad &(1 \text{ cara}) \\ \text{Cara - Cruz - Cruz} \quad &(1 \text{ cara}) \\ \text{Cruz - Cara - Cara} \quad &(2 \text{ caras}) \\ \text{Cara - Cruz - Cara} \quad &(2 \text{ caras}) \\ \text{Cara - Cara - Cruz} \quad &(2 \text{ caras}) \\ \text{Cara - Cara - Cara} \quad &(3 \text{ caras}) \\ \end{aligned}\]

Ejemplo lanzamiento de tres moneda

Distribución del Número de Caras

Número de Caras	0	1	2	3
Frecuencia	1	3	3	1
Proporción	\(\frac{1}{8}\)	\(\frac{3}{8}\)	\(\frac{3}{8}\)	\(\frac{1}{8}\)

Cada combinación tiene la misma probabilidad de \(\frac{1}{8}\).

Advertencia

Pero hay más combinaciones con 1 o 2 caras

Posibles Sumas🎲🎲

La siguiente tabla muestra la distribuciuón de las posibles sumas de dos dados

Suma	2	3	4	5	6	7	8	9	10	11	12
Combinaciones	(1,1)	(1,2) (2,1)	(1,3) (2,2) (3,1)	(1,4) (2,3) (3,2) (4,1)	(1,5) (2,4) (3,3) (4,2) (5,1)	(1,6) (2,5) (3,4) (4,3) (5,2) (6,1)	(2,6) (3,5) (4,4) (5,3) (6,2)	(3,6) (4,5) (5,4) (6,3)	(4,6) (5,5) (6,4)	(5,6) (6,5)	(6,6)
Probabilidad	\(\frac{1}{36}\)	\(\frac{2}{36}\)	\(\frac{3}{36}\)	\(\frac{4}{36}\)	\(\frac{5}{36}\)	\(\frac{6}{36}\)	\(\frac{5}{36}\)	\(\frac{4}{36}\)	\(\frac{3}{36}\)	\(\frac{2}{36}\)	\(\frac{1}{36}\)

Distribución para tres dados 🎲🎲🎲

Función de Masa de Probabilidad

¿Qué es la PMF?

La Función de Masa de Probabilidad (PMF) describe la probabilidad de que una variable aleatoria discreta tome un valor específico.
Se denota como: \[P(X = x)\]
Donde \(X\) es la variable aleatoria y \(x\) es un valor posible

Ejemplo

Si \(X\) representa el resultado al lanzar un dado de seis caras:
Los valores posibles son \(x = 1, 2, 3, 4, 5, 6\)
La función de masa de probabilidad es:

\(P(X = x) = \begin{cases} \frac{1}{6}, & x \in \{1, 2, 3, 4, 5, 6\} \\ 0, & \text{en cualquier otro caso} \end{cases}\)

Visualización PMF

La PMF se puede representar como un histograma de probabilidades.
Cada barra indica la probabilidad de cada valor discreto.

Distribuciones continuas

Las variables continuas pueden tomar un número infinitos de valores
Las distribuciones continuas indican intervalos
Estas distribuciones tienen forma curva porque es como si introdujéramos más y más columnas a un histograma

Distribuciones continuas

Las distribuciones continuas son visualizadas con densidades
El área debajo de la curva indica la probabilidad de que la variable tome determinados valores

Ejemplo tiempo de transporte

En 2009 el tiempo medio de transporte en EE.UU era de 25 minutos.
La distribución muestra el porcentaje de personas que utilizaban 45 minutos o más

Probabilidades

¿Por qué trabajar con intervalos?

En una distribución discreta, las probabilidades se asignan a valores específicos (\(P(X = x)\)).
En una distribución continua, la probabilidad de un solo punto es cero:

\[ P(X = x) = 0 \]
Una variable continua tiene infinitos valores posibles. La probabilidad de cualquier número exacto es infinitamente pequeña.

Probabilidad en un Intervalo

En lugar de asignar probabilidad a un solo valor, usamos áreas bajo la curva de densidad:

\[ P(a \leq X \leq b) = \int_a^b f(x) \, dx \]
La probabilidad es el área entre dos puntos en la curva de densidad.

Función de Densidad de Probabilidad (PDF)

Definición general

La probabilidad de que \(X\) tome valores en una región \(B\) es: \[Pr(X \in B) = \int_B f(x) \,dx\]
Para calcular la probabilidad de que \(X\) esté en \(B\), sumamos (integrando) todos los valores de la función de densidad \(f(x)\) dentro de \(B\).

Aplicación específica

Si queremos calcular el área entre los puntos \(a\) y \(b\): \(Pr(X \in [a, b]) = \int_a^b f(x) \,dx\)
Es decir, lo que estimamos es la integral entre los puntos \(a\) y \(b\).
A esto nos referimos con el área bajo la curva

Usos de las distribuciones continuasl

Usos distribuciones continuas

Inferencia estadística: Estimación de parámetros y pruebas de hipótesis.
Modelado de fenómenos físicos y sociales: Altura, peso, ingresos, tiempos de espera.
Simulación y predicción: Procesos estocásticos y simulaciones de Monte Carlo.

Visualización

Distribución normal

Las distribuciones que toman la forma de una campana son llamadas gaussianas
La más conocida es la distribución normal

Esta distribución se expresa como \[\mathcal{N}(\mu, \sigma^2) \]
Si \(X\) tine uan distribución normal

\[ X \sim \mathcal{N}(\mu, \sigma^2) \]

Tip

La distribución admite dos parámetros: la media \(\mu\) y la varianza \(\sigma^2\)

Ejemplo

Escoger aleatoriamente una sandía

Vamos al supermercado y escojemos aleatoriamente una sandía de un estante con 200 sandías
Medimos su largo y lo registramos
Repetimos varias veces el ejercicio
Nunca vamos a obtener el mismo tamaño

Variable aleatoria y experimento

En este ejercicio la variable aleatoria \(X\) es el largo de la sandía
El experimento es escoger aleatoriametne una sandía

Ejemplo

Media y desviación estándar

Al registrar los valores obtendremos una media
- Los valores variarán alrededor de ese valor
También podemos estimar la distancia promedio de las sandías con respecto a su media
- Esa desviación estándar nos indicará dispersión de los datos

Ejemplo

Características

Distribución normal

Simétrica
Forma de campana
Dos parámetros: la media \(\mu\) y la desviación estándar \(\delta\)

Parámetros

La media (que indica el centro)
La desviación estándar (que indica su variación)

¿Qué estimamos?

Las probabilidades de observar valores dentro de un determinado número de desviaciones estándar con respecto a la media son las mismas