️Distribuciones de probabilidad

Estadística para las Ciencias Sociales

Diego Solís Delgadillo

Axiomas de Kolmogórov

Toda medida de probabilidad debe cumplir con:

  1. No negatividad \(P(A) \geq 0\)

  2. Aditividad (σ-aditividad):
    Si \(A_1, A_2, \dots\) son eventos disjuntos, entonces: \(P\left(\bigcup_{i=1}^{\infty} A_i\right) = \sum_{i=1}^{\infty} P(A_i)\)

    • Por ejemplo: \(P(A_1 \cup A_2 \cup A_3) = P(A_1) + P(A_2) + P(A_3)\)
  3. Probabilidad total:
    \(P(\Omega) = 1\)

Variable aleatoria

  • Es una variable cuyo valor es determinado por un experimento aleatorio

Ejemplo lanzamiento de dado🎲

  • Espacio muestral: \(\Omega = \{1, 2, 3, 4, 5, 6\}\)
  • Variable aleatoria \(X\): “Número obtenido en el dado”
  • Posibles valores: \(X = \{1, 2, 3, 4, 5, 6\}\)

Variable aleatoria

Ejemplo lanzamiento de moneda🪙

  • Espacio muestral: \(\Omega = \{\text{cara}, \text{cruz}\}\)
  • Definimos \(X\) como:
    • \(X(\text{cara}) = 1\)
    • \(X(\text{cruz}) = 0\)
    • Aquí, \(X\) es una variable aleatoria discreta.

Tiempo espera en una fila⏳

  • Variable aleatoria \(X\): “Tiempo (en minutos) hasta ser atendido”
  • Puede tomar cualquier valor real positivo (\(X \in \mathbb{R}^+\))
  • Es un ejemplo de variable aleatoria continua.

Distribuciones

  • Las distribuciones nos dan una probabilidad de que las variables aleatorias tomen determinados valores.
  • Ejemplo: La distribución normal describe la probabilidad de cada posible valor.
  • Cada posible resultado de una variable aleatoria se llama realización.

Notación de variables aleatoria

  • Para referirnos a las variables aleatorias, usamos letras mayúsculas.
  • Para las realizaciones, usamos letras minúsculas.
  • Ejemplo:
    \(x \in X, \quad [0,1]\)

Soporte

  • El soporte (support) es el conjunto de todos los valores que tienen una probabilidad distinta de 0.
  • Ejemplo 🎲: \(S_X = \{0, 1, 2, 3, 4, 5, 6\}\)

Distribuciones discretas

  • Una variable aleatoria es discreta cuando toma valores separados, como 0, 1, 2, 3.
  • Su distribución de probabilidades asigna una probabilidad a cada posible valor:
    \(P(x)\)

Propiedades de las Variables Discretas

  • Cada probabilidad está en el rango \([0,1]\).
  • La suma de todas las probabilidades debe ser 1.

Ejemplo lanzamiento de tres moneda

  • Las ocho combinaciones posibles de resultados al lanzar tres monedas son:
\[\begin{aligned} \text{Cruz - Cruz - Cruz} \quad &(0 \text{ caras}) \\ \text{Cruz - Cruz - Cara} \quad &(1 \text{ cara}) \\ \text{Cruz - Cara - Cruz} \quad &(1 \text{ cara}) \\ \text{Cara - Cruz - Cruz} \quad &(1 \text{ cara}) \\ \text{Cruz - Cara - Cara} \quad &(2 \text{ caras}) \\ \text{Cara - Cruz - Cara} \quad &(2 \text{ caras}) \\ \text{Cara - Cara - Cruz} \quad &(2 \text{ caras}) \\ \text{Cara - Cara - Cara} \quad &(3 \text{ caras}) \\ \end{aligned}\]

Ejemplo lanzamiento de tres moneda

Distribución del Número de Caras

Número de Caras 0 1 2 3
Frecuencia 1 3 3 1
Proporción \(\frac{1}{8}\) \(\frac{3}{8}\) \(\frac{3}{8}\) \(\frac{1}{8}\)
  • Cada combinación tiene la misma probabilidad de \(\frac{1}{8}\).

Advertencia

  • Pero hay más combinaciones con 1 o 2 caras

Posibles Sumas🎲🎲

  • La siguiente tabla muestra la distribuciuón de las posibles sumas de dos dados
Suma 2 3 4 5 6 7 8 9 10 11 12
Combinaciones (1,1) (1,2) (2,1) (1,3) (2,2) (3,1) (1,4) (2,3) (3,2) (4,1) (1,5) (2,4) (3,3) (4,2) (5,1) (1,6) (2,5) (3,4) (4,3) (5,2) (6,1) (2,6) (3,5) (4,4) (5,3) (6,2) (3,6) (4,5) (5,4) (6,3) (4,6) (5,5) (6,4) (5,6) (6,5) (6,6)
Probabilidad \(\frac{1}{36}\) \(\frac{2}{36}\) \(\frac{3}{36}\) \(\frac{4}{36}\) \(\frac{5}{36}\) \(\frac{6}{36}\) \(\frac{5}{36}\) \(\frac{4}{36}\) \(\frac{3}{36}\) \(\frac{2}{36}\) \(\frac{1}{36}\)

Distribución para tres dados 🎲🎲🎲

Función de Masa de Probabilidad

¿Qué es la PMF?

  • La Función de Masa de Probabilidad (PMF) describe la probabilidad de que una variable aleatoria discreta tome un valor específico.
  • Se denota como: \[P(X = x)\]
  • Donde \(X\) es la variable aleatoria y \(x\) es un valor posible

Ejemplo

  • Si \(X\) representa el resultado al lanzar un dado de seis caras:

  • Los valores posibles son \(x = 1, 2, 3, 4, 5, 6\)

  • La función de masa de probabilidad es:

    \(P(X = x) = \begin{cases} \frac{1}{6}, & x \in \{1, 2, 3, 4, 5, 6\} \\ 0, & \text{en cualquier otro caso} \end{cases}\)

Visualización PMF

  • La PMF se puede representar como un histograma de probabilidades.
  • Cada barra indica la probabilidad de cada valor discreto.

Parámetros de la FMP

¿Qué son los parámetros de la PMF?

  • Los parámetros de una Función de Masa de Probabilidad (PMF) son valores que determinan la forma y características de una distribución discreta.
  • Controlan aspectos como la media, la dispersión y la forma de la distribución de probabilidad.

Parámetros

  • 1️⃣ Número de valores posibles (\(x\))

  • Son los valores discretos que puede tomar la variable aleatoria.

    • Ejemplo: En un dado de 6 caras, \(x = \{1, 2, 3, 4, 5, 6\}\).
  • 2️⃣ Probabilidades asociadas \(P(X=x)\)

  • Es la probabilidad de que la variable aleatoria tome un valor específico.

  • 3️⃣ Parámetros de la distribución específica

  • Algunas distribuciones tienen parámetros adicionales que las definen.

    • Ejemplos:
    • Distribución Binomial: \(n\) (número de ensayos) y \(p\) (probabilidad de éxito).
    • Distribución de Poisson: \(\lambda\) (tasa de ocurrencia).

Parámetros en un Fenómeno Binario

  • En un fenómeno con dos posibles resultados (\(y_i = 0\)) o \(y_i = 1\)), la probabilidad se define como:

    \(P(y_i = 0) = \pi\)

    \(P(y_i = 1) = 1 - \pi\)

Interpretación del Parámetro

  • \(\pi\) es un parámetro que toma valores entre 0 y 1.
  • Representa la probabilidad de ocurrencia de uno de los eventos.

Probabilidad de un Evento Específico

  • Si lanzamos un dado y nos interesa la probabilidad de obtener un 3, podemos definir una variable aleatoria \(y_i\):

    • \(y_i = 0\) si NO obtenemos un 3.
    • \(y_i = 1\) si obtenemos un 3.
  • La probabilidad de NO obtener un 3 es:

    \(P(y_i = 0) = \pi = \frac{5}{6} = 0.83\)

  • La probabilidad de obtener un 3 es:

    \(P(y_i = 1) = 1 - \frac{5}{6} = 0.17\)

Parámetros de Ubicación

  • Especifican la ubicación del centro de la distribución.

  • Su referente empírico es la media.

  • Generalmente representado con:

    \[\mu \quad (\text{mu})\]

Aplicación: Suma de Dos Dados 🎲🎲

  • La media se calcula con la tabla de probabilidades:

Suma de ponderada

\(\mu =(2 \times \frac{1}{36}) + (3 \times \frac{2}{36}) + (4 \times \frac{3}{36}) +\) \((5 \times \frac{4}{36}) + (6 \times \frac{5}{36}) + (7 \times \frac{6}{36}) +\) \((8 \times \frac{5}{36}) + (9 \times \frac{4}{36}) + (10 \times \frac{3}{36}) +\) \((11 \times \frac{2}{36}) + (12 \times \frac{1}{36})\)

Resultado del Cálculo

\(\mu = \frac{252}{36} = 7\)

  • La media de la suma de dos dados es 7.
  • La media es el centro de la distribución, lo que confirma que 7 es la suma más probable.

Parámetros de Escala

  • Especifican qué tan dispersa se encuentra la distribución con respecto al centro.

  • Su referente empírico es la desviación estándar.

  • Representados como:

    \[\sigma \quad (\text{sigma})\]

Aplicación

\(E(X^2) =(2^2 \times \frac{1}{36}) + (3^2 \times \frac{2}{36}) + (4^2 \times \frac{3}{36}) +\) \((5^2 \times \frac{4}{36}) + (6^2 \times \frac{5}{36}) + (7^2 \times \frac{6}{36}) +\) \((8^2 \times \frac{5}{36}) + (9^2 \times \frac{4}{36}) + (10^2 \times \frac{3}{36}) +\) \((11^2 \times \frac{2}{36}) + (12^2 \times \frac{1}{36})\)

Sustituyendo valores: \(E(X^2) = \frac{1974}{36} \approx 54.83\)

Note

\(\sigma = \sqrt{54.83 - 7^2} = \sqrt{54.83 - 49} = \sqrt{5.83} \approx 2.42\)

  • La desviación estándar de la suma de dos dados es 2.42.
  • Esto significa que la mayoría de los valores están a ±2.42 unidades de la media 7.

:::

Parámetro de Dispersión

  • Es la escala paramétrica elevada al cuadrado.
  • También describe la dispersión con respecto al centro de la distribución.
  • El estadístico que corresponde a este parámetro es la varianza.
  • Se denota como:

\[\sigma^2\]

Función de Distribución Acumulativa (FDA)

  • En ocasiones nos interesa saber si un número en nuestra muestra se encuentra por encima o por debajo de un determinado valor.
  • La FDA suma las probabilidades individuales de cada valor hasta el punto de interés.
  • Se suman porque estos valores son mutuamente excluyentes.

FDA suma dados

Distribución binomial

¿Qué es?

  • La distribución binomial modela el número de éxitos en un experimento de \(n\) ensayos independientes, donde cada ensayo tiene:
    • Dos posibles resultados: éxito o fracaso.
    • Probabilidad de éxito \(p\) constante en cada ensayo.
  • Se expresa matemáticamente como: \[P(X = k) = \binom{n}{k} p^k (1 - p)^{n-k}\]

Notación

  • \(n\) = número de ensayos,
  • \(k\) = número de éxitos,
  • \(p\) = probabilidad de éxito por ensayo.

Ejemplo

Lanzamiento de una Moneda

  • Supongamos que lanzamos una moneda 10 veces y queremos saber la probabilidad de obtener exactamente 4 caras.

  • Parámetros del modelo:

    • \(n = 10\) (ensayos)
    • \(p = 0.5\) (probabilidad de cara en cada lanzamiento)
    • \(k = 4\) (número de caras deseadas)

Cálculo de la probabilidad

  • \[P(X = 4) = \binom{10}{4} (0.5)^4 (1 - 0.5)^{10-4}\]

  • La respuesta nos da la probabilidad exacta de obtener 4 caras en 10 lanzamientos.

Cálculo paso a paso

Paso 1: Calcular el coeficiente binomial

  • Fórmula:

\[\binom{n}{k} = \frac{n!}{k!(n-k)!} \]

  • Explicación:
    • \(n!\) es el factorial de \(n\).
    • \(k!\) es el factorial de \(k\).
    • \((n - k)!\) es el factorial de los ensayos restantes.

Note

  • Sustituyendo:

\[\binom{10}{4} = \frac{10!}{4!(10-4)!} = \frac{10!}{4!6!}\]

Expandiendo los factoriales:

\[= \frac{10 \times 9 \times 8 \times 7 \times 6!}{4! \times 6!}\]

  • Cancelamos \(6!\):

\[= \frac{10 \times 9 \times 8 \times 7}{4!}\]

  • Sabemos que:

\[4! = 4 \times 3 \times 2 \times 1 = 24\]

  • Entonces

\[\binom{10}{4} = \frac{5040}{24} = 210\]

Paso 2: Calcular las Potencias

\[(0.5)^4 = 0.5 \times 0.5 \times 0.5 \times 0.5\]

\[= 0.0625\]

  • Para el otro término:

\[(1 - 0.5)^{10-4} = (0.5)^6\]

  • Calculamos:

\[(0.5)^6 = 0.5 \times 0.5 \times 0.5 \times 0.5 \times 0.5 \times 0.5\]

\[= 0.015625\]

Paso 3: Multiplicar Todos los Términos

\[P(X = 4) = 210 \times 0.0625 \times 0.015625\]

  • Calculamos el primer producto:

\[210 \times 0.0625 = 13.125\]

  • Luego

\[13.125 \times 0.015625 = 0.205078125\]

Interpretación

  • La probabilidad de obtener exactamente 4 caras en 10 lanzamientos de una moneda justa es aproximadamente 20.5%.

Distribución lanzamiento 100 monedas

Momentos de la Distribución Binomial

Media y varianza

  • La media (\(\mu\)) de una distribución binomial se calcula como:

\[\mu = np\]

  • La varianza (\(\sigma^2\)) se obtiene con:

\[\sigma^2 = np(1 - p)\]

Ejemplo 60 Tiros de Dados 🎲

  • Queremos responder:
  1. ¿Cuántas veces obtenemos un 4?
    • La probabilidad de obtener un 4 es:
      \(p = \frac{1}{6}\)

    • Usamos la media de la distribución binomial: \(\mu = np = 60 \times \frac{1}{6} = 10\)

  • Esperamos obtener un 4 en aproximadamente 10 lanzamientos.

Ejemplo 2

  • ¿Cuántos dados con resultados pares obtenemos?**

  • Los números pares en un dado son \((2, 4, 6)\), por lo que la probabilidad es: \(p = \frac{3}{6} = \frac{1}{2}\)

  • La media será: \(\mu = 60 \times \frac{1}{2} = 30\)

  • Interpretación:Esperamos obtener resultados pares en aproximadamente 30 lanzamientos.

Visualización ejemplos

Problema

  • Una persona va de caza. . Dispara tres veces, ella tiene una probabilidad de 70% de éxito
  • ¿Cuál es la media y varianza de esta distribución binomial?
  • ¿Cuál es la probabilidad exacta de que logre 2 tiros (\(k=2\))?

\[\mu = np\] \[\sigma^2 = np(1 - p)\]

Solución

  • Aplicamos los valores:

  • \(\mu = 3(0.7) = 2.1\)

  • \(\sigma^2 = (3)(0.7)(1 - 0.7) = 0.63\)

Interpretación

  • La media \(\mu = 2.1\) representa el número esperado de éxitos en 3 ensayos con \(p = 0.7\).
  • La varianza \(\sigma^2 = 0.63\) indica la dispersión de los valores en torno a la media.

Probabilidad de Obtener 2 Éxitos

Tip

  • Aplicamos la fórmula de la función de masa de probabilidad (PMF): \[f(x) = \binom{n}{k} p^k (1 - p)^{n - k}\]

  • Sustituyendo los valores \(n = 3\) y \(p = 0.7\):

\[f(k) = \binom{3}{k} 0.7^k (1 - 0.7)^{3 - k}\]

Cálculo para \(k = 2\)

\[f(2) = \binom{3}{2} 0.7^2 (1 - 0.7)^{3 - 2}\]

\[f(2) = \frac{3!}{2!(3-2)!} \times 0.7^2 \times (0.3)^1\]

\[f(2) = \frac{3!}{2!1!} \times 0.49 \times 0.3\]

\[f(2) = \frac{6}{2} \times 0.49 \times 0.3\]

\[f(2) = 3 \times 0.147 = 0.441\]

Solución en R

  • Podemos calcular la probabilidad de obtener exactamente 2 éxitos en 3 intentos con:
dbinom(2, size=3, prob=0.7)
# k=2
# n=3
# p=0.7
[1] 0.441
  • ✅ Esto significa que hay 44.1% de probabilidad de lograr exactamente 2 éxitos.

Problema: Muestra de Huevos

Planteamiento

  • Una docena de huevos contiene 3 huevos rotos.

  • Si tomamos una muestra aleatoria de 5 huevos, queremos calcular:

    a. ¿Cuál es la probabilidad de encontrar exactamente 2 huevos rotos?
    b. ¿Cuál es la probabilidad de encontrar 2 o menos huevos rotos?

Parámetros del Problema

  • El problema sigue una distribución binomial porque:
    • Cada huevo puede estar roto (\(X = 1\)) o no roto (\(X = 0\)).

    • La probabilidad de un huevo roto es:

      \(p = \frac{3}{12} = 0.25\)

      • Número de ensayos:

      \(n = 5\)

Problema: Muestra de Huevos

Solución

\(f(2) = \binom{5}{2} 0.25^2 (1 - 0.25)^{5-2}\)

  • Desarrollando los términos:

\(f(2) = \frac{5!}{2!(5-2)!} 0.25^2 (0.75)^3\)

\(f(2) = \frac{5!}{2!3!} \times 0.0625 \times 0.421875\)

\(f(2) = \frac{120}{12} \times 0.0625 \times 0.421875\)

\(f(2) = 10 \times 0.0263671875 = 0.263\)

Solución en R

dbinom(2, size=5, prob=3/12)
[1] 0.2636719
  • ✅ 263 es la probabilidad de encontrar exactamente 2 huevos rotos en la muestra.

Probabilidad Acumulada de Huevos Rotos

  • Para encontrar esta probabilidad, necesitamos la distribución acumulada.
  • Esto significa que sumamos las probabilidades de obtener 0, 1 o 2 huevos rotos:
dbinom(2, size=5, prob=3/12) +
dbinom(1, size=5, prob=3/12) +
dbinom(0, size=5, prob=3/12)
[1] 0.8964844
  • O alternativamente en un solo paso
pbinom(2, size=5, prob=3/12)
[1] 0.8964844

📌 0.896 representa la probabilidad acumulada de encontrar 2 o menos huevos rotos.

Visualización

Probabilidad acumulada

Ejercicio

  • En la familia Monrreal, cada uno de los 10 miembros tiene una probabilidad del 70% de trabajar en el gobierno.

📌 Definimos la variable aleatoria
- Sea \(X\) el número de miembros que trabajan en el gobierno:

\[X \sim \text{Bin}(n=10, p=0.7)\]

  • Queremos calcular la probabilidad exacta de que 6 miembros trabajen en el gobierno

Ejercicio

1️⃣ ¿Cuál es la probabilidad de que exactamente 6 miembros trabajen en el gobierno?
2️⃣ ¿Cuál es la probabilidad de que menos de 6 miembros trabajen en el gobierno?

Solución en R

# Definir parámetros
n <- 10   # Número de miembros
p <- 0.7  # Probabilidad individual de trabajar en el gobierno

# 1. Probabilidad de exactamente 6 miembros con trabajo

p_exacto_6 <- dbinom(6, size=n, prob=p)

#2. Probabilidad de al menos 6 miembros (X ≥ 6)

p_menos_6 <- 1 - pbinom(5, size=n, prob=p)

p_exacto_6
p_menos_6
[1] 0.2001209
[1] 0.8497317

Distribución binomial negativa

  • Es una extensión de la distribución binomial.

  • En lugar de contar cuántos éxitos ocurren en un número fijo de intentos, contamos cuántos intentos se necesitan para lograr un número fijo de éxitos.

  • Se usa cuando el experimento se repite hasta que se cumplen ciertas condiciones.

  • La Función de Masa de Probabilidad mapea la probabilidad de \(r\) éxitos y \(k\) número de fracasos en un orden específico

Binomial vs Binomial Negativa

Característica Distribución Binomial Distribución Binomial Negativa
Variable de interés Número de éxitos en \(n\) ensayos Número de fracasos antes de obtener \(r\) éxitos
Ejemplo típico ¿Cuántos tiros al blanco acierta en 10 intentos? ¿Cuántos fallos ocurren antes de acertar 5 veces?
Fórmula PMF \(P(X = k) = \binom{n}{k} p^k (1-p)^{n-k}\) \(P(X = x) = \binom{x + r - 1}{r - 1} p^r (1 - p)^x\)
Parámetros \(n\) (ensayos), \(p\) (éxito por ensayo) \(r\) (éxitos requeridos), \(p\) (probabilidad de éxito)
Tipo de proceso Experimento con intentos finitos Experimento con intentos hasta cumplir condición

Aplicaciones

¿Para qué se usa la Binomial Negativa?

  • Modela cuántos intentos fallidos ocurren antes de alcanzar un número fijo de éxitos.
  • Ejemplos:
    • Cuántos clientes rechazados antes de cerrar 5 ventas.
    • Número de partidos perdidos antes de ganar 3 juegos.
    • Cuántos intentos fallidos en un tiro al blanco hasta lograr 7 aciertos.