Distribución de probabilidad continua

Una distribución de probabilidad continua describe cómo se reparte la probabilidad en una variable aleatoria que puede tomar infinitos valores dentro de un intervalo de números reales.

Formalmente, una variable aleatoria continua \(X\) tiene asociada una función de densidad de probabilidad \(f(x)\) que cumple:

  1. \(f(x) \ge 0\) para todo \(x\).
  2. La probabilidad total es 1: \[ \int_{-\infty}^{+\infty} f(x)\,dx = 1 \]
  3. La probabilidad de que \(X\) tome un valor entre \(a\) y \(b\) se calcula como: \[ \mathbb{P}(a \le X \le b) = \int_a^b f(x)\,dx \]

¡Observación!: En una distribución continua, la probabilidad de que \(X\) tome exactamente un valor específico es 0, es decir: \[ \mathbb{P}(X = x_0) = 0 \] por lo que siempre trabajamos con probabilidades en intervalos.

Distribución uniforme continua

Una distribución uniforme continua describe una variable aleatoria continua \(X\) que puede tomar cualquier valor dentro de un intervalo \([a,b]\), y todos los valores del intervalo son igualmente probables.

Formalmente, la variable aleatoria continua \(X\) tiene una función de densidad de probabilidad \(f(x)\) que cumple:

  1. La función de densidad es constante en el intervalo \([a,b]\): \[ f(x) = \frac{1}{b-a}, \quad a \le x \le b \] y fuera de ese intervalo vale 0.

  2. La probabilidad total en el intervalo es 1: \[ \int_a^b \frac{1}{b-a}\,dx = 1 \]

  3. La probabilidad de que \(X\) tome un valor entre \(c\) y \(d\), con \(a \le c < d \le b\), es proporcional a la longitud del intervalo: \[ \mathbb{P}(c \le X \le d) = \int_c^d \frac{1}{b-a}\,dx = \frac{d-c}{b-a} \]


Uso de la distribución uniforme continua en RStudio

En RStudio, la distribución uniforme continua sobre el intervalo \([a,b]\) se trabaja mediante las siguientes funciones, donde el argumento min corresponde a \(a\) y max corresponde a \(b\):


  1. Función de densidad (dunif)

    La densidad de \(X\) es \[ f_X(x) = \frac{1}{b-a},\quad a \le x \le b, \]


    En RStudio se evalúa en un punto \(x\) con:

    dunif(x, min = a, max = b).


  1. Función de distribución acumulada (punif)

    La distribución acumulada de \(X\) es \[ F_X(q) = \mathbb{P}(X \le q). \]
    En RStudio se obtiene con:

    punif(q, min = a, max = b).


  1. Función cuantil (qunif)

    El cuantil de orden \(p\) es el valor \(x_p\) tal que \[ \mathbb{P}(X \le x_p) = p, \quad 0 \le p \le 1. \] En RStudio se calcula con:

    qunif(p, min = a, max = b).


  1. Generación de simulaciones (runif)

    Una muestra aleatoria de tamaño \(n\) de la distribución uniforme \(U(a,b)\) se genera con:

    runif(n, min = a, max = b).


  1. Esperanza y varianza

    Para \(X \sim U(a,b)\), la esperanza y la varianza son: \[ \mathbb{E}(X) = \frac{a+b}{2}, \qquad \operatorname{Var}(X) = \frac{(b-a)^2}{12}. \]


Ejemplo

Supongamos que el tiempo de respuesta (en segundos) de un estudiante a una pregunta corta en un cuestionario en línea se modela como uniforme entre 20 y 50 segundos.
Es decir: \[ X \sim U(20, 50). \]

A partir de este contexto, podemos usar cada función de RStudio:

  1. Densidad en un punto

    ¿Cuál es la densidad de probabilidad en \(x = 30\) segundos?

    dunif(30, min = 20, max = 50).

  2. Probabilidad acumulada

    ¿Cuál es la probabilidad de que el tiempo de respuesta sea menor o igual a 35 segundos?

    punif(35, min = 20, max = 50).

  3. Probabilidad en un intervalo

    ¿Cuál es la probabilidad de que el tiempo de respuesta esté entre 25 y 40 segundos?


    punif(40, min = 20, max = 50) - punif(25, min = 20, max = 50).

  4. Cuantil

    ¿Por debajo de qué tiempo se encuentra el 90% de las respuestas?

    qunif(0.9, min = 20, max = 50).

  5. Esperanza y varianza

    \[ \mathbb{E}(X) = \frac{20 + 50}{2} = 35, \qquad \operatorname{Var}(X) = \frac{(50 - 20)^2}{12}. \]


Ejercicios propuestos

Ejercicio 1. Tiempo de espera del bus

El tiempo de espera (en minutos) para que llegue un bus en una parada se modela como una variable aleatoria continua \[ X \sim U(0,15). \]

  1. ¿Cuál es la densidad de probabilidad en \(x = 5\) minutos?
  2. ¿Cuál es la probabilidad de esperar a lo más 10 minutos?
  3. ¿Cuál es la probabilidad de que el tiempo de espera esté entre 4 y 12 minutos?
  4. Calcula la esperanza y la varianza teóricas de \(X\) usando las fórmulas de \(U(a,b)\).

Ejercicio 2. Longitud de tablas de madera

La longitud (en metros) de una tabla producida por una máquina se modela como \[ X \sim U(1.95, 2.05). \]

  1. Escribe la función de densidad \(f_X(x)\) para esta distribución.
  2. ¿Cuál es la probabilidad de que una tabla mida a lo más \(2{,}00\) m?
  3. ¿Cuál es la probabilidad de que la longitud esté entre \(1{,}97\) m y \(2{,}03\) m?
  4. Calcula la esperanza y la varianza de \(X\) y coméntalas en el contexto de la producción.

Ejercicio 3. Nivel de batería de un celular

El porcentaje de batería con el que los celulares de un curso encienden al comienzo de la clase se modela como \[ X \sim U(0.3, 0.9), \] donde \(X\) está medido en proporción (0 = 0%, 1 = 100%).

  1. ¿Cuál es la probabilidad de que un celular tenga menos de 50% de batería al encender?
  2. ¿Por encima de qué nivel de batería se encuentra el 75% de los celulares? (Es decir, encuentra el cuantil de orden \(0{,}25\)).
  3. Calcula la esperanza y la varianza de \(X\) e interpreta el valor esperado en términos de “batería promedio al inicio de la clase”.

Ejercicio 4. Inicio de una reunión en línea

El horario de inicio efectivo de una reunión en línea se retrasa de manera uniforme entre 0 y 10 minutos respecto de la hora pactada. Sea \[ X \sim U(0,10), \] donde \(X\) es el retraso en minutos.

  1. Calcula la probabilidad de que la reunión comience con un retraso menor o igual a 3 minutos.
  2. Calcula la probabilidad de que la reunión comience entre 4 y 8 minutos después de la hora pactada.
  3. Determina el tiempo \(t\) tal que el 90% de las veces la reunión comienza antes de ese retraso.
  4. Calcula la esperanza y la varianza del retraso \(X\) e interpreta la esperanza.

Ejercicio 5. Peso de envases de un producto

El peso (en gramos) de un envase de un producto alimenticio se modela como \[ X \sim U(495, 505). \]

  1. Genera en RStudio una muestra de tamaño \(n = 100\) de pesos posibles.
  2. Calcula la esperanza muestral y la varianza muestral de los pesos simulados.
  3. Calcula la esperanza y la varianza teóricas de \(X\) usando las fórmulas de \(U(a,b)\).
  4. Compara los valores muestrales con los valores teóricos y comenta brevemente si los resultados son coherentes con el modelo uniforme.

Distribución exponencial

Una distribución exponencial describe una variable aleatoria continua \(X\) que suele utilizarse para modelar tiempos de espera o tiempos entre eventos en un proceso que ocurre de manera continua y aleatoria (por ejemplo, tiempo hasta la próxima llamada, tiempo hasta que falle un componente, etc.).

Formalmente, la variable aleatoria continua \(X\) con parámetro \(\lambda > 0\) tiene una función de densidad de probabilidad \(f(x)\) que cumple:

  1. La función de densidad es \[ f(x) = \lambda e^{-\lambda x},\quad x \ge 0, \] y \(f(x) = 0\) para \(x < 0\).

  2. La probabilidad total es 1: \[ \int_0^{\infty} \lambda e^{-\lambda x}\,dx = 1. \]

  3. La probabilidad de que \(X\) tome un valor entre \(c\) y \(d\), con \(0 \le c < d\), es \[ \mathbb{P}(c \le X \le d) = \int_c^d \lambda e^{-\lambda x}\,dx. \]


Uso de la distribución exponencial en RStudio

En RStudio, la distribución exponencial con parámetro \(\lambda\) se trabaja mediante las siguientes funciones, donde el argumento rate corresponde al parámetro \(\lambda\) (es decir, rate = lambda):


  1. Función de densidad (dexp)

    La densidad de \(X\) es \[ f_X(x) = \lambda e^{-\lambda x},\quad x \ge 0. \]
    En RStudio se evalúa en un punto \(x\) con:

    dexp(x, rate = lambda).


  1. Función de distribución acumulada (pexp)

    La distribución acumulada de \(X\) es \[ F_X(t) = \mathbb{P}(X \le t) = 1 - e^{-\lambda t},\quad t \ge 0. \]
    En RStudio se obtiene con:

    pexp(t, rate = lambda).


  1. Función cuantil (qexp)

    El cuantil de orden \(p\) es el valor \(x_p\) tal que \[ \mathbb{P}(X \le x_p) = p, \quad 0 \le p \le 1. \]
    En RStudio se calcula con:

    qexp(p, rate = lambda).


  1. Generación de simulaciones (rexp)

    Una muestra aleatoria de tamaño \(n\) de la distribución exponencial con parámetro \(\lambda\) se genera con:

    rexp(n, rate = lambda).


  1. Esperanza y varianza

    Para \(X\) con distribución exponencial y parámetro \(\lambda > 0\), la esperanza y la varianza son: \[ \mathbb{E}(X) = \frac{1}{\lambda}, \qquad \operatorname{Var}(X) = \frac{1}{\lambda^2}. \]

Ejemplo

Supongamos que el tiempo de atención (en minutos) hasta que un estudiante recibe respuesta de su profesor en un chat se modela como exponencial con parámetro \(\lambda = 0{,}2\).
Es decir: \[ X \sim \text{Exponencial}(\lambda = 0{,}2). \]

A partir de este contexto, podemos usar cada función de RStudio:

  1. Densidad en un punto

    ¿Cuál es la densidad de probabilidad en \(x = 5\) minutos?

    dexp(5, rate = 0.2).

  2. Probabilidad acumulada

    ¿Cuál es la probabilidad de que el estudiante reciba respuesta antes de 10 minutos?

    pexp(10, rate = 0.2).

  3. Probabilidad en un intervalo

    ¿Cuál es la probabilidad de que el tiempo de respuesta esté entre 5 y 15 minutos?

    pexp(15, rate = 0.2) - pexp(5, rate = 0.2).

  4. Cuantil

    ¿Por debajo de qué tiempo se encuentran el 90% de las respuestas?

    qexp(0.9, rate = 0.2).

  5. Esperanza y varianza

    Calcula la esperanza y la varianza teóricas de \(X\) usando las fórmulas de la distribución exponencial: \[ \mathbb{E}(X) = \frac{1}{0{,}2}, \qquad \operatorname{Var}(X) = \frac{1}{0{,}2^2}. \]


Ejercicios propuestos

Ejercicio 1. Tiempo de falla de un componente electrónico

El tiempo de vida (en años) de cierto componente electrónico se modela como una variable aleatoria continua con distribución exponencial \[ X \sim \text{Exponencial}(\lambda = 0{,}5). \]

  1. Escribe la función de densidad \(f_X(x)\) para esta distribución.
  2. Calcula la probabilidad de que el componente falle antes de 1 año.
  3. Calcula la probabilidad de que el componente dure entre 1 y 3 años.
  4. Calcula la esperanza y la varianza de \(X\) e interpreta la esperanza en el contexto del tiempo de vida del componente.

Ejercicio 2. Tiempos entre llamadas en un centro de atención

En un centro de atención telefónica, el tiempo (en minutos) entre dos llamadas consecutivas se modela como \[ X \sim \text{Exponencial}(\lambda = 0{,}4). \]

  1. ¿Cuál es la probabilidad de que el tiempo entre dos llamadas sea menor que 2 minutos?
  2. ¿Cuál es la probabilidad de que el tiempo entre llamadas sea mayor que 5 minutos?
  3. Encuentra el tiempo \(t\) tal que el 80% de los intervalos entre llamadas es menor o igual que \(t\).
  4. Calcula la esperanza de \(X\) e interprétala en términos del “tiempo promedio entre llamadas”.

Ejercicio 3. Tiempo de respuesta de un servidor web

El tiempo de respuesta (en segundos) de un servidor web a una petición se modela como \[ X \sim \text{Exponencial}(\lambda = 1{,}5). \]

  1. Calcula la probabilidad de que el servidor responda en menos de 1 segundo.
  2. Calcula la probabilidad de que el tiempo de respuesta esté entre 1 y 3 segundos.
  3. Determina el cuantil de orden \(0{,}95\) y explica qué significa este valor en el contexto del problema.
  4. Calcula la varianza de \(X\) y comenta qué indica respecto de la variabilidad de los tiempos de respuesta.

Ejercicio 4. Duración de una conexión a internet

La duración (en horas) de una conexión a internet antes de que se corte se modela como \[ X \sim \text{Exponencial}(\lambda = 0{,}25). \]

  1. Calcula la probabilidad de que la conexión se mantenga activa al menos 2 horas.
  2. Calcula la probabilidad de que la conexión dure entre 1 y 4 horas.
  3. Encuentra el tiempo \(t\) tal que solo el 10% de las conexiones dura más que \(t\).
  4. Calcula la esperanza de \(X\) e interprétala en el contexto de la duración promedio de la conexión.

Ejercicio 5. Tiempo de atención en una mesa de ayuda

El tiempo de atención (en minutos) que un estudiante permanece en una mesa de ayuda se modela como \[ X \sim \text{Exponencial}(\lambda = 0{,}3). \]

  1. Genera en RStudio una muestra de tamaño \(n = 100\) de tiempos de atención simulados.
  2. Calcula la esperanza muestral y la varianza muestral de los tiempos simulados.
  3. Calcula la esperanza y la varianza teóricas de \(X\) usando las fórmulas de la distribución exponencial.
  4. Compara los valores muestrales con los valores teóricos y comenta brevemente si los resultados son coherentes con el modelo exponencial.

Distribución normal

Una distribución normal describe una variable aleatoria continua \(X\) cuyos valores se agrupan en torno a una media, formando una curva en forma de campana, simétrica respecto de dicha media.
La distribución normal está determinada por dos parámetros:

  • \(\mu\) : media (centro de la distribución).
  • \(\sigma > 0\) : desviación estándar (dispersión de los datos).

Decimos que \[ X \sim N(\mu,\sigma^2). \]

Formalmente, la variable aleatoria continua \(X\) tiene una función de densidad de probabilidad \(f(x)\) que cumple:

  1. La función de densidad es \[ f(x) = \frac{1}{\sigma\sqrt{2\pi}}\, e^{-\frac{(x-\mu)^2}{2\sigma^2}},\quad x \in \mathbb{R}. \]

  2. La probabilidad total en la recta real es 1: \[ \int_{-\infty}^{\infty} \frac{1}{\sigma\sqrt{2\pi}}\, e^{-\frac{(x-\mu)^2}{2\sigma^2}}\,dx = 1. \]

  3. La probabilidad de que \(X\) tome un valor entre \(a\) y \(b\), con \(a < b\), es \[ \mathbb{P}(a \le X \le b) = \int_a^b \frac{1}{\sigma\sqrt{2\pi}}\, e^{-\frac{(x-\mu)^2}{2\sigma^2}}\,dx. \]


Uso de la distribución normal en RStudio

En RStudio, la distribución normal se trabaja mediante las siguientes funciones, donde los argumentos mean y sd corresponden a la media \(\mu\) y a la desviación estándar \(\sigma\):


  1. Función de densidad (dnorm)

    La densidad de \(X\) es \[ f_X(x) = \frac{1}{\sigma\sqrt{2\pi}}\, e^{-\frac{(x-\mu)^2}{2\sigma^2}},\quad x \in \mathbb{R}. \]
    En RStudio se evalúa en un punto \(x\) con:

    dnorm(x, mean = mu, sd = sigma).


  1. Función de distribución acumulada (pnorm)

    La distribución acumulada de \(X\) es \[ F_X(q) = \mathbb{P}(X \le q). \]
    En RStudio se obtiene con:

    pnorm(q, mean = mu, sd = sigma).


  1. Función cuantil (qnorm)

    El cuantil de orden \(p\) es el valor \(x_p\) tal que \[ \mathbb{P}(X \le x_p) = p,\quad 0 \le p \le 1. \]
    En RStudio se calcula con:

    qnorm(p, mean = mu, sd = sigma).


  1. Generación de simulaciones (rnorm)

    Una muestra aleatoria de tamaño \(n\) de la distribución normal \(N(\mu,\sigma^2)\) se genera con:

    rnorm(n, mean = mu, sd = sigma).


  1. Esperanza y varianza

    Para \(X \sim N(\mu,\sigma^2)\), la esperanza y la varianza son: \[ \mathbb{E}(X) = \mu, \qquad \operatorname{Var}(X) = \sigma^2. \]

Ejemplo

Supongamos que el puntaje obtenido por estudiantes en una prueba estandarizada se modela como normal con media \(\mu = 500\) puntos y desviación estándar \(\sigma = 100\) puntos.
Es decir: \[ X \sim N(500, 100^2). \]

A partir de este contexto, podemos usar cada función de RStudio:

  1. Densidad en un punto

    ¿Cuál es la densidad de probabilidad en \(x = 550\) puntos?

    dnorm(550, mean = 500, sd = 100).

  2. Probabilidad acumulada

    ¿Cuál es la probabilidad de que un estudiante obtenga un puntaje menor o igual a 600 puntos?

    pnorm(600, mean = 500, sd = 100).

  3. Probabilidad en un intervalo

    ¿Cuál es la probabilidad de que el puntaje esté entre 450 y 650 puntos?

    pnorm(650, mean = 500, sd = 100) - pnorm(450, mean = 500, sd = 100).

  4. Cuantil

    ¿Por encima de qué puntaje se encuentra el 10% de los estudiantes con mejores resultados?
    (Es decir, el cuantil de orden \(0{,}90\)).

    qnorm(0.90, mean = 500, sd = 100).

  5. Esperanza y varianza

    Calcula la esperanza y la varianza teóricas de \(X\) usando las fórmulas de la distribución normal: \[ \mathbb{E}(X) = 500, \qquad \operatorname{Var}(X) = 100^2. \]


Ejercicios propuestos

Ejercicio 1. Altura de estudiantes

La altura (en cm) de los estudiantes de un curso se modela como \[ X \sim N(165, 8^2). \]

  1. Calcula la probabilidad de que un estudiante mida menos de 160 cm.
  2. Calcula la probabilidad de que la altura esté entre 160 cm y 175 cm.
  3. Determina el cuantil de orden \(0{,}95\) y explica qué representa en este contexto.
  4. Calcula la esperanza y la varianza de \(X\) e interpreta la esperanza en términos de “altura promedio”.

Ejercicio 2. Tiempos de resolución de un ejercicio

El tiempo (en minutos) que tarda un estudiante en resolver cierto ejercicio se modela como \[ X \sim N(12, 3^2). \]

  1. ¿Cuál es la probabilidad de que un estudiante termine el ejercicio en menos de 10 minutos?
  2. ¿Cuál es la probabilidad de que el tiempo de resolución esté entre 9 y 15 minutos?
  3. Determina el tiempo \(t\) tal que el 80% de los estudiantes termina el ejercicio antes o igual que \(t\) minutos.
  4. Calcula la varianza de \(X\) e interpreta su significado respecto de la dispersión de los tiempos.

Ejercicio 3. Peso de paquetes enviados

El peso (en kg) de paquetes enviados por una empresa de envíos se modela como \[ X \sim N(2{,}5, 0{,}4^2). \]

  1. Calcula la probabilidad de que un paquete pese menos de 2 kg.
  2. Calcula la probabilidad de que el peso esté entre 2 kg y 3 kg.
  3. Determina el cuantil de orden \(0{,}90\) y explica qué significa en el contexto del peso de los paquetes.
  4. Calcula la esperanza y la varianza de \(X\) y coméntalas en el contexto de la empresa.

Ejercicio 4. Puntaje en una prueba de matemáticas

El puntaje (en una escala de 0 a 100) de una prueba de matemáticas se modela como \[ X \sim N(60, 12^2). \]

  1. Calcula la probabilidad de que un estudiante obtenga menos de 50 puntos.
  2. Calcula la probabilidad de que un estudiante obtenga un puntaje entre 55 y 80 puntos.
  3. Determina el puntaje que debe superar un estudiante para estar dentro del 5% superior del curso.
  4. Calcula la esperanza y la varianza de \(X\) e interpreta la esperanza en términos de rendimiento promedio.

Ejercicio 5. Consumo de combustible

El consumo (en litros por cada 100 km) de cierto modelo de automóvil se modela como \[ X \sim N(7{,}5, 0{,}9^2). \]

  1. Genera en RStudio una muestra de tamaño \(n = 100\) del consumo de combustible de este automóvil.
  2. Calcula la esperanza muestral y la varianza muestral de los consumos simulados.
  3. Calcula la esperanza y la varianza teóricas de \(X\) usando las fórmulas de la distribución normal.
  4. Compara los valores muestrales con los valores teóricos y comenta brevemente si los resultados son coherentes con el modelo normal.