Variables aleatorias y distribuciones de probabilidad
Conceptos preliminares
Antes de definir variable aleatoria es necesario establecer conceptos y marcos donde ocurre la aleatoriedad.
Experimento aleatorio (\(\epsilon\))
Proceso definido cuyo resultado exacto no se puede conocer de antemano, incluso si se repite bajo las mismas condiciones iniciales. Los experimentos aleatorios no permiten predecir con certeza el resultado individual, pero sí el conjunto de resultados posibles.
Desde la probabilidad, un experimento aleatorio es una acción repetible cuyo resultado depende del azar, tal que:
El conjunto de resultados posibles (espacio muestral) es conocido.
Antes de realizarlo, no es posible determinar con certeza cuál resultado específico ocurrirá.
Al repetirse un gran número de veces bajo condiciones idénticas, presenta regularidades estadísticas describibles mediante probabilidades.
Por lo tanto existe: incertidumbre individual, repetibilidad, estructura probabilística, no determinismo. Algunos ejemplos:
- Lanzar una moneda y observar cara o sello.
- Medir el tiempo de falla de una máquina.
- Observar el número de defectos en un lote de producción.
- Medir el tiempo entre llegadas de clientes a una caja.
Espacio muestral (\(\Omega\))
El espacio muestral es el conjunto de todos los resultados posibles de un experimento aleatorio. Ejemplos:
Si el experimento es lanzar una moneda una vez, entonces \(\Omega = \{\text{Cara, Sello} \}\) o \(\Omega = \{ \text{C, S} \}\).
Si el experimento es “observar el estado de una bomba de agua”, entonces \(\Omega = \{\text{Funcionando, En falla} \}\)
Si el experimento es lanzar la moneda dos veces, entonces \(\Omega = \{\text{(C, C), (C,S), (S, C), (S,S)} \}\)
Si el experimento es medir el tiempo de falla de una máquina, entonces \(\Omega = (0,\infty )\). Si se admite falla inmediata en el instante cero entonces \(\Omega = [0,\infty )\).
Si el experimento es medir el tiempo entre llegadas de clientes a una caja, entonces \(\Omega = (0,\infty )\), o \(\Omega = [0,\infty )\) si se permiten llegadas simultaneas.
Como se puede observar existen espacios muestrales finitos como en el caso del lanzamiento de una moneda una vez: \(\Omega = \{ \text{C, S} \}\); existes espacios muestrales infinitos, como el caso del tiempo entre llegadas de clientes \(\Omega = (0,\infty )\). Así mismo, espacios muestrales discretos y espacios muestrales continuos.
Evento (\(A,~B,~C...\))
Es cualquier subconjunto del espacio muestral \(\Omega\), \(A \subseteq \Omega\). Ejemplo:
En el experimento aleatorio del lanzamiento de un dado el espacio muestral \(\Omega\) está dado por \(\Omega= \{1,2,3,4,5,6\}\). Si se define al evento \(A\) “que salga un número par”, entonces \(A= \{2, 4, 6 \}\).
Espacio de probabilidad
Estructura matemática que define al experimento, dada por:
\(\Omega\): el conjunto de resultados.
\(\mathcal{F}\): una colección de eventos (técnicamente una \(\sigma\)-álgebra) a los que podemos asignarles probabilidad.
\(P\): la medida de probabilidad que asigna un valor entre \(0\) y \(1\) a cada evento en \(\mathcal{F}\)
Variable aleatoria (V.A.)
A menudo, los resultados de un espacio muestral \(\Omega\) no son numéricos (ej. “Rojo”, “Éxito”, “Llegada de cliente”). Para poder hacer ingeniería y estadística, necesitamos traducir esos resultados a números reales.
Una V.A es una función matemática que asigna un valor numérico real a cada resultado de un experimento aleatorio.
Definición formal
Sea \(\Omega,~\mathcal{F},~P\) un espacio de probabilidad. Una variable aleatoria es una función:
\[X: \Omega \to \mathbb{R}\]
Tal que para cualquier número real \(x\), el conjunto \(\{\omega \in \Omega : X(\omega) \le x\}\) es un evento perteneciente a \(\mathcal{F}\).
¿Qué significa esto realmente?
Es una Función, no un valor: \(X\) no “toma” valores; \(X\) es la regla de asignación. El valor numérico aparece solo cuando ocurre un resultado \(\omega\) en la realidad.
Instrumento de Medición: imagina que \(\Omega\) es la realidad “cruda”. La V.A. es como un sensor que toma esa realidad y la convierte en una señal numérica procesable.
La Condición de “Medibilidad”: la parte matemática de que el conjunto sea un evento en \(\mathcal{F}\) garantiza que podemos calcular la probabilidad de que \(X\) tome ciertos valores. Si no pudiéramos mapear los números de vuelta a eventos conocidos, no podríamos decir “la probabilidad de que el tiempo sea menor a 5 min es 0.8”.
Clasificación de las V.A.
V.A. Discretas.
Son aquellas cuyo rango es un conjunto finito o infinito numerable (ej. número de piezas defectuosas, número de clientes en fila).
Función de Masa de Probabilidad (PMF): \(p(x_i) = P(X = x_i)\).
Condiciones:
- \(p(x_i) \ge 0\) para todo \(i\).
- \(\sum_{i} p(x_i) = 1\).
V.A Continuas.
Son aquellas que pueden tomar cualquier valor en un intervalo de números reales (ej. tiempo entre arribos, peso de una carga).
Función de Densidad de Probabilidad (PDF): \(f(x)\).
Condiciones:
- \(f(x) \ge 0\) para todo \(x\).
- \(\int_{-\infty}^{\infty} f(x) \,dx = 1\).
Probabilidad en un intervalo: \(P(a \le X \le b) = \int_{a}^{b} f(x) \,dx\).
Función de Distribución Acumulada (CDF)
La función de distribución acumulada (FDA o CDF, por sus siglas en inglés) de una variable aleatoria \(X\) se define como:
\[F(x) = P(X \le x)\]
CDF para V.A. discretas
Si \(X\) es una VA discreta, entonces:
\[F(x) = \sum_{x_i \le x} p(x_i)\]
\(F(x)\) es una función escalanoda, con saltos en los posibles valores de \(X\)
- Para continuas:
CDF para V.A. contínuas
Si \(X\) es una VA contínua, entonces:
\[F(x) = \int_{-\infty}^{x} f(t)~dt\]
Propiedades clave:
- Es no decreciente.
- \(\lim_{x \to \infty} F(x) = 1\) y \(\lim_{x \to -\infty} F(x) = 0\).
Medida de tendencia y dispersión
Valor Esperado (Media, Esperanza matemática)
Sea \(X\) una variable aleatoria.
La media o valor esperado de \(X\) denotado por \(E[X]\) o \(\mu\) se define como el promedio teórico de los valores que puede tomar \(X\) ponderado por sus probabilidades.
Si \(X\) es una V.A. discreta, toma valores \(x_i\) con probabilidades \(P(X=x_i)\) el valor esperado se define como:
\[E[X] = \sum x_i~ P(X=x_i)\]
Si \(X\) es una V.A continua con función de densidad \(f_(x)\), el valor esperado se define como:
\[E[X] = \int_{-\infty}^{\infty} xf(x) \,dx\]
Varianza
La varianza de una V.A \(X\), denotada por \(Var(X)\) o \(\sigma^2\), mide qué tan dispersos están los valores de \(X\) alrededor de su media. Se define como:
\[ Var(X) = E[(X- \mu)^2]\\ \mu= E[X] \]
Si \(X\) es una V.A. discreta toma valores \(x_i\) con probabilidades \(P(X=x_i)\) la varianza se define como:
\[ Var(X) = \sum_i (x_i - \mu)^2 P(X=x_i) \]
Si \(X\) es una V.A continua con función de densidad \(f_(x)\), el valor esperado se define como:
\[ Var(X) = \int_{-\infty}^{\infty} (x-\mu)^2 f(x)dx \]