Objetivos:
Relacionar directamente los resultados de un experimento aleatorio con números reales para el desarrollo de los modelos de inferencia estadística.
Describir el comportamiento probabilístico de una variable dependiendo de si es discreta o continua.
Calcular todo tipo de medidas a nivel poblacional (e.g., tendencia central). Tales medidas se denominan parámetros.
Una variable aleatoria (v.a.) \(X\) es una función que asigna un número real a cada resultado del espacio muestral \(\Omega\) de un experimento aleatorio: \[ X :\Omega \longrightarrow \mathbb{R}:\omega\longmapsto X(\omega) \] Las v.a. se simbolizan con letras mayúsculas \(X\), \(Y\) y \(Z\). Se utiliza su correspondiente letra minúscula (en este caso \(x\), \(y\), \(z\)) para designar sus posibles valores.
Las v.a. pueden ser de dos tipos dependiendo su recorrido:
Considere el experimento aleatorio “lanzar tres veces una moneda al aire”, junto con la v.a. \(X\): “número de caras obtenido al final de los tres lanzamientos”.
Así: \[ \Omega = \{(c,c,c), (c,c,s), (c,s,c), (c,s,s), (s,c,c), (s,c,s), (s,s,c), (s,s,s) \} \] y \(X\) es una v.a. discreta con valores:
\(X((c,c,c)) = 3\), \(X((c,c,s)) = 2\), \(X((c,s,c)) = 2\), \(X((s,c,c)) = 2\), \(X((s,s,c)) = 1\), \(X((s,c,s)) = 1\), \(X((c,s,s)) = 1\) y \(X((s,s,s)) = 0\).
Sea \(X\) una v.a.d. que toma los valores \(x_1, x_2, \ldots\) (finitos o infinitos enumerables).
Una función \(f_X : \mathbb{R} \longrightarrow [0,1]\) es una función de masa de probabilidad (f.m.p.) de \(X\) si y solo si: \[ f_X(x)= \begin{cases} \textsf{P}(X = x), & \text{si $x=x_1,x_2,\ldots$}; \\ 0, & \text{en otro caso}. \end{cases} \] donde \((X=x)=\{w\in\Omega: X(w)=x\}\), de tal forma que si \(x\) no es uno de los valores que toma la v.a. \(X\), entonces \(f_X(x) = 0\).
Continuando con el ejemplo anterior, se tiene que la f.m.p. de la variable “número de caras obtenido” es: \[ \begin{align*} f_X(0) &= P(X=0)=\textsf{Pr}((s,s,s))=\frac{1}{8}=0.125,\\ f_X(1) &= P(X=1)=\textsf{Pr}(\{(c,s,s), (s,c,s), (s,s,c)\}) =\frac{3}{8}=0.375, \\ f_X(2) &= P(X=2)=\textsf{Pr}(\{(s,c,c), (c,c,s), (c,s,c)\}) =\frac{3}{8}=0.375, \\ f_X(3) &= P(X=3)=\textsf{Pr}((c,c,c))=\frac{1}{8}=0.125. \\ \end{align*} \]
Concretamente, esta función está dada por: \[ f_X(x)= \begin{cases} 0.125, & \text{si $x=0,3$}; \\ 0.375, & \text{si $x=1,2$}; \\ 0, & \text{en otro caso}. \\ \end{cases} \]
Además, se observa que: \[ \sum_{k=1}^4 f_X(x_k) = f_X(0) + f_X(1) + f_X(2) + f_X(3) = 0.125+0.375+0.375+0.125 = 1 \] con \(x_1=0\), \(x_2=1\), \(x_3=2\) y \(x_4=3\).
La siguiente figura presenta el gráfico de la f.m.p de la variable \(X\).
# valores de la variable
x <- 0:3
# f.m.p.
fx <- c(1, 3, 3, 1)/8
# gráfico
plot(x = x, y = fx, xlab = "x", ylab = "f(x)", pch = 15, col = "blue")
segments(x0 = x, y0 = 0, x1 = x, y1 = fx, lwd = 2, col = "blue")
Sea \(f_X\) una f.m.p. de una v.a.d. \(X\) que asume los valores \(x_1,x_2,\ldots\) definida sobre un espacio muestral \(\Omega\) no vacío. Entonces, se satisface que:
Dada \(X\): “suma del lanzamiento de dos dados”. Se sabe que su f.m.p está dada por:
\[f_X(x)=\frac{6-|7-x|}{36}\,,\qquad x=2,3,...,12\] Calcular: 1. \(P(X=3)=\frac{6-|7-3|}{36}=\frac{2}{36}\).
f <- function(x) (6-abs(7-x))/36
f(3)
## [1] 0.05555556
f(2)+f(3)+f(4)
## [1] 0.1666667
f(3)+f(4)+f(5)+f(6)
## [1] 0.3888889
f(3)+f(4)+f(5)
## [1] 0.25
El gráfico de \(f_X\) es:
#valores de la variable
x <- 2:12
#calculo de la función de probabilidad para cada valor de la variable
fx <- f(x)
cbind(x, fx)
## x fx
## [1,] 2 0.02777778
## [2,] 3 0.05555556
## [3,] 4 0.08333333
## [4,] 5 0.11111111
## [5,] 6 0.13888889
## [6,] 7 0.16666667
## [7,] 8 0.13888889
## [8,] 9 0.11111111
## [9,] 10 0.08333333
## [10,] 11 0.05555556
## [11,] 12 0.02777778
#Función de probabilidad
plot(x = x, y = fx, xlab = "x", ylab = "f(x)", pch = 15, col = "blue")
segments(x0 = x, y0 = 0, x1 = x, y1 = fx, lwd = 2, col = "blue")
Sea \(X\) una v.a.d. que sume los valores \(x_1, x_2,\ldots\) (finitos o infinitos enumerables). La función de distribución es aquella que calcula la probabilidad acumulada hasta un punto \(x\), es decir, es la función \(F_X: \mathbb{R} \longrightarrow [0,1]\) definida por: \[ F_X(x) = \textsf{P}(X \leq x)= \sum_{t \leq x} f_X(t) \] para cualquier número real \(x\), cuando \(X\) tiene f.m.p. \(f_X\).
Volviendo al primer ejemplo, se tiene que: \[ \begin{align*} F_X(0) &= P(X \leq 0)= f_X(0) = \frac{1}{8}=0.125, \\ F_X(1) &= P(X \leq 1)= f_X(0) + f_X(1) =\frac{1}{8} + \frac{3}{8} =\frac{4}{8}= \frac{1}{2}=0.5, \\ F_X(2) &= P(X \leq 2)= f_X(0) + f_X(1) + f_X(2) =\frac{1}{8} + \frac{3}{8} + \frac{3}{8} = \frac{7}{8}=0.875,\\ F_X(3) &= P(X \leq 3)= f_X(0) + f_X(1) + f_X(2) + f_X(3) =\frac{1}{8} + \frac{3}{8} + \frac{3}{8} + \frac{1}{8}= \frac{8}{8} = 1.\\ \end{align*} \]
Resumiendo: \[ F_X(x)= \begin{cases} 0, & \text{si $x < 0$}; \\ \frac{1}{8}, & \text{si $ 0 \leq x < 1$}; \\ \frac{4}{8}, & \text{si $ 1 \leq x < 2$}; \\ \frac{7}{8}, & \text{si $ 2 \leq x < 3$}; \\ 1, & \text{si $3 \leq x$}. \\ \end{cases} \]
El gráfico de \(F_X\) es:
# valores de la variable
x <- 0:3
# f.m.p.
fx <- c(1, 3, 3, 1)/8
# f.d.a.
Fx <- cumsum(fx)
plot(x = c(0, x), y = c(0, Fx), type = "s", xlab = "x", ylab = "F(x)", col = "blue", lwd = 2)
points(x, Fx, col = "blue", pch = 15)
Sea \(F_X\) una f.d.a. de una v.a.d. \(X\) definida sobre un espacio muestral \(\Omega\) no vacío. Entonces se satisface que:
La junta directiva de un hospital quiere mejorar su atención en el horario nocturno de los pacientes que necesitan de atención quirúrgica inmediata. Para esto, se quiere analizar la variable \(X\) dada por “número de pacientes que requieren de atención quirúrgica inmediata reportados entre las 19:00 y las 5:00”. El analista encargado asegura que la f.m.p. de \(X\) es: \[ f_X(x)=\left\{ \begin{array}{ll} \frac{ 7^x e^{-7}}{x!}, & \hbox{si $x=0,1,2,\ldots$;} \\ 0, & \hbox{en otro caso.} \end{array} \right. \]
Se pide:
Para encontrar el porcentaje de noches en las que el hospital puede atender a todos sus pacientes entre las 19:00 y las 5:00, basta con calcular \[ P(X\leq 5)=\sum_{x=0}^5 \frac{ 7^x e^{-7}}{x!}=0.3007, \] y por lo tanto solo en el 30% de las noches el hospital puede atender a todos los pacientes que llegan en la jornada nocturna.
En este caso requerimos calcular el percentil 50, esto es, \(\pi_{50}\). Evaluando en los valores de \(0,1,2,\ldots\) se tiene que: \[\begin{align*} &\textsf{P}(X\leq 0)=0.0009, \\& P(X\leq 1)=0.0072, \\& P(X\leq 2)=0.0296, \\& P(X\leq 3)=0.0817, \\&\hspace{2.2cm}\vdots \\& P(X\leq 6)=0.4497, \\& P(X\leq 7)=0.5987. \end{align*}\] En consecuencia, se obtiene que \(p_{50}=7\).
# valores de la variable
x <- 0:20
# f.m.p.
fx <- (7^x)*exp(-7)/factorial(x)
Fx <- cumsum(fx)
print(cbind(x,Fx))
## x Fx
## [1,] 0 0.000911882
## [2,] 1 0.007295056
## [3,] 2 0.029636164
## [4,] 3 0.081765416
## [5,] 4 0.172991608
## [6,] 5 0.300708276
## [7,] 6 0.449711056
## [8,] 7 0.598713836
## [9,] 8 0.729091268
## [10,] 9 0.830495937
## [11,] 10 0.901479206
## [12,] 11 0.946650377
## [13,] 12 0.973000227
## [14,] 13 0.987188607
## [15,] 14 0.994282798
## [16,] 15 0.997593420
## [17,] 16 0.999041817
## [18,] 17 0.999638216
## [19,] 18 0.999870149
## [20,] 19 0.999955598
## [21,] 20 0.999985505
# valores de la variable
x <- 0:20
# f.m.p.
fx <- (7^x)*exp(-7)/factorial(x)
Fx <- cumsum(fx)
# gráficos
par(mfrow = c(1,2))
# f.m.p
plot(x = x, y = fx, xlab = "x", ylab = "f(x)", pch = 15, col = "blue")
segments(x0 = x, y0 = 0, x1 = x, y1 = fx, lwd = 2, col = "blue")
# f.d.a.
plot(x = c(0, x), y = c(0, Fx), type = "s", xlab = "x", ylab = "F(x)", col = "blue", lwd = 2)
points(x, Fx, col = "blue", pch = 15)