Introducción
Para el desarrollo de técnicas de inferencia estadística, es conveniente relacionar directamente los resultados de un experimento aleatorio con números reales, ya que con tal asociación el análisis de las características de interés es más productivo.
Dependiendo de si la variable resultante es discreta (solo pueden adoptar un número finito o una infinidad enumerable de valores) o continua (los valores están asociados con una escala continua de medición), es posible describir su comportamiento probabilístico a partir de la función de probabilidad o de la función de densidad, respectivamente.
Además, por medio de estas funciones es posible calcular todo tipo de medidas (e.g., tendencia central) a nivel “poblacional”. En este contexo, tales medidas se denominan parámetros.
Objetivos
Apropiarse del concepto de variable aleatoria.
Conocer, entender y usar apropiadamente los conceptos de función de probabilidad o función de distribución, según sea el caso.
Apropiarse de los conceptos de valor esperado y varianza poblacional.
Conceptos preliminares
Las siguientes definiciones están siempre basadas en un espacio de probabilidad \((\Omega, \mathcal{A},P)\).
Variable aleatoria (v.a.)
Una v.a. \(X\) es una función cuyo dominio es \(\Omega\) y recorrido \(\mathcal{R}\), que asigna un único número real a cada resultado del espacio muestral \(\Omega\) de un experimento aleatorio. De tal forma que la inversa de \(X\) calculada en un subconjunto de los reales, siempre pertenece a \(\mathcal{A}\).
\[X :\Omega \longrightarrow \mathbb{R}:\omega\longmapsto X(\omega)\]
Las v.a.s pueden ser de dos tipos dependiendo su recorrido:
Discretas: Cuando su recorrido es numerable. Un buen ejemplo de variables discretas son los conteos, como el número de casos incidentes de SarsCov2 en un mes determinado.
Continuas: Cuando su recorrido es no numerable, es decir cuando entre dos valores de la variable hay infinitos posibles valores de ésta, como por ejemplo la longitud(m) y la temperatura (°C).
Nota: Las v.a. se simbolizan, generalmente, con letras mayúsculas \(X\), \(Y\) y \(Z\). Se utiliza su correspondiente letra minúscula (en este caso \(x, y, z\)) para designar sus posibles valores. Por ejemplo, si \(X\) representa la v.a. “número de caras obtenido” que pueden resultar al lanzar una moneda tres veces consecutivas, entonces, sus valores son \(x = 0,1,2,3\).
Ejemplo
Experimento aleatorio:lanzar tres veces una moneda al aire.
\(X\): “número de caras obtenido” al final de los tres lanzamientos.
Así:
\[\Omega = \{(c,c,c), (c,c,s), (c,s,c), (c,s,s), (s,c,c), (s,c,s), (s,s,c), (s,s,s) \}\]
y \(X\) es una v.a. discreta con valores:
\(X((c,c,c)) = 3\) | \(X((c,c,s)) = 2\) | \(X((c,s,c)) = 2\) | \(X((c,s,s)) = 1\) |
---|
\(X((s,c,c)) = 2\) | \(X((s,c,s)) = 1\) | \(X((s,s,c)) = 2\) | \(X((s,s,s)) = 0\) |
---|
Variables aleatorias discretas
Función de probabilidad
Sea \(X\) una v.a.d. que toma los valores \(x_1, x_2, \ldots\) (finitos o infinitos enumerables). Una función \(f_X : \mathbb{R} \longrightarrow [0,1]\) es una función de masa de probabilidad (f.m.p.) de \(X\) si y solo si:
\[f_X(x)= \begin{cases} \textsf{P}(X = x), & \text{si $x=x_1,x_2,\ldots$} \\ 0, & \text{en otro caso}. \end{cases}\]
donde:
\((X=x)=\{w\in\Omega: X(w)=x\}\), de tal forma que si x no es uno de los valores que toma la v.a. \(X\), entonces \(f_X(x) = 0\).
Ejemplo
Continuando con el ejemplo anterior, se tiene que la f.m.p. de la variable es:
\[\begin{align*} f_X(0) &= \textsf{P}(X=0)=\textsf{Pr}((s,s,s))=\frac{1}{8}=0.125,\\ f_X(1) &= \textsf{P}(X=1)=\textsf{Pr}(\{(c,s,s), (s,c,s), (s,s,c)\}) =\frac{3}{8}=0.375, \\ f_X(2) &= \textsf{P}(X=2)=\textsf{Pr}(\{(s,c,c), (c,c,s), (c,s,c)\}) =\frac{3}{8}=0.375, \\ f_X(3) &= \textsf{P}(X=3)=\textsf{Pr}((c,c,c))=\frac{1}{8}=0.125. \\ \end{align*}\]
Concretamente, esta función está dada por:
\[f_X(x)= \begin{cases} 0.125, & \text{si $x=0,3$} \\ 0.375, & \text{si $x=1,2$} \\ 0, & \text{en otro caso}. \\ \end{cases}\]
Además, se observa que:
\[\sum_{k=1}^4 f_X(x_k) = f_X(0) + f_X(1) + f_X(2) + f_X(3) = 0.125+0.375+0.375+0.125 = 1\]
con: \(x_1=0\), \(x_2=1\), \(x_3=2\), y, \(x_4=3\)
La siguiente figura presenta el gráfico de la f.m.p de la variable \(X\).
# valores de la variable
<- 0:3
x # f.m.p.
<- c(1, 3, 3, 1)/8
fx # gráfico
plot(x = x, y = fx, xlab = "x", ylab = "f(x)", pch = 15, col = "blue")
segments(x0 = x, y0 = 0, x1 = x, y1 = fx, lwd = 2, col = "blue")
Propiedades
Sea \(f_X\) una f.m.p. de una v.a.d. \(X\) que asume los valores \(x1,x2,…\) definida sobre un espacio muestral \(\Omega\) no vacío. Entonces se satisface que:
\(f(x_k)\geqslant0\), para todo valor \(x_k\) de \(X\)
\(\sum_{k} f(x_k) = 1\)
Ejemplo
Dada \(X\): suma del lanzamiento de dos dados. Se sabe que su f.m.p está dada por:
\[f_X(x)=\frac{6-|7-x|}{36}\text{, }x=2,3,...,12\]
Calcular:
- \(P(X=3)=\frac{6-|7-3|}{36}=\frac{2}{36}\)
<-function(x) (6-abs(7-x))/36
ff(3)
## [1] 0.05555556
- \(P(X\leq 4.5)=P(X\leq 4)=P(X=2\text{ o }X=3\text{ o }X=4)=f_X(2)+f_X(3)+f_X(4)=\frac{1}{36}+\frac{2}{36}+\frac{3}{36}=\frac{1}{6}\)
f(2)+f(3)+f(4)
## [1] 0.1666667
- \(P(3\leq X\leq 6)=f_X(3)+f_X(4)+f_X(5)+f_X(6)\)
f(3)+f(4)+f(5)+f(6)
## [1] 0.3888889
- \(P(3\leq X< 6)=f_X(3)+f_X(4)+f_X(5)\)
f(3)+f(4)+f(5)
## [1] 0.25
La distribución de probabilidad completa estaría dada por
#valores de la variable
<- 2:12
x #calculo de la función de probabilidad para cada valor de la variable
<- f(x)
fx cbind(x, fx)
## x fx
## [1,] 2 0.02777778
## [2,] 3 0.05555556
## [3,] 4 0.08333333
## [4,] 5 0.11111111
## [5,] 6 0.13888889
## [6,] 7 0.16666667
## [7,] 8 0.13888889
## [8,] 9 0.11111111
## [9,] 10 0.08333333
## [10,] 11 0.05555556
## [11,] 12 0.02777778
#Función de probabilidad
plot(x = x, y = fx, xlab = "x", ylab = "f(x)", pch = 15, col = "blue")
segments(x0 = x, y0 = 0, x1 = x, y1 = fx, lwd = 2, col = "blue")
Función de distribución
Sea \(X\) una v.a.d. que sume los valores \(x1,x2,…\) (finitos o infinitos enumerables). La función de distribución es aquella que calcula la probabilidad acumulada hasta un punto \(x\), es decir, es la función \(F_X: \mathbb{R} \longrightarrow [0,1]\), definida por:
\[F_X(x) = \textsf{P}(X \leq x)= \sum_{t \leq x} f_X(t)\]
para cualquier número real \(x\), cuando \(X\) tiene f.m.p. \(f_X\).
Ejemplo
Volviendo al primer ejemplo, se tiene que:
\[\begin{align*} F_X(0) &= \textsf{P}(X \leq 0)= f_X(0) = \frac{1}{8}=0.125, \\ F_X(1) &= \textsf{P}(X \leq 1)= f_X(0) + f_X(1) =\frac{1}{8} + \frac{3}{8} =\frac{4}{8}= \frac{1}{2}=0.5, \\ F_X(2) &= \textsf{P}(X \leq 2)= f_X(0) + f_X(1) + f_X(2) =\frac{1}{8} + \frac{3}{8} + \frac{3}{8} = \frac{7}{8}=0.875,\text{y} \\ F_X(3) &= \textsf{P}(X \leq 3)= f_X(0) + f_X(1) + f_X(2) + f_X(3) =\frac{1}{8} + \frac{3}{8} + \frac{3}{8} + \frac{1}{8}= \frac{8}{8} = 1.\\ \end{align*}\]
Resumiendo:
\[F_X(x)= \begin{cases} 0, & \text{si $x < 0$}; \\ \frac{1}{8}, & \text{si $ 0 \leq x < 1$}; \\ \frac{4}{8}, & \text{si $ 1 \leq x < 2$}; \\ \frac{7}{8}, & \text{si $ 2 \leq x < 3$}; \\ 1, & \text{si $3 \leq x$}. \\ \end{cases}\]
Por ejemplo, si \(x = 2.7\) entonces:
\[F_X(2.7) = \sum_{t \leq 2.7} f_X(t) = f_X(0) + f_X(1) + f_X(2) = 0.875.\]
El gráfico de \(F_X\) está dado por:
# valores de la variable
<- 0:3
x # f.m.p.
<- c(1, 3, 3, 1)/8
fx # f.d.a.
<- cumsum(fx)
Fx plot(x = c(0, x), y = c(0, Fx), type = "s", xlab = "x", ylab = "F(x)", col = "blue", lwd = 2)
points(x, Fx, col = "blue", pch = 15)
Propiedades
Sea \(F_X\) una f.d.a. de una v.a.d. \(X\) definida sobre un espacio muestral \(\Omega\) no vacío. Entonces se satisface que:
Si \(x\) es un número real, entonces:
\(0 \leq F_X(x) \leq 1\)
Si \(x\) es un número real, entonces:
\(\textsf{P}(X>x)=1-F_X(x) \,\,\, \text{y} \,\,\, \textsf{P}(X\geq x)=1-F_X(x^-).\)
donde: \(x^{-}\) representa el máximo valor que puede asumir \(X\) estrictamente menor que \(x\)
Si \(x\) es un valor que puede asumir \(X\), entonces:
\(f_X(x) = F_X(x) - F_X(x^{-}).\)
Si \(a\) y \(b\) son números reales tales que \(a \leq b\) entonces \(F_X(a) \leq F_X(b)\) es decir, \(F_X\) es una función creciente; y además se tiene que:
\(\textsf{P}(a \leq X \leq b) = F_X(b) - F_X(a^{-}) \quad \text{y} \quad \textsf{P}(a < X < b) = F_X(b^-) - F_X(a).\)
Ejemplo
La junta directiva de un hospital quiere mejorar su atención en el horario nocturno de los pacientes que necesitan de atención quirúrgica inmediata. Para esto, se quiere analizar la variable \(X\) dada por “número de pacientes que requieren de atención quirúrgica inmediata reportados entre las 19:00 y las 5:00”. El analista encargado asegura que la f.m.p. de \(X\) es:
\[f_X(x)=\left\{ \begin{array}{ll} \frac{ 7^x e^{-7}}{x!}, & \hbox{si $x=0,1,2,\ldots$} \\ 0, & \hbox{en otro caso.} \end{array} \right.\]
Se pide:
- Sabiendo que entre las 19:00 y las 5:00 el hospital solo tiene la capacidad de operar en 5 quirófanos, determinar el porcentaje de jornadas nocturnas en las que se puede atender a todos los pacientes que lleguen en la noche.
Para encontrar el porcentaje de noches en las que el hospital puede atender a todos sus pacientes entre las 19:00 y las 5:00, basta con calcular:
\[\textsf{Pr}(X\leq 5)=\sum_{x=0}^5 \frac{ 7^x e^{-7}}{x!}=0.3007,\]
y por lo tanto solo en el 30% de las noches el hospital puede atender a todos los pacientes que llegan en la jornada nocturna.
- ¿Cuántos pacientes, como máximo, requieren de atención quirúrgica inmediata, en el 50% de las noches el hospital?
En este caso requerimos calcular el percentil 50, \(p_{50}\) Evaluando en los valores de \(0,1,2,\ldots\) se tiene que:
\[\begin{align*} \\& \textsf{P}(X\leq 0)=0.0009, \\& \textsf{P}(X\leq 1)=0.0072, \\& \textsf{P}(X\leq 2)=0.0296, \\& \textsf{Pr}(X\leq 3)=0.0817, \\&\hspace{2.2cm}\vdots \\& \textsf{Pr}(X\leq 6)=0.4497, \\& \textsf{Pr}(X\leq 7)=0.5987. \end{align*}\]
En consecuencia, se obtiene que \(p_{50}=7\)
# valores de la variable
<- 0:20
x # f.m.p.
<- (7^x)*exp(-7)/factorial(x)
fx <- cumsum(fx)
Fx print(cbind(x,Fx))
## x Fx
## [1,] 0 0.000911882
## [2,] 1 0.007295056
## [3,] 2 0.029636164
## [4,] 3 0.081765416
## [5,] 4 0.172991608
## [6,] 5 0.300708276
## [7,] 6 0.449711056
## [8,] 7 0.598713836
## [9,] 8 0.729091268
## [10,] 9 0.830495937
## [11,] 10 0.901479206
## [12,] 11 0.946650377
## [13,] 12 0.973000227
## [14,] 13 0.987188607
## [15,] 14 0.994282798
## [16,] 15 0.997593420
## [17,] 16 0.999041817
## [18,] 17 0.999638216
## [19,] 18 0.999870149
## [20,] 19 0.999955598
## [21,] 20 0.999985505
- Graficar la f.m.p y la función de distribución de \(X\).
# valores de la variable
<- 0:20
x # f.m.p.
<- (7^x)*exp(-7)/factorial(x)
fx <- cumsum(fx)
Fx # gráficos
par(mfrow = c(1,2))
# f.m.p
plot(x = x, y = fx, xlab = "x", ylab = "f(x)", pch = 15, col = "blue")
segments(x0 = x, y0 = 0, x1 = x, y1 = fx, lwd = 2, col = "blue")
# f.d.a.
plot(x = c(0, x), y = c(0, Fx), type = "s", xlab = "x", ylab = "F(x)", col = "blue", lwd = 2)
points(x, Fx, col = "blue", pch = 15)
Variables aleatorias continuas
Cuando la variable objeto de estudio es continua, no tiene sentido hacer una suma de las probabilidades de cada uno de los valores de la variable como con las variables discretas, ya que el conjunto de valores que toma una variable continua es no numerable. En este caso, se generalizan de modo natural los conceptos, empleando la integral \(\int\) en lugar de la suma \(\sum\).
Una función \(f_X : \mathbb{R} \longrightarrow [0,\infty)\) se dice que es una función de densidad de probabilidad (f.d.p.) de una v.a.c. \(X\) si satisface las siguientes condiciones:
\(f_X(x)\geq 0\) para todo \(x \in \mathbb{R}\)
Para cualquier par de números reales \(a\) y \(b\) tales que \(a\leq b\), se tiene que:
\[\textsf{P}(a \leq X \leq b) = \int_{a}^{b} f_X(x) dx\].
- El área bajo toda la gráfica de \(f_X\) es 1, esto es:
\[\int_{-\infty}^{+\infty} f(x)\, dx = 1\].
Ejemplo
Suponga que \(X\): tiempo de ejecución de un proceso en minutos, tiene la siguiente función de densidad:
\[f_X(x)=\frac{1}{15}e^{-\frac{1}{15}x}I_{(0,\infty)(x)}\]
Calcular la probabilidad de que el tiempo de ejecución sea menos de 10 minutos.
Nos piden calcular \(P(X<10)\), es decir, el área bajo la curva de la función de densidad entre 0 y 10:
#función de densidad
<-function(x) 1/15*exp(-1/15*x)
fxcurve(expr = fx, from = 0, to = 20, xlab = "x", ylab = "f(x)", col = "blue", lwd = 2)
abline(v=0, col="light blue")
abline(v=10, col="light blue")
INSTALAR EL PAQUETE “PRACMA” EN LA CONSOLA DE R
#área bajo la curva
library(pracma)
integral(fx,0,10)
## [1] 0.4865829
Función de distribución
La función de distribución de una v.a.c. \(X\) con función de densidad es \(f_X\), es la función: \(F_X : \mathbb{R} \longrightarrow [0,1]\) definida por:
\[F_X(x) = \textsf{P}(X \leq x)=\int_{-\infty}^{x} f(x)\, dx\]
para todo número real \(x\)
Propiedades
Si \(F_X\) es una función de distribución de una v.a.c. \(X\), entonces se satisfacen las siguientes propiedades:
- Si \(x\) es un número real, entonces \(0 \leq F_X(x) \leq 1\), y además:
\[\lim_{x\rightarrow -\infty} F_X(x)=0 \quad\text{y}\quad \lim_{x\rightarrow \infty} F_X(x)=1\]
- Si \(x\) es un número real, entonces:
\[\textsf{P}(X = x) = 0 \quad\text{y}\quad \textsf{P}(X \geq x) = \textsf{P}(X > x) = 1 - F_X(x)\]
- Si \(a\) y \(b\) son dos números reales tales que \(a \leq b\), entonces \(F_X(a) \leq F_X(b)\), es decir \(F\) es creciente; y además se tiene que:
\[\textsf{P}(a \leq X \leq b) = \textsf{P}(a \leq X < b) = \textsf{P}(a < X \leq b) = \textsf{P}(a < X < b)=F_X(b)-F_X(a)\]
- Si \(f_X\) es la f.d.p. de \(X\), entonces:
\[f_X(x) = \frac{d}{dx}F_X(x)=F'_X(x)\]
donde \(F'_X(x)\) es la derivada de \(F_X(x)\) respecto a \(x\).
Ejemplo
Continuando con el ejemplo del tiempo de ejecución de una tarea, grafique la función de distribución.
# f.d.p.
<-function(x) 1/15*exp(-1/15*x)
fx# función de distribución
<- function(x) 1 - exp(-1/15*x)
Fx # gráfica
curve(expr = Fx, from = 0, to = 10, xlab = "x", ylab = "F(x)", col = "blue", lwd = 2)
Medidas de localización
Sea \(X\) una v.a.c. con f.d.a. \(F_X\) Y \(p\) un número real tal que \(0\leq p\leq 100\), El percentil \(p\) de la distribución de \(X\), denotado con \(\pi_p\), es un valor de \(X\) tal que:
\[\frac{p}{100}=F_X(\pi_p)\]
El percentil \(p\) de una variable continua \(X\) con \(0\leq p\leq 100\), corresponde al valor del eje de medición de \(X\) tal que el \(p\)% del área bajo la gráfica de la f.d.p. de \(X\) está a la izquierda de \(\pi_p\) y el \((100 - p)\%\) está a la derecha.
Como antes, el percentil 50 se denomina mediana y se simboliza con \(\tilde{\mu}_X\)
Valor esperado
Sobre la distribución de una v.a. se acostumbra registrar algunas características de interés, denominadas parámetros, como la la localización y la dispersión, por ejemplo.
Sea \(X\) una v.a. con f.m.p. \(f_X\) para el caso discreto o con f.d.p. \(f_X\) para el caso continuo. El valor esperado de \(X\) se define como:
\[\begin{equation*} \mathbb{E}[X]=\mu_X= \left\{ \begin{array}{ll} \sum_{k} x_k f_X(x_k), & \hbox{si $X$ es una v.a.d.} \\ \int_{-\infty}^{\infty} x f_X(x)dx, & \hbox{si $X$ es una v.a.c.} \end{array} \right. \end{equation*}\]
En general, si \(g:\mathbb{R} \longrightarrow \mathbb{R}\) es una función entonces se tiene que el valor esperado de \(g(X)\) se define como:
\[\begin{equation*} \mathbb{E}[g(X)]= \left\{ \begin{array}{ll} \sum_{k} g(x_k) f_X(x_k), & \hbox{si $X$ es una v.a.d.} \\ \int_{-\infty}^{\infty} g(x) f_X(x)dx, & \hbox{si $X$ es una v.a.c.} \end{array} \right. \end{equation*}\]
Propiedades
Sea \(X\) una v.a. y \(a\), \(b\) números reales. Entonces se tiene que:
\(\mathbb E[a] = a\).
\(\mathbb E[a\,X + b] = a\,\mathbb E[X] + b\).
Si \(a_1,a_2\ldots,a_n\) son n números reales y \(X_1,X_2,\ldots,X_n\) son \(n\) v.a.’s conmensurables entonces:
\[\mathbb E\left[ \sum_{i=1}^n a_i X_i\right] = \sum_{i=1}^n a_i \mathbb E[X_i]\]
Ejemplo 1
Retomemos el ejemplo en el que \(X\) es el “número de caras obtenido” al final de los tres lanzamientos. Para éste encontramos que:
\[f_X(x)= \begin{cases} 0.125, & \text{si $x=0,3$}; \\ 0.375, & \text{si $x=1,2$}; \\ 0, & \text{en otro caso}. \\ \end{cases}\]
De tal forma que:
\[\mathbb{E}[X]=\sum_{k} x_k f_X(x_k)=0\times 0.125+1\times 0.375+2\times 0.375+3\times 0.125=1.5\]
<- 0:3
x # f.m.p.
<- c(1, 3, 3, 1)/8
fx #valor esperado
<-sum(x*fx)
Exprint(Ex)
## [1] 1.5
Ejemplo 2
La v.a. que representa la “proporción de accidentes automovilísticos fatales” en una ciudad, tiene la siguiente f.d.p.:
\[f_X(x) = \left\{ \begin{array}{ll} 42x(1-x)^5, & \hbox{si $0 < x \leq 1$;} \\ 0, & \hbox{en otro caso.} \end{array} \right.\]
Calcular e interpretar el valor esperado de \(X\).
Como \(X\) es una v.a.c., entonces se sigue que:
\[\begin{align*} \mathbb{E}[X] &= \int_{-\infty}^{\infty}xf_X(x)dx \\ &=\int_{0}^{1}xf_X(x)dx \\ &=\int_{0}^{1}x \left(42x(1-x)^5\right)dx \\ &=42\int_{0}^{1}x^2(1-x)^5dx \\ &=42\int_{0}^{1}x^2(-x^5+5x^4-10x^3+10x^2-5x+1)dx \\ &=42\int_{0}^{1}(-x^7+5x^6-10x^5+10x^4-5x^3+x^2)dx \\ &=42\left( -\frac{1}{8}x^8+\frac{5}{7}x^7-\frac{10}{6}x^6+\frac{10}{5}x^5-\frac{5}{4}x^4+\frac{1}{3}x^3 \Big|_0^1 \right) \\ &=42\left(-\frac{1}{8}+\frac{5}{7}-\frac{10}{6}+\frac{10}{5}-\frac{5}{4}+\frac{1}{3}\right) \\&= \frac{1}{4}. \end{align*}\]
Por lo tanto, la proporción media de accidentes automovilísticos fatales es esta ciudad es 25%.
Para reflexionar
¿En dónde se ubicarían los promedios de las siguientes distribuciones?
par(mfrow=c(1,2))
curve(dchisq(x, df = 4),col = 3, lwd = 2, from=0, to=9, ylab="f(x)", ylim=c(0,0.2))
curve(dnorm(x, mean=4, sd=2), col=2, lwd = 2, from=-1, to=9,ylab="f(x)")
Varianza
Sea \(X\) una v.a. con f.m.p. \(f_X\) para el caso discreto o con f.d.p. \(f_X\) para el caso continuo. Se define la varianza de \(X\) como el segundo momento centrado alrededor de la medida de \(X\), esto es:
\[\begin{equation*} \mathbb V[X] =\sigma^2_X= \left\{ \begin{array}{ll} \sum_{k}(x_k-\mu_X)^2f_X(x_k), & \hbox{si $X$ es una v.a.d.;} \\ \int_{-\infty}^{\infty}(x-\mu_X)^2f_X(x)dx, & \hbox{si $X$ es una v.a.c.} \end{array} \right. \end{equation*}\]
donde \(\mu_X\) es el valor esperado de \(X\).
Si \(X\) es una v.a., entonces se satisface que:
\[\mathbb V[X]= \mathbb E[X^2]-\left(\mathbb E[X]\right)^2\]
Propiedades
Sea \(X\) una v.a. y \(a\), \(b\) números reales. Entonces se tiene que:
\(\mathbb V[X]\geq 0\)
\(\mathbb V[a]=0\)
\(\mathbb V[X+a]=\mathbb V[X]\)
\(\mathbb V[bX]=b^2\mathbb V[X]\), con \(k\) constante
Si \(X_1, X_2,...,X_m\) son variables aleatorias independientes, \(\mathbb V[\sum_{i=1}^{m}X_j]=\sum_{i=1}^{m}\mathbb V[X_j]\)
Desviación estándar
Si \(X\) es una v.a. con media \(\mu_X\) y varianza \(\sigma^2_X\), entonces la desviación estándar o desviación típica de \(X\), denotada con \(\sigma_X\) se define como:
\[\sigma_X=\sqrt{\sigma_X^2}.\]
Coeficiente de variación
el coeficiente de variación de Pearson, denotado con \(CV_X\), está dado por:
\[CV_X = \left| \frac{\sigma_X}{\mu_X} \right|.\]
Ejemplo
Continuando con el ejemplo en el que \(X\) es el “número de caras obtenido” al final de los tres lanzamientos y su f.d.m está dada por:
\[f_X(x)= \begin{cases} 0.125, & \text{si $x=0,3$}; \\ 0.375, & \text{si $x=1,2$}; \\ 0, & \text{en otro caso}. \\ \end{cases}\]
El valor de la varianza está dado por:
\[\mathbb V[X]= \mathbb E[X^2]-\left(\mathbb E[X]\right)^2\]
<- 0:3
x # f.m.p.
<- c(1, 3, 3, 1)/8
fx #valor esperado
<-sum(x*fx)
Ex#valor esperado x^2
<-sum(x^2*fx)
Ex2#varianza
<-Ex2-(Ex)^2
Vxprint(Vx)
## [1] 0.75
#desviación estándar
print(sqrt(Vx))
## [1] 0.8660254
#coeficiente de variación
print(sqrt(Vx)/Ex*100)
## [1] 57.73503
Otras formas en R
Ejemplo lanzamiento de tres monedas
instalar la libreria “MASS”
“install.packages(”MASS)”
library(MASS) # Para utilizar la función fractions()
<- expand.grid(moneda_1 = 0:1, moneda_2 = 0:1, moneda_3 = 0:1)
Omega <- apply(Omega, 1, sum)
n.heads cbind(Omega, n.heads)
## moneda_1 moneda_2 moneda_3 n.heads
## 1 0 0 0 0
## 2 1 0 0 1
## 3 0 1 0 1
## 4 1 1 0 2
## 5 0 0 1 1
## 6 1 0 1 2
## 7 0 1 1 2
## 8 1 1 1 3
<- table(n.heads)/length(n.heads)
T1 fractions(T1)
## n.heads
## 0 1 2 3
## 1/8 3/8 3/8 1/8
plot(T1, xlab = "x", ylab="P(X = x)", yaxt = "n", main = "PDF for X")
axis(2, at = c(1/8, 3/8), labels = c("1/8", "3/8"), las = 1)
plot(ecdf(n.heads), main = "CDF for X", ylab = "F(x)", xlab = "x", yaxt = "n")
axis(2, at = c(1/8, 4/8, 7/8, 1), labels = c("1/8", "4/8", "7/8", "1"), las = 1)
¿Es justo el juego?
Participas en un juego donde se hace girar una rueda que puede aterrizar en los números 1, 5, o 30, con probabilidades de 0.50, 0.45, y 0.05 respectivamente.
Debes pagar $5 para jugar y se te otorga la cantidad de dinero indicada por el número donde cae la flecha giratoria.
El juego es justo cuando el retorno esperado es igual al costo de participar en el juego.
<- c(1, 5, 30) # pagos X
x <- c(0.5, 0.45, 0.05) # probabilidades p(x)
px <- sum(x * px)
EX <- weighted.mean(x, px)
WM c(EX, WM)
## [1] 4.25 4.25
A partir del ejemplo anterior, considere que la variable aleatoria Y es definida como el rendimiento neto del jugador, es decir, Y = X-5, ya que el jugador paga $5 para jugar el juego.¿Cuál es el valor esperado de Y?
<- c(1, 5, 30) # pagos X
x <- c(0.5, 0.45, 0.05) # probabilidades p(x)
px <- sum((x - 5) * px)
EX <- weighted.mean((x-5), px)
WM c(EX, WM)
## [1] -0.75 -0.75
Venta de laptop
Una tienda vende un modelo de computadora portátil. Hay sólo cuatro computadoras en existencia y la gerente se pregunta cuál será la demanda de hoy para este modelo en particular. Ella se entera en el departamento de marketing que la distribución de probabilidad para X, la demanda diaria para la laptop, es la siguiente:
X | 0 | 1 | 2 | 3 | 4 | 5 |
P(x) | 0.10 | 0.40 | 0.20 | 0.15 | 0.10 | 0.05 |
Encuentre la media, varianza y la desviación estándar de X
¿Es probable que 5 o más clientes deseen comprar una laptop hoy?
<- c(0:5) # Laptops vendidas
x <- c(0.10, 0.40, 0.20, 0.15, 0.10, 0.05) # probabilidades p(x)
px <- sum(x * px)
EX <- EX
m_x <- sum((x - m_x)^2 * px)
E_varX <- weighted.mean((x - m_x)^2, px)
WM_varX c(E_varX, WM_varX)
## [1] 1.79 1.79
barplot(px, ylab = 'p(x)', names.arg = x)
Ejemplo para resolver
En una lotería realizada a beneficio de una institución local de caridad, se han de vender 8000 boletos a 100 cada uno. El premio es un automóvil de $240.000. Si usted compra dos boletos, ¿cuál es su ganancia esperada?
Variable continua
Suponga que X es una v.a. continua con pdf \(f(x)\), donde:
\[f_X(x) = \left\{ \begin{array}{ll} 3/4(1-x^2), & \hbox{si $-1 < x \leq 1$;} \\ 0, & \hbox{en otro caso.} \end{array} \right.\]
Encontrar la cdf para X.
Estimar \(P(\leq -0.5 < x \leq 1\))
Graficar la pdf y la cdf
<- function(x) {
f_x <- 3/4 * (1 - x^2)
y < -1 | x > 1] <- 0
y[x return(y)
}
curve(f_x, -2, 2, xlab = "x", ylab = "f(x)", main = "PDF para X")
<- function(x) {
F_x <- -x^3/4 + 3 * x/4 + 1/2
y <= -1] <- 0
y[x > 1] <- 1
y[x return(y)
}
curve(F_x, -2, 2, xlab = "x", ylab = "F(x)", main = "CDF para X")
Integrales en R
<- function(x) { 3/4 - 3/4 * x^2 } # define la función fx
f_x integrate(f_x, lower = -0.5, upper = 1) # Estima valor y tolerancia
## 0.84375 with absolute error < 9.4e-15
<- integrate(f_x, lower = -0.5, upper = 1)$value # devuelve solo el valor
ans ans
## [1] 0.84375
library(MASS) # Para utilizar la función fractions()
fractions(ans) # Estima la fracción más cercana
## [1] 27/32