Introducción

Para el desarrollo de técnicas de inferencia estadística, es conveniente relacionar directamente los resultados de un experimento aleatorio con números reales, ya que con tal asociación el análisis de las características de interés es más productivo.

Dependiendo de si la variable resultante es discreta (solo pueden adoptar un número finito o una infinidad enumerable de valores) o continua (los valores están asociados con una escala continua de medición), es posible describir su comportamiento probabilístico a partir de la función de probabilidad o de la función de densidad, respectivamente.

Además, por medio de estas funciones es posible calcular todo tipo de medidas (e.g., tendencia central) a nivel “poblacional”. En este contexo, tales medidas se denominan parámetros.

Objetivos

  1. Apropiarse del concepto de variable aleatoria.

  2. Conocer, entender y usar apropiadamente los conceptos de función de probabilidad o función de distribución, según sea el caso.

  3. Apropiarse de los conceptos de valor esperado y varianza poblacional.

Conceptos preliminares

Las siguientes definiciones están siempre basadas en un espacio de probabilidad \((\Omega, \mathcal{A},P)\).

Variable aleatoria (v.a.)

Una v.a. \(X\) es una función cuyo dominio es \(\Omega\) y recorrido \(\mathcal{R}\), que asigna un único número real a cada resultado del espacio muestral \(\Omega\) de un experimento aleatorio. De tal forma que la inversa de \(X\) calculada en un subconjunto de los reales, siempre pertenece a \(\mathcal{A}\).

\[X :\Omega \longrightarrow \mathbb{R}:\omega\longmapsto X(\omega)\]

Las v.a.s pueden ser de dos tipos dependiendo su recorrido:

  1. Discretas: Cuando su recorrido es numerable. Un buen ejemplo de variables discretas son los conteos, como el número de casos incidentes de SarsCov2 en un mes determinado.

  2. Continuas: Cuando su recorrido es no numerable, es decir cuando entre dos valores de la variable hay infinitos posibles valores de ésta, como por ejemplo la longitud(m) y la temperatura (°C).

Nota: Las v.a. se simbolizan, generalmente, con letras mayúsculas \(X\), \(Y\) y \(Z\). Se utiliza su correspondiente letra minúscula (en este caso \(x, y, z\)) para designar sus posibles valores. Por ejemplo, si \(X\) representa la v.a. “número de caras obtenido” que pueden resultar al lanzar una moneda tres veces consecutivas, entonces, sus valores son \(x = 0,1,2,3\).

Ejemplo

Experimento aleatorio:lanzar tres veces una moneda al aire.

\(X\): “número de caras obtenido” al final de los tres lanzamientos.

Así:

\[\Omega = \{(c,c,c), (c,c,s), (c,s,c), (c,s,s), (s,c,c), (s,c,s), (s,s,c), (s,s,s) \}\]

y \(X\) es una v.a. discreta con valores:

\(X((c,c,c)) = 3\) \(X((c,c,s)) = 2\) \(X((c,s,c)) = 2\) \(X((c,s,s)) = 1\)
\(X((s,c,c)) = 2\) \(X((s,c,s)) = 1\) \(X((s,s,c)) = 2\) \(X((s,s,s)) = 0\)

Variables aleatorias discretas

Función de probabilidad

Sea \(X\) una v.a.d. que toma los valores \(x_1, x_2, \ldots\) (finitos o infinitos enumerables). Una función \(f_X : \mathbb{R} \longrightarrow [0,1]\) es una función de masa de probabilidad (f.m.p.) de \(X\) si y solo si:

\[f_X(x)= \begin{cases} \textsf{P}(X = x), & \text{si $x=x_1,x_2,\ldots$} \\ 0, & \text{en otro caso}. \end{cases}\]

donde:

\((X=x)=\{w\in\Omega: X(w)=x\}\), de tal forma que si x no es uno de los valores que toma la v.a. \(X\), entonces \(f_X(x) = 0\).

Ejemplo

Continuando con el ejemplo anterior, se tiene que la f.m.p. de la variable es:

\[\begin{align*} f_X(0) &= \textsf{P}(X=0)=\textsf{Pr}((s,s,s))=\frac{1}{8}=0.125,\\ f_X(1) &= \textsf{P}(X=1)=\textsf{Pr}(\{(c,s,s), (s,c,s), (s,s,c)\}) =\frac{3}{8}=0.375, \\ f_X(2) &= \textsf{P}(X=2)=\textsf{Pr}(\{(s,c,c), (c,c,s), (c,s,c)\}) =\frac{3}{8}=0.375, \\ f_X(3) &= \textsf{P}(X=3)=\textsf{Pr}((c,c,c))=\frac{1}{8}=0.125. \\ \end{align*}\]

Concretamente, esta función está dada por:

\[f_X(x)= \begin{cases} 0.125, & \text{si $x=0,3$} \\ 0.375, & \text{si $x=1,2$} \\ 0, & \text{en otro caso}. \\ \end{cases}\]

Además, se observa que:

\[\sum_{k=1}^4 f_X(x_k) = f_X(0) + f_X(1) + f_X(2) + f_X(3) = 0.125+0.375+0.375+0.125 = 1\]

con: \(x_1=0\), \(x_2=1\), \(x_3=2\), y, \(x_4=3\)

La siguiente figura presenta el gráfico de la f.m.p de la variable \(X\).

# valores de la variable
x <- 0:3
# f.m.p.
fx <- c(1, 3, 3, 1)/8
# gráfico
plot(x = x, y = fx, xlab = "x", ylab = "f(x)", pch = 15, col = "blue")
segments(x0 = x, y0 = 0, x1 = x, y1 = fx, lwd = 2, col = "blue")

Propiedades

Sea \(f_X\) una f.m.p. de una v.a.d. \(X\) que asume los valores \(x1,x2,…\) definida sobre un espacio muestral \(\Omega\) no vacío. Entonces se satisface que:

\(f(x_k)\geqslant0\), para todo valor \(x_k\) de \(X\)

\(\sum_{k} f(x_k) = 1\)

Ejemplo

Dada \(X\): suma del lanzamiento de dos dados. Se sabe que su f.m.p está dada por:

\[f_X(x)=\frac{6-|7-x|}{36}\text{, }x=2,3,...,12\]

Calcular:

  1. \(P(X=3)=\frac{6-|7-3|}{36}=\frac{2}{36}\)
f<-function(x) (6-abs(7-x))/36 
f(3)
## [1] 0.05555556
  1. \(P(X\leq 4.5)=P(X\leq 4)=P(X=2\text{ o }X=3\text{ o }X=4)=f_X(2)+f_X(3)+f_X(4)=\frac{1}{36}+\frac{2}{36}+\frac{3}{36}=\frac{1}{6}\)
f(2)+f(3)+f(4)
## [1] 0.1666667
  1. \(P(3\leq X\leq 6)=f_X(3)+f_X(4)+f_X(5)+f_X(6)\)
f(3)+f(4)+f(5)+f(6)
## [1] 0.3888889
  1. \(P(3\leq X< 6)=f_X(3)+f_X(4)+f_X(5)\)
f(3)+f(4)+f(5)
## [1] 0.25

La distribución de probabilidad completa estaría dada por

#valores de la variable
x <- 2:12
#calculo de la función de probabilidad para cada valor de la variable
fx <- f(x)
cbind(x, fx)
##        x         fx
##  [1,]  2 0.02777778
##  [2,]  3 0.05555556
##  [3,]  4 0.08333333
##  [4,]  5 0.11111111
##  [5,]  6 0.13888889
##  [6,]  7 0.16666667
##  [7,]  8 0.13888889
##  [8,]  9 0.11111111
##  [9,] 10 0.08333333
## [10,] 11 0.05555556
## [11,] 12 0.02777778
#Función de probabilidad
plot(x = x, y = fx, xlab = "x", ylab = "f(x)", pch = 15, col = "blue")
segments(x0 = x, y0 = 0, x1 = x, y1 = fx, lwd = 2, col = "blue")

Función de distribución

Sea \(X\) una v.a.d. que sume los valores \(x1,x2,…\) (finitos o infinitos enumerables). La función de distribución es aquella que calcula la probabilidad acumulada hasta un punto \(x\), es decir, es la función \(F_X: \mathbb{R} \longrightarrow [0,1]\), definida por:

\[F_X(x) = \textsf{P}(X \leq x)= \sum_{t \leq x} f_X(t)\]

para cualquier número real \(x\), cuando \(X\) tiene f.m.p. \(f_X\).

Ejemplo

Volviendo al primer ejemplo, se tiene que:

\[\begin{align*} F_X(0) &= \textsf{P}(X \leq 0)= f_X(0) = \frac{1}{8}=0.125, \\ F_X(1) &= \textsf{P}(X \leq 1)= f_X(0) + f_X(1) =\frac{1}{8} + \frac{3}{8} =\frac{4}{8}= \frac{1}{2}=0.5, \\ F_X(2) &= \textsf{P}(X \leq 2)= f_X(0) + f_X(1) + f_X(2) =\frac{1}{8} + \frac{3}{8} + \frac{3}{8} = \frac{7}{8}=0.875,\text{y} \\ F_X(3) &= \textsf{P}(X \leq 3)= f_X(0) + f_X(1) + f_X(2) + f_X(3) =\frac{1}{8} + \frac{3}{8} + \frac{3}{8} + \frac{1}{8}= \frac{8}{8} = 1.\\ \end{align*}\]

Resumiendo:

\[F_X(x)= \begin{cases} 0, & \text{si $x < 0$}; \\ \frac{1}{8}, & \text{si $ 0 \leq x < 1$}; \\ \frac{4}{8}, & \text{si $ 1 \leq x < 2$}; \\ \frac{7}{8}, & \text{si $ 2 \leq x < 3$}; \\ 1, & \text{si $3 \leq x$}. \\ \end{cases}\]

Por ejemplo, si \(x = 2.7\) entonces:

\[F_X(2.7) = \sum_{t \leq 2.7} f_X(t) = f_X(0) + f_X(1) + f_X(2) = 0.875.\]

El gráfico de \(F_X\) está dado por:

# valores de la variable
x <- 0:3
# f.m.p.
fx <- c(1, 3, 3, 1)/8
# f.d.a.
Fx <- cumsum(fx)
plot(x = c(0, x), y = c(0, Fx), type = "s", xlab = "x", ylab = "F(x)", col = "blue", lwd = 2)
points(x, Fx, col = "blue", pch = 15)

Propiedades

Sea \(F_X\) una f.d.a. de una v.a.d. \(X\) definida sobre un espacio muestral \(\Omega\) no vacío. Entonces se satisface que:

Si \(x\) es un número real, entonces:

\(0 \leq F_X(x) \leq 1\)

Si \(x\) es un número real, entonces:

\(\textsf{P}(X>x)=1-F_X(x) \,\,\, \text{y} \,\,\, \textsf{P}(X\geq x)=1-F_X(x^-).\)

donde: \(x^{-}\) representa el máximo valor que puede asumir \(X\) estrictamente menor que \(x\)

Si \(x\) es un valor que puede asumir \(X\), entonces:

\(f_X(x) = F_X(x) - F_X(x^{-}).\)

Si \(a\) y \(b\) son números reales tales que \(a \leq b\) entonces \(F_X(a) \leq F_X(b)\) es decir, \(F_X\) es una función creciente; y además se tiene que:

\(\textsf{P}(a \leq X \leq b) = F_X(b) - F_X(a^{-}) \quad \text{y} \quad \textsf{P}(a < X < b) = F_X(b^-) - F_X(a).\)

Ejemplo

La junta directiva de un hospital quiere mejorar su atención en el horario nocturno de los pacientes que necesitan de atención quirúrgica inmediata. Para esto, se quiere analizar la variable \(X\) dada por “número de pacientes que requieren de atención quirúrgica inmediata reportados entre las 19:00 y las 5:00”. El analista encargado asegura que la f.m.p. de \(X\) es:

\[f_X(x)=\left\{ \begin{array}{ll} \frac{ 7^x e^{-7}}{x!}, & \hbox{si $x=0,1,2,\ldots$} \\ 0, & \hbox{en otro caso.} \end{array} \right.\]

Se pide:

  1. Sabiendo que entre las 19:00 y las 5:00 el hospital solo tiene la capacidad de operar en 5 quirófanos, determinar el porcentaje de jornadas nocturnas en las que se puede atender a todos los pacientes que lleguen en la noche.

Para encontrar el porcentaje de noches en las que el hospital puede atender a todos sus pacientes entre las 19:00 y las 5:00, basta con calcular:

\[\textsf{Pr}(X\leq 5)=\sum_{x=0}^5 \frac{ 7^x e^{-7}}{x!}=0.3007,\]

y por lo tanto solo en el 30% de las noches el hospital puede atender a todos los pacientes que llegan en la jornada nocturna.

  1. ¿Cuántos pacientes, como máximo, requieren de atención quirúrgica inmediata, en el 50% de las noches el hospital?

En este caso requerimos calcular el percentil 50, \(p_{50}\) Evaluando en los valores de \(0,1,2,\ldots\) se tiene que:

\[\begin{align*} \\& \textsf{P}(X\leq 0)=0.0009, \\& \textsf{P}(X\leq 1)=0.0072, \\& \textsf{P}(X\leq 2)=0.0296, \\& \textsf{Pr}(X\leq 3)=0.0817, \\&\hspace{2.2cm}\vdots \\& \textsf{Pr}(X\leq 6)=0.4497, \\& \textsf{Pr}(X\leq 7)=0.5987. \end{align*}\]

En consecuencia, se obtiene que \(p_{50}=7\)

# valores de la variable
x <- 0:20
# f.m.p.
fx <- (7^x)*exp(-7)/factorial(x)
Fx <- cumsum(fx)
print(cbind(x,Fx))
##        x          Fx
##  [1,]  0 0.000911882
##  [2,]  1 0.007295056
##  [3,]  2 0.029636164
##  [4,]  3 0.081765416
##  [5,]  4 0.172991608
##  [6,]  5 0.300708276
##  [7,]  6 0.449711056
##  [8,]  7 0.598713836
##  [9,]  8 0.729091268
## [10,]  9 0.830495937
## [11,] 10 0.901479206
## [12,] 11 0.946650377
## [13,] 12 0.973000227
## [14,] 13 0.987188607
## [15,] 14 0.994282798
## [16,] 15 0.997593420
## [17,] 16 0.999041817
## [18,] 17 0.999638216
## [19,] 18 0.999870149
## [20,] 19 0.999955598
## [21,] 20 0.999985505
  1. Graficar la f.m.p y la función de distribución de \(X\).
# valores de la variable
x <- 0:20
# f.m.p.
fx <- (7^x)*exp(-7)/factorial(x)
Fx <- cumsum(fx)
# gráficos
par(mfrow = c(1,2))
# f.m.p
plot(x = x, y = fx, xlab = "x", ylab = "f(x)", pch = 15, col = "blue")
segments(x0 = x, y0 = 0, x1 = x, y1 = fx, lwd = 2, col = "blue")
# f.d.a.
plot(x = c(0, x), y = c(0, Fx), type = "s", xlab = "x", ylab = "F(x)", col = "blue", lwd = 2)
points(x, Fx, col = "blue", pch = 15)

Variables aleatorias continuas

Cuando la variable objeto de estudio es continua, no tiene sentido hacer una suma de las probabilidades de cada uno de los valores de la variable como con las variables discretas, ya que el conjunto de valores que toma una variable continua es no numerable. En este caso, se generalizan de modo natural los conceptos, empleando la integral \(\int\) en lugar de la suma \(\sum\).

Una función \(f_X : \mathbb{R} \longrightarrow [0,\infty)\) se dice que es una función de densidad de probabilidad (f.d.p.) de una v.a.c. \(X\) si satisface las siguientes condiciones:

  1. \(f_X(x)\geq 0\) para todo \(x \in \mathbb{R}\)

  2. Para cualquier par de números reales \(a\) y \(b\) tales que \(a\leq b\), se tiene que:

\[\textsf{P}(a \leq X \leq b) = \int_{a}^{b} f_X(x) dx\].

  1. El área bajo toda la gráfica de \(f_X\) es 1, esto es:

\[\int_{-\infty}^{+\infty} f(x)\, dx = 1\].

Ejemplo

Suponga que \(X\): tiempo de ejecución de un proceso en minutos, tiene la siguiente función de densidad:

\[f_X(x)=\frac{1}{15}e^{-\frac{1}{15}x}I_{(0,\infty)(x)}\]

Calcular la probabilidad de que el tiempo de ejecución sea menos de 10 minutos.

Nos piden calcular \(P(X<10)\), es decir, el área bajo la curva de la función de densidad entre 0 y 10:

#función de densidad
fx<-function(x) 1/15*exp(-1/15*x)
curve(expr = fx, from = 0, to = 20, xlab = "x", ylab = "f(x)", col = "blue", lwd = 2)
abline(v=0, col="light blue")
abline(v=10, col="light blue")

INSTALAR EL PAQUETE “PRACMA” EN LA CONSOLA DE R

#área bajo la curva
library(pracma)
integral(fx,0,10)
## [1] 0.4865829

Función de distribución

La función de distribución de una v.a.c. \(X\) con función de densidad es \(f_X\), es la función: \(F_X : \mathbb{R} \longrightarrow [0,1]\) definida por:

\[F_X(x) = \textsf{P}(X \leq x)=\int_{-\infty}^{x} f(x)\, dx\]

para todo número real \(x\)

Propiedades

Si \(F_X\) es una función de distribución de una v.a.c. \(X\), entonces se satisfacen las siguientes propiedades:

  1. Si \(x\) es un número real, entonces \(0 \leq F_X(x) \leq 1\), y además:

\[\lim_{x\rightarrow -\infty} F_X(x)=0 \quad\text{y}\quad \lim_{x\rightarrow \infty} F_X(x)=1\]

  1. Si \(x\) es un número real, entonces:

\[\textsf{P}(X = x) = 0 \quad\text{y}\quad \textsf{P}(X \geq x) = \textsf{P}(X > x) = 1 - F_X(x)\]

  1. Si \(a\) y \(b\) son dos números reales tales que \(a \leq b\), entonces \(F_X(a) \leq F_X(b)\), es decir \(F\) es creciente; y además se tiene que:

\[\textsf{P}(a \leq X \leq b) = \textsf{P}(a \leq X < b) = \textsf{P}(a < X \leq b) = \textsf{P}(a < X < b)=F_X(b)-F_X(a)\]

  1. Si \(f_X\) es la f.d.p. de \(X\), entonces:

\[f_X(x) = \frac{d}{dx}F_X(x)=F'_X(x)\]

donde \(F'_X(x)\) es la derivada de \(F_X(x)\) respecto a \(x\).

Ejemplo

Continuando con el ejemplo del tiempo de ejecución de una tarea, grafique la función de distribución.

# f.d.p.
fx<-function(x) 1/15*exp(-1/15*x)
# función de distribución
Fx <- function(x) 1 - exp(-1/15*x)
# gráfica
curve(expr = Fx, from = 0, to = 10, xlab = "x", ylab = "F(x)", col = "blue", lwd = 2)

Medidas de localización

Sea \(X\) una v.a.c. con f.d.a. \(F_X\) Y \(p\) un número real tal que \(0\leq p\leq 100\), El percentil \(p\) de la distribución de \(X\), denotado con \(\pi_p\), es un valor de \(X\) tal que:

\[\frac{p}{100}=F_X(\pi_p)\]

El percentil \(p\) de una variable continua \(X\) con \(0\leq p\leq 100\), corresponde al valor del eje de medición de \(X\) tal que el \(p\)% del área bajo la gráfica de la f.d.p. de \(X\) está a la izquierda de \(\pi_p\) y el \((100 - p)\%\) está a la derecha.

Como antes, el percentil 50 se denomina mediana y se simboliza con \(\tilde{\mu}_X\)

Valor esperado

Sobre la distribución de una v.a. se acostumbra registrar algunas características de interés, denominadas parámetros, como la la localización y la dispersión, por ejemplo.

Sea \(X\) una v.a. con f.m.p. \(f_X\) para el caso discreto o con f.d.p. \(f_X\) para el caso continuo. El valor esperado de \(X\) se define como:

\[\begin{equation*} \mathbb{E}[X]=\mu_X= \left\{ \begin{array}{ll} \sum_{k} x_k f_X(x_k), & \hbox{si $X$ es una v.a.d.} \\ \int_{-\infty}^{\infty} x f_X(x)dx, & \hbox{si $X$ es una v.a.c.} \end{array} \right. \end{equation*}\]

En general, si \(g:\mathbb{R} \longrightarrow \mathbb{R}\) es una función entonces se tiene que el valor esperado de \(g(X)\) se define como:

\[\begin{equation*} \mathbb{E}[g(X)]= \left\{ \begin{array}{ll} \sum_{k} g(x_k) f_X(x_k), & \hbox{si $X$ es una v.a.d.} \\ \int_{-\infty}^{\infty} g(x) f_X(x)dx, & \hbox{si $X$ es una v.a.c.} \end{array} \right. \end{equation*}\]

Propiedades

Sea \(X\) una v.a. y \(a\), \(b\) números reales. Entonces se tiene que:

  1. \(\mathbb E[a] = a\).

  2. \(\mathbb E[a\,X + b] = a\,\mathbb E[X] + b\).

  3. Si \(a_1,a_2\ldots,a_n\) son n números reales y \(X_1,X_2,\ldots,X_n\) son \(n\) v.a.’s conmensurables entonces:

\[\mathbb E\left[ \sum_{i=1}^n a_i X_i\right] = \sum_{i=1}^n a_i \mathbb E[X_i]\]

Ejemplo 1

Retomemos el ejemplo en el que \(X\) es el “número de caras obtenido” al final de los tres lanzamientos. Para éste encontramos que:

\[f_X(x)= \begin{cases} 0.125, & \text{si $x=0,3$}; \\ 0.375, & \text{si $x=1,2$}; \\ 0, & \text{en otro caso}. \\ \end{cases}\]

De tal forma que:

\[\mathbb{E}[X]=\sum_{k} x_k f_X(x_k)=0\times 0.125+1\times 0.375+2\times 0.375+3\times 0.125=1.5\]

x <- 0:3
# f.m.p.
fx <- c(1, 3, 3, 1)/8
#valor esperado
Ex<-sum(x*fx)
print(Ex)
## [1] 1.5

Ejemplo 2

La v.a. que representa la “proporción de accidentes automovilísticos fatales” en una ciudad, tiene la siguiente f.d.p.:

\[f_X(x) = \left\{ \begin{array}{ll} 42x(1-x)^5, & \hbox{si $0 < x \leq 1$;} \\ 0, & \hbox{en otro caso.} \end{array} \right.\]

Calcular e interpretar el valor esperado de \(X\).

Como \(X\) es una v.a.c., entonces se sigue que:

\[\begin{align*} \mathbb{E}[X] &= \int_{-\infty}^{\infty}xf_X(x)dx \\ &=\int_{0}^{1}xf_X(x)dx \\ &=\int_{0}^{1}x \left(42x(1-x)^5\right)dx \\ &=42\int_{0}^{1}x^2(1-x)^5dx \\ &=42\int_{0}^{1}x^2(-x^5+5x^4-10x^3+10x^2-5x+1)dx \\ &=42\int_{0}^{1}(-x^7+5x^6-10x^5+10x^4-5x^3+x^2)dx \\ &=42\left( -\frac{1}{8}x^8+\frac{5}{7}x^7-\frac{10}{6}x^6+\frac{10}{5}x^5-\frac{5}{4}x^4+\frac{1}{3}x^3 \Big|_0^1 \right) \\ &=42\left(-\frac{1}{8}+\frac{5}{7}-\frac{10}{6}+\frac{10}{5}-\frac{5}{4}+\frac{1}{3}\right) \\&= \frac{1}{4}. \end{align*}\]

Por lo tanto, la proporción media de accidentes automovilísticos fatales es esta ciudad es 25%.

Para reflexionar

¿En dónde se ubicarían los promedios de las siguientes distribuciones?

par(mfrow=c(1,2))
curve(dchisq(x, df = 4),col = 3, lwd = 2, from=0, to=9, ylab="f(x)", ylim=c(0,0.2))
curve(dnorm(x, mean=4, sd=2), col=2, lwd = 2, from=-1, to=9,ylab="f(x)")

Varianza

Sea \(X\) una v.a. con f.m.p. \(f_X\) para el caso discreto o con f.d.p. \(f_X\) para el caso continuo. Se define la varianza de \(X\) como el segundo momento centrado alrededor de la medida de \(X\), esto es:

\[\begin{equation*} \mathbb V[X] =\sigma^2_X= \left\{ \begin{array}{ll} \sum_{k}(x_k-\mu_X)^2f_X(x_k), & \hbox{si $X$ es una v.a.d.;} \\ \int_{-\infty}^{\infty}(x-\mu_X)^2f_X(x)dx, & \hbox{si $X$ es una v.a.c.} \end{array} \right. \end{equation*}\]

donde \(\mu_X\) es el valor esperado de \(X\).

Si \(X\) es una v.a., entonces se satisface que:

\[\mathbb V[X]= \mathbb E[X^2]-\left(\mathbb E[X]\right)^2\]

Propiedades

Sea \(X\) una v.a. y \(a\), \(b\) números reales. Entonces se tiene que:

  1. \(\mathbb V[X]\geq 0\)

  2. \(\mathbb V[a]=0\)

  3. \(\mathbb V[X+a]=\mathbb V[X]\)

  4. \(\mathbb V[bX]=b^2\mathbb V[X]\), con \(k\) constante

  5. Si \(X_1, X_2,...,X_m\) son variables aleatorias independientes, \(\mathbb V[\sum_{i=1}^{m}X_j]=\sum_{i=1}^{m}\mathbb V[X_j]\)

Desviación estándar

Si \(X\) es una v.a. con media \(\mu_X\) y varianza \(\sigma^2_X\), entonces la desviación estándar o desviación típica de \(X\), denotada con \(\sigma_X\) se define como:

\[\sigma_X=\sqrt{\sigma_X^2}.\]

Coeficiente de variación

el coeficiente de variación de Pearson, denotado con \(CV_X\), está dado por:

\[CV_X = \left| \frac{\sigma_X}{\mu_X} \right|.\]

Ejemplo

Continuando con el ejemplo en el que \(X\) es el “número de caras obtenido” al final de los tres lanzamientos y su f.d.m está dada por:

\[f_X(x)= \begin{cases} 0.125, & \text{si $x=0,3$}; \\ 0.375, & \text{si $x=1,2$}; \\ 0, & \text{en otro caso}. \\ \end{cases}\]

El valor de la varianza está dado por:

\[\mathbb V[X]= \mathbb E[X^2]-\left(\mathbb E[X]\right)^2\]

x <- 0:3
# f.m.p.
fx <- c(1, 3, 3, 1)/8
#valor esperado
Ex<-sum(x*fx)
#valor esperado x^2
Ex2<-sum(x^2*fx)
#varianza
Vx<-Ex2-(Ex)^2
print(Vx)
## [1] 0.75
#desviación estándar
print(sqrt(Vx))
## [1] 0.8660254
#coeficiente de variación
print(sqrt(Vx)/Ex*100)
## [1] 57.73503

Otras formas en R

Ejemplo lanzamiento de tres monedas

instalar la libreria “MASS”

“install.packages(”MASS)”

library(MASS) # Para utilizar la función fractions() 
Omega <- expand.grid(moneda_1 = 0:1, moneda_2 = 0:1, moneda_3 = 0:1) 
n.heads <- apply(Omega, 1, sum) 
cbind(Omega, n.heads) 
##   moneda_1 moneda_2 moneda_3 n.heads
## 1        0        0        0       0
## 2        1        0        0       1
## 3        0        1        0       1
## 4        1        1        0       2
## 5        0        0        1       1
## 6        1        0        1       2
## 7        0        1        1       2
## 8        1        1        1       3
T1 <- table(n.heads)/length(n.heads) 
fractions(T1) 
## n.heads
##   0   1   2   3 
## 1/8 3/8 3/8 1/8
plot(T1, xlab = "x", ylab="P(X = x)", yaxt = "n", main = "PDF for X") 
axis(2, at = c(1/8, 3/8), labels = c("1/8", "3/8"), las = 1) 

plot(ecdf(n.heads), main = "CDF for X", ylab = "F(x)", xlab = "x", yaxt = "n") 
axis(2, at = c(1/8, 4/8, 7/8, 1), labels = c("1/8", "4/8", "7/8", "1"), las = 1) 

¿Es justo el juego?

Participas en un juego donde se hace girar una rueda que puede aterrizar en los números 1, 5, o 30, con probabilidades de 0.50, 0.45, y 0.05 respectivamente.

Debes pagar $5 para jugar y se te otorga la cantidad de dinero indicada por el número donde cae la flecha giratoria.

El juego es justo cuando el retorno esperado es igual al costo de participar en el juego.

x <- c(1, 5, 30) # pagos X 
px <- c(0.5, 0.45, 0.05) # probabilidades p(x) 
EX <- sum(x * px) 
WM <- weighted.mean(x, px) 
c(EX, WM) 
## [1] 4.25 4.25

A partir del ejemplo anterior, considere que la variable aleatoria Y es definida como el rendimiento neto del jugador, es decir, Y = X-5, ya que el jugador paga $5 para jugar el juego.¿Cuál es el valor esperado de Y?

x <- c(1, 5, 30) # pagos X 
px <- c(0.5, 0.45, 0.05) # probabilidades p(x) 
EX <- sum((x - 5) * px) 
WM <- weighted.mean((x-5), px) 
c(EX, WM) 
## [1] -0.75 -0.75

Venta de laptop

Una tienda vende un modelo de computadora portátil. Hay sólo cuatro computadoras en existencia y la gerente se pregunta cuál será la demanda de hoy para este modelo en particular. Ella se entera en el departamento de marketing que la distribución de probabilidad para X, la demanda diaria para la laptop, es la siguiente:

X 0 1 2 3 4 5
P(x) 0.10 0.40 0.20 0.15 0.10 0.05

Encuentre la media, varianza y la desviación estándar de X

¿Es probable que 5 o más clientes deseen comprar una laptop hoy?

x <- c(0:5) # Laptops vendidas 
px <- c(0.10, 0.40, 0.20, 0.15, 0.10, 0.05) # probabilidades p(x) 
EX <- sum(x * px) 
m_x <- EX 
E_varX <- sum((x - m_x)^2 * px) 
WM_varX <- weighted.mean((x - m_x)^2, px) 
c(E_varX, WM_varX) 
## [1] 1.79 1.79
barplot(px, ylab = 'p(x)', names.arg = x) 

Ejemplo para resolver

En una lotería realizada a beneficio de una institución local de caridad, se han de vender 8000 boletos a 100 cada uno. El premio es un automóvil de $240.000. Si usted compra dos boletos, ¿cuál es su ganancia esperada?

Variable continua

Suponga que X es una v.a. continua con pdf \(f(x)\), donde:

\[f_X(x) = \left\{ \begin{array}{ll} 3/4(1-x^2), & \hbox{si $-1 < x \leq 1$;} \\ 0, & \hbox{en otro caso.} \end{array} \right.\]

  1. Encontrar la cdf para X.

  2. Estimar \(P(\leq -0.5 < x \leq 1\))

  3. Graficar la pdf y la cdf

f_x <- function(x) { 
   y <- 3/4 * (1 - x^2) 
   y[x < -1 | x > 1] <- 0 
   return(y) 
   } 

curve(f_x, -2, 2, xlab = "x", ylab = "f(x)", main = "PDF para X") 

F_x <- function(x) { 
    y <- -x^3/4 + 3 * x/4 + 1/2 
    y[x <= -1] <- 0 
    y[x > 1] <- 1 
    return(y) 
    } 

curve(F_x, -2, 2, xlab = "x", ylab = "F(x)", main = "CDF para X")

Integrales en R

f_x <- function(x) { 3/4 - 3/4 * x^2 } # define la función fx 
integrate(f_x, lower = -0.5, upper = 1) # Estima valor y tolerancia 
## 0.84375 with absolute error < 9.4e-15
ans <- integrate(f_x, lower = -0.5, upper = 1)$value # devuelve solo el valor 
ans 
## [1] 0.84375
library(MASS) # Para utilizar la función fractions() 
fractions(ans) # Estima la fracción más cercana 
## [1] 27/32