1 Introducción

  • Para el desarrollo de técnicas de inferencia estadística, es conveniente relacionar directamente los resultados de un experimento aleatorio con números reales, ya que con tal asociación el análisis de las características de interés es más productivo.

  • Dependiendo de si la variable resultante es discreta (solo pueden adoptar un número finito o una infinidad enumerable de valores) o continua (los valores están asociados con una escala continua de medición), es posible describir su comportamiento probabilístico a partir de la función de probabilidad o de la función de densidad, respectivamente.

  • Además, por medio de estas funciones es posible calcular todo tipo de medidas (e.g., tendencia central) a nivel “poblacional”. En este contexto, tales medidas se denominan parámetros.

2 Objetivos

  1. Apropiarse del concepto de variable aleatoria.
  2. Conocer, entender y usar apropiadamente los conceptos de función de probabilidad o función de distribución, según sea el caso.
  3. Apropiarse de los conceptos de valor esperado y varianza poblacional.

3 Competencias

En este módulo el estudiante aprenderá los conceptos básicos relacionados con variables aleatorias y su función de probabilidad o de distribución, desde la selección de la apropiada, el cálculo de probabilidades a partir de ella. De igual forma, aprenderá como calcular e interpretar valores esperados y varianzas poblacionales.

4 Conceptos preliminares

Las siguientes definiciones están siempre basadas en un espacio de probabilidad \((\Omega, \mathcal{A},P)\).

4.1 Variable aleatoria (v.a.)

Una v.a. \(X\) es una función cuyo dominio es \(\Omega\) y recorrido \(\mathcal{R}\), que asigna un único número real a cada resultado del espacio muestral \(\Omega\) de un experimento aleatorio. De tal forma que la inversa de \(X\) calculada en un subconjunto de los reales, siempre pertenece a \(\mathcal{A}\).

\[X :\Omega \longrightarrow \mathbb{R}:\omega\longmapsto X(\omega)\] Es decir, una v.a. “convierte” cada elemento del espacio muestral en un número real. Las v.a.s pueden ser de dos tipos dependiendo su recorrido:

  1. Discretas: Cuando su recorrido es numerable. Un buen ejemplo de variables discretas son los conteos, como el número de casos incidentes de SarsCov2 en un mes determinado.

  2. Continuas: Cuando su recorrido es no numerable, es decir cuando entre dos valores de la variable hay infinitos posibles valores de ésta, como por ejemplo la longitud(m) y la temperatura (°C).

Nota: Las v.a. se simbolizan, generalmente, con letras mayúsculas \(X\), \(Y\) y \(Z\). Se utiliza su correspondiente letra minúscula (en este caso \(x\), \(y\), \(z\)) para designar sus posibles valores. Por ejemplo, si \(X\) representa la v.a. “número de caras obtenido” que pueden resultar al lanzar una moneda tres veces consecutivas, entonces, sus valores son \(x = 0,1,2,3\).

4.1.1 Ejemplo

  • Experimento aleatorio: lanzar tres veces una moneda al aire.
  • \(X\): “Número de caras obtenido” al final de los tres lanzamientos.

Así: \[ \Omega = \{(c,c,c), (c,c,s), (c,s,c), (c,s,s), (s,c,c), (s,c,s), (s,s,c), (s,s,s) \} \] y \(X\) es una v.a. discreta con valores:

\(X((c,c,c)) = 3\), \(X((c,c,s)) = 2\), \(X((c,s,c)) = 2\), \(X((s,c,c)) = 2\), \(X((s,s,c)) = 1\), \(X((s,c,s)) = 1\), \(X((c,s,s)) = 1\) y \(X((s,s,s)) = 0\).

5 Variables aleatorias discretas

Sea \(X\) una v.a.d. que toma los valores \(x_1, x_2, \ldots\) (finitos o infinitos enumerables). Una función \(f_X : \mathbb{R} \longrightarrow [0,1]\) es una función de masa de probabilidad (f.m.p.) de \(X\) si y solo si: \[ f_X(x)= \begin{cases} \textsf{P}(X = x), & \text{si $x=x_1,x_2,\ldots$}; \\ 0, & \text{en otro caso}. \end{cases} \] donde \((X=x)=\{w\in\Omega: X(w)=x\}\), de tal forma que si \(x\) no es uno de los valores que toma la v.a. \(X\), entonces \(f_X(x) = 0\).

5.1 Ejemplo

Continuando con el ejemplo anterior, se tiene que la f.m.p. de la variable es: \[\begin{align*} f_X(0) &= \textsf{P}(X=0)=\textsf{P}((s,s,s))=\frac{1}{8}=0.125,\\ f_X(1) &= \textsf{P}(X=1)=\textsf{P}(\{(c,s,s), (s,c,s), (s,s,c)\}) =\frac{3}{8}=0.375, \\ f_X(2) &= \textsf{P}(X=2)=\textsf{P}(\{(s,c,c), (c,c,s), (c,s,c)\}) =\frac{3}{8}=0.375, \\ f_X(3) &= \textsf{P}(X=3)=\textsf{P}((c,c,c))=\frac{1}{8}=0.125. \\ \end{align*}\] Concretamente, esta función está dada por: \[ f_X(x)= \begin{cases} 0.125, & \text{si $x=0,3$}; \\ 0.375, & \text{si $x=1,2$}; \\ 0, & \text{en otro caso}. \\ \end{cases} \]

Además, se observa que:

\[\sum_{k=1}^4 f_X(x_k) = f_X(0) + f_X(1) + f_X(2) + f_X(3) = 0.125+0.375+0.375+0.125 = 1\] con \(x_1=0\), \(x_2=1\), \(x_3=2\) y \(x_4=3\).

La siguiente figura presenta el gráfico de la f.m.p de la variable \(X\).

# valores de la variable
x <- 0:3
# f.m.p.
fx <- c(1, 3, 3, 1)/8
# gráfico
plot(x = x, y = fx, xlab = "x", ylab = "f(x)", pch = 15, col = "blue")
segments(x0 = x, y0 = 0, x1 = x, y1 = fx, lwd = 2, col = "blue")

5.2 Propiedades

Sea \(f_X\) una f.m.p. de una v.a.d. \(X\) que asume los valores \(x_1,x_2,\ldots\) definida sobre un espacio muestral \(\Omega\) no vacío. Entonces se satisface que:

  • \(f(x_k) \geqslant 0\) para todo valor \(x_k\) de \(X\).
  • \(\sum_{k} f(x_k) = 1\).

5.3 Ejemplo

Dada \(X\): Suma del lanzamiento de dos dados. Se sabe que su f.m.p está dada por:

\[f_X(x)=\frac{6-|7-x|}{36}\text{, }x=2,3,...,12\] Calcular: 1. \(P(X=3)=\frac{6-|7-3|}{36}=\frac{2}{36}\)

f<-function(x) (6-abs(7-x))/36 
f(3)
## [1] 0.05555556
  1. \(P(X\leq 4.5)=P(X\leq 4)=P(X=2\text{ o }X=3\text{ o }X=4)=f_X(2)+f_X(3)+f_X(4)=\frac{1}{36}+\frac{2}{36}+\frac{3}{36}=\frac{1}{6}\)
f(2)+f(3)+f(4)
## [1] 0.1666667
  1. \(P(3\leq X\leq 6)=f_X(3)+f_X(4)+f_X(5)+f_X(6)\)
f(3)+f(4)+f(5)+f(6)
## [1] 0.3888889
  1. \(P(3\leq X<6)=f_X(3)+f_X(4)+f_X(5)\)
f(3)+f(4)+f(5)
## [1] 0.25

La distribución de probabilidad completa estaría dada por

#valores de la variable
x<-2:12
#calculo de la función de probabilidad para cada valor de la variable
fx<-f(x)
cbind(x, fx)
##        x         fx
##  [1,]  2 0.02777778
##  [2,]  3 0.05555556
##  [3,]  4 0.08333333
##  [4,]  5 0.11111111
##  [5,]  6 0.13888889
##  [6,]  7 0.16666667
##  [7,]  8 0.13888889
##  [8,]  9 0.11111111
##  [9,] 10 0.08333333
## [10,] 11 0.05555556
## [11,] 12 0.02777778
#Función de probabilidad
plot(x = x, y = fx, xlab = "x", ylab = "f(x)", pch = 15, col = "blue")
segments(x0 = x, y0 = 0, x1 = x, y1 = fx, lwd = 2, col = "blue")

5.4 Función de distribución

Sea \(X\) una v.a.d. que asume los valores \(x_1, x_2,\ldots\) (finitos o infinitos enumerables). La función de distribución aquella que calcula la probabilidad acumulada hasta un punto \(x\), es decir, es la función \(F_X: \mathbb{R} \longrightarrow [0,1]\) definida por:

\[F_X(x) = \textsf{P}(X \leq x)= \sum_{t \leq x} f_X(t)\]

para cualquier número real \(x\), cuando \(X\) tiene f.m.p. \(f_X\).

5.4.1 Ejemplo 4

Volviendo al primer ejemplo, se tiene que:

\[\begin{align*} F_X(0) &= \textsf{P}(X \leq 0)= f_X(0) = \frac{1}{8}=0.125, \\ F_X(1) &= \textsf{P}(X \leq 1)= f_X(0) + f_X(1) =\frac{1}{8} + \frac{3}{8} =\frac{4}{8}= \frac{1}{2}=0.5, \\ F_X(2) &= \textsf{P}(X \leq 2)= f_X(0) + f_X(1) + f_X(2) =\frac{1}{8} + \frac{3}{8} + \frac{3}{8} = \frac{7}{8}=0.875,\ \text{ y} \\ F_X(3) &= \textsf{P}(X \leq 3)= f_X(0) + f_X(1) + f_X(2) + f_X(3) =\frac{1}{8} + \frac{3}{8} + \frac{3}{8} + \frac{1}{8}= \frac{8}{8} = 1.\\ \end{align*}\]

Resumiendo: \[ F_X(x)= \begin{cases} 0, & \text{si $x < 0$}; \\ \frac{1}{8}, & \text{si $ 0 \leq x < 1$}; \\ \frac{4}{8}, & \text{si $ 1 \leq x < 2$}; \\ \frac{7}{8}, & \text{si $ 2 \leq x < 3$}; \\ 1, & \text{si $3 \leq x$}. \\ \end{cases} \]

  • Por ejemplo, si \(x =2.7\) entonces \[F_X(2.7) = \sum_{t \leq 2.7} f_X(t) = f_X(0) + f_X(1) + f_X(2) = 0.875.\]

El gráfico de \(F_X\) está dado por:

# valores de la variable
x <- 0:3
# f.m.p.
fx <- c(1, 3, 3, 1)/8
# f.d.a.
Fx <- cumsum(fx)
plot(x = c(0, x), y = c(0, Fx), type = "s", xlab = "x", ylab = "F(x)", col = "blue", lwd = 2)
points(x, Fx, col = "blue", pch = 15)

5.4.2 Propiedades

Sea \(F_X\) una f.d.a. de una v.a.d. \(X\) definida sobre un espacio muestral \(\Omega\) no vacío. Entonces se satisface que:

  • Si \(x\) es un número real, entonces \(0 \leq F_X(x) \leq 1\).
  • Si \(x\) es un número real, entonces \[ \textsf{P}(X>x)=1-F_X(x) \,\,\, \text{y} \,\,\, \textsf{P}(X\geq x)=1-F_X(x^-). \] donde \(x^{-}\) representa el máximo valor que puede asumir \(X\) estrictamente menor que \(x\).
  • Si \(x\) es un valor que puede asumir \(X\), entonces \[ f_X(x) = F_X(x) - F_X(x^{-}). \]
  • Si \(a\) y \(b\) son números reales tales que \(a \leq b\), entonces \(F_X(a) \leq F_X(b)\), es decir, \(F_X\) es una función creciente; y además se tiene que \[ \textsf{P}(a \leq X \leq b) = F_X(b) - F_X(a^{-}) \quad \text{y} \quad \textsf{P}(a < X < b) = F_X(b^-) - F_X(a). \]

5.4.3 Ejemplo

La junta directiva de un hospital quiere mejorar su atención en el horario nocturno de los pacientes que necesitan de atención quirúrgica inmediata. Para esto, se quiere analizar la variable \(X\) dada por “Número de pacientes que requieren de atención quirúrgica inmediata reportados entre las 19:00 y las 5:00”. El analista encargado asegura que la f.m.p. de \(X\) es \[f_X(x)=\left\{ \begin{array}{ll} \frac{ 7^x e^{-7}}{x!}, & \hbox{si $x=0,1,2,\ldots$;} \\ 0, & \hbox{en otro caso.} \end{array} \right. \] Se pide:

  1. Sabiendo que entre las 19:00 y las 5:00 el hospital solo tiene la capacidad de operar en 5 quirófanos, determinar el porcentaje de jornadas nocturnas en las que se puede atender a todos los pacientes que lleguen en la noche.

Para encontrar el porcentaje de noches en las que el hospital puede atender a todos sus pacientes entre las 19:00 y las 5:00, basta con calcular \[\textsf{P}(X\leq 5)=\sum_{x=0}^5 \frac{ 7^x e^{-7}}{x!}=0.3007,\] y por lo tanto solo en el 30% de las noches el hospital puede atender a todos los pacientes que llegan en la jornada nocturna.

  1. ¿Cuántos pacientes, como máximo, requieren de atención quirúrgica inmediata, en el 50% de las noches el hospital?

En este caso requerimos calcular el percentil 50, \(p_{50}\). Evaluando en los valores de \(0,1,2,\ldots\) se tiene que \[\begin{align*} &\textsf{P}(X\leq 0)=0.0009, \\& \textsf{P}(X\leq 1)=0.0072, \\& \textsf{P}(X\leq 2)=0.0296, \\& \textsf{P}(X\leq 3)=0.0817, \\&\hspace{2.2cm}\vdots \\& \textsf{P}(X\leq 6)=0.4497, \\& \textsf{P}(X\leq 7)=0.5987. \end{align*}\] En consecuencia, se obtiene que \(p_{50}=7\).

# valores de la variable
x <- 0:20
# f.m.p.
fx <- (7^x)*exp(-7)/factorial(x)
Fx <- cumsum(fx)
print(cbind(x,Fx))
##        x          Fx
##  [1,]  0 0.000911882
##  [2,]  1 0.007295056
##  [3,]  2 0.029636164
##  [4,]  3 0.081765416
##  [5,]  4 0.172991608
##  [6,]  5 0.300708276
##  [7,]  6 0.449711056
##  [8,]  7 0.598713836
##  [9,]  8 0.729091268
## [10,]  9 0.830495937
## [11,] 10 0.901479206
## [12,] 11 0.946650377
## [13,] 12 0.973000227
## [14,] 13 0.987188607
## [15,] 14 0.994282798
## [16,] 15 0.997593420
## [17,] 16 0.999041817
## [18,] 17 0.999638216
## [19,] 18 0.999870149
## [20,] 19 0.999955598
## [21,] 20 0.999985505
  1. Graficar la f.m.p y la función de distribución de \(X\).
# valores de la variable
x <- 0:20
# f.m.p.
fx <- (7^x)*exp(-7)/factorial(x)
Fx <- cumsum(fx)
# gráficos
par(mfrow = c(1,2))
# f.m.p
plot(x = x, y = fx, xlab = "x", ylab = "f(x)", pch = 15, col = "blue")
segments(x0 = x, y0 = 0, x1 = x, y1 = fx, lwd = 2, col = "blue")
# f.d.a.
plot(x = c(0, x), y = c(0, Fx), type = "s", xlab = "x", ylab = "F(x)", col = "blue", lwd = 2)
points(x, Fx, col = "blue", pch = 15)

6 Variables aleatorias continuas

Cuando la variable objeto de estudio es continua, no tiene sentido hacer una suma de las probabilidades de cada uno de los valores de la variable como con las variables discretas, ya que el conjunto de valores que toma una variable continua es no numerable. En este caso, se generalizan de modo natural los conceptos, empleando la integral (\(\int\)) en lugar de la suma (\(\sum\)).

Una función \(f_X : \mathbb{R} \longrightarrow [0,\infty)\) se dice que es una función de densidad de probabilidad (f.d.p.) de una v.a.c. \(X\) si satisface las siguientes condiciones:

  • \(f_X(x)\geq 0\) para todo \(x \in \mathbb{R}\).
  • Para cualquier par de números reales \(a\) y \(b\) tales que \(a\leq b\), se tiene que \[\textsf{P}(a \leq X \leq b) = \int_{a}^{b} f_X(x) dx.\]
  • El área bajo toda la gráfica de \(f_X\) es 1, esto es: \[\int_{-\infty}^{+\infty} f(x)\, dx = 1.\]

6.1 Ejemplo

Suponga que \(X\):Estancia hospitalaria en días, tiene la siguiente función de densidad:

\[f_X(x)=\frac{1}{15}e^{-\frac{1}{15}x}I_{(0,\infty)(x)}\] En este caso, la variable X puede tomar el valor de cualquier real positivo (Si un paciente permanece un día y medio, entonces x=1.5). Calcular la probabilidad de que un paciente tenga menos de 10 días de estancia hospitalaria.

Nos piden calcular \(P(X<10)\), es decir, el área bajo la curva de la función de densidad entre 0 y 10:

#función de densidad
fx<-function(x) 1/15*exp(-1/15*x)
curve(expr = fx, from = 0, to = 20, xlab = "x", ylab = "f(x)", col = "blue", lwd = 2)
abline(v=0, col="light blue")
abline(v=10, col="light blue")

#área bajo la curva
library(pracma)
integral(fx,0,10)
## [1] 0.4865829

6.2 Función de distribución

La función de distribución de una v.a.c. \(X\) con función de densidad es \(f_X\), es la función \(F_X : \mathbb{R} \longrightarrow [0,1]\) definida por: \[ F_X(x) = \textsf{P}(X \leq x)=\int_{-\infty}^{x} f(x)\, dx. \] para todo número real \(x\).

6.2.1 Propiedades

Si \(F_X\) es una función de distribución de una v.a.c. \(X\), entonces se satisfacen las siguientes propiedades:

  • Si \(x\) es un número real, entonces \(0 \leq F_X(x) \leq 1\), además \[ \lim_{x\rightarrow -\infty} F_X(x)=0 \quad\text{y}\quad \lim_{x\rightarrow \infty} F_X(x)=1. \]
  • Si \(x\) es un número real, entonces \[ \textsf{P}(X = x) = 0 \quad\text{y}\quad \textsf{P}(X \geq x) = \textsf{P}(X > x) = 1 - F_X(x). \]
  • Si \(a\) y \(b\) son dos números reales tales que \(a \leq b\), entonces \(F_X(a) \leq F_X(b)\), es decir \(F\) es creciente; y además se tiene que \[ \textsf{P}(a \leq X \leq b) = \textsf{P}(a \leq X < b) = \textsf{P}(a < X \leq b) = \textsf{P}(a < X < b)=F_X(b)-F_X(a). \]
  • Si \(f_X\) es la f.d.p. de \(X\), entonces \[ f_X(x) = \frac{d}{dx}F_X(x)=F'_X(x) \] donde \(F'_X(x)\) es la derivada de \(F_X(x)\) respecto a \(x\).

6.2.2 Ejemplo

Continuando con el ejemplo de estancia hospitalaria, grafique la función de distribución.

# f.d.p.
fx<-function(x) 1/15*exp(-1/15*x)
# función de distribución
Fx <- function(x) 1 - exp(-1/15*x)
# gráfica
curve(expr = Fx, from = 0, to = 50, xlab = "x", ylab = "F(x)", col = "blue", lwd = 2)

6.3 Medidas de localización

Sea \(X\) una v.a.c. con f.d.a. \(F_X\) y \(p\) un número real tal que \(0\leq p\leq 100\). El percentil \(p\) de la distribución de \(X\), denotado con \(\pi_p\), es un valor de \(X\) tal que \[ \frac{p}{100}=F_X(\pi_p). \]

El percentil \(p\) de una variable continua \(X\) con \(0\leq p\leq 100\), corresponde al valor del eje de medición de \(X\) tal que el \(p\%\) del área bajo la gráfica de la f.d.p. de \(X\) está a la izquierda de \(\pi_p\) y el \((100 - p)\%\) está a la derecha.

Como antes, el percentil 50 se denomina mediana y se simboliza con \(\tilde{\mu}_X\).

7 Valor esperado

Sobre la distribución de una v.a. se acostumbra a registrar algunas características de interés, denominadas parámetros, como la la localización y la dispersión, por ejemplo.

Sea \(X\) una v.a. con f.m.p. \(f_X\) para el caso discreto o con f.d.p. \(f_X\) para el caso continuo. El valor esperado de \(X\) se define como: \[\begin{equation*} \mathbb{E}[X]=\mu_X= \left\{ \begin{array}{ll} \sum_{k} x_k f_X(x_k), & \hbox{si $X$ es una v.a.d.} \\ \int_{-\infty}^{\infty} x f_X(x)dx, & \hbox{si $X$ es una v.a.c.} \end{array} \right. \end{equation*}\]

En general, si \(g:\mathbb{R} \longrightarrow \mathbb{R}\) es una función entonces se tiene que el valor esperado de \(g(X)\) se define como: \[\begin{equation*} \mathbb{E}[g(X)]= \left\{ \begin{array}{ll} \sum_{k} g(x_k) f_X(x_k), & \hbox{si $X$ es una v.a.d.} \\ \int_{-\infty}^{\infty} g(x) f_X(x)dx, & \hbox{si $X$ es una v.a.c.} \end{array} \right. \end{equation*}\]

7.1 Propiedades

Sea \(X\) una v.a. y \(a\), \(b\) números reales. Entonces se tiene que:

  • \(\mathbb E[a] = a\).
  • \(\mathbb E[a\,X + b] = a\,\mathbb E[X] + b\).
  • Si \(a_1,a_2\ldots,a_n\) son \(n\) números reales y \(X_1,X_2,\ldots,X_n\) son \(n\) v.a.’s conmensurables entonces \[ \mathbb E\left[ \sum_{i=1}^n a_i X_i\right] = \sum_{i=1}^n a_i \mathbb E[X_i] \]

7.1.1 Ejemplo

Retomemos el ejemplo en el que \(X\) es el “número de caras obtenido” al final de los tres lanzamientos. Para éste encontramos que: \[ f_X(x)= \begin{cases} 0.125, & \text{si $x=0,3$}; \\ 0.375, & \text{si $x=1,2$}; \\ 0, & \text{en otro caso}. \\ \end{cases} \] De tal forma que: \[\mathbb{E}[X]=\sum_{k} x_k f_X(x_k)=(0\times 0.125)+(1\times 0.375)+(2\times 0.375)+(3\times 0.125)=1.5\]

x <- 0:3
# f.m.p.
fx <- c(1, 3, 3, 1)/8
#valor esperado
Ex<-sum(x*fx)
print(Ex)
## [1] 1.5

7.1.2 Ejemplo

La v.a. que representa la “proporción de accidentes automovilísticos fatales” en una ciudad, tiene la siguiente f.d.p.: \[ f_X(x) = \left\{ \begin{array}{ll} 42x(1-x)^5, & \hbox{si $0 < x \leq 1$;} \\ 0, & \hbox{en otro caso.} \end{array} \right. \] Calcular e interpretar el valor esperado de \(X\).

Como \(X\) es una v.a.c., entonces se sigue que \[\begin{align*} \mathbb{E}[X] &= \int_{-\infty}^{\infty}xf_X(x)dx \\ &=\int_{0}^{1}xf_X(x)dx \\ &=\int_{0}^{1}x \left(42x(1-x)^5\right)dx \\ &=42\int_{0}^{1}x^2(1-x)^5dx \\ &=42\int_{0}^{1}x^2(-x^5+5x^4-10x^3+10x^2-5x+1)dx \\ &=42\int_{0}^{1}(-x^7+5x^6-10x^5+10x^4-5x^3+x^2)dx \\ &=42\left( -\frac{1}{8}x^8+\frac{5}{7}x^7-\frac{10}{6}x^6+\frac{10}{5}x^5-\frac{5}{4}x^4+\frac{1}{3}x^3 \Big|_0^1 \right) \\ &=42\left(-\frac{1}{8}+\frac{5}{7}-\frac{10}{6}+\frac{10}{5}-\frac{5}{4}+\frac{1}{3}\right) \\&= \frac{1}{4}. \end{align*}\] Por lo tanto, la proporción media de accidentes automovilísticos fatales es esta ciudad es 25%.

7.1.3 Para reflexionar

¿En dónde se ubicarían los promedios de las siguientes distribuciones?

par(mfrow=c(1,2))
curve(dchisq(x, df = 4),col = 3, lwd = 2, from=0, to=9, ylab="f(x)", ylim=c(0,0.2))
curve(dnorm(x, mean=4, sd=2), col=2, lwd = 2, from=-1, to=9,ylab="f(x)")

8 Varianza

Sea \(X\) una v.a. con f.m.p. \(f_X\) para el caso discreto o con f.d.p. \(f_X\) para el caso continuo. Se define la varianza de \(X\) como el segundo momento centrado alrededor de la medida de \(X\), esto es: \[\begin{equation*} \mathbb V[X] =\sigma^2_X= \left\{ \begin{array}{ll} \sum_{k}(x_k-\mu_X)^2f_X(x_k), & \hbox{si $X$ es una v.a.d.;} \\ \int_{-\infty}^{\infty}(x-\mu_X)^2f_X(x)dx, & \hbox{si $X$ es una v.a.c..} \end{array} \right. \end{equation*}\] donde \(\mu_X\) es el valor esperado de \(X\).

Si \(X\) es una v.a., entonces se satisface que \(\mathbb V[X]= \mathbb E[X^2]-\left(\mathbb E[X]\right)^2\).

8.1 Propiedades

Sea \(X\) una v.a. y \(a\), \(b\) números reales. Entonces se tiene que:

  • \(\mathbb V[X]\geq 0\)
  • \(\mathbb V[a]=0\)
  • \(\mathbb V[X+a]=\mathbb V[X]\)
  • \(\mathbb V[bX]=b^2\mathbb V[X]\)
  • Si \(X_1, X_2,...,X_m\) son variables aleatorias independientes, \(\mathbb V[\sum_{i=1}^{m}X_j]=\sum_{i=1}^{m}\mathbb V[X_j]\)

8.2 Desviación estándar

Si \(X\) es una v.a. con media \(\mu_X\) y varianza \(\sigma^2_X\), entonces la desviación estándar o desviación típica de \(X\), denotada con \(\sigma_X\) se define como \[\sigma_X=\sqrt{\sigma_X^2}.\]

8.3 Coeficiente de variación

Además, el coeficiente de variación de Pearson, denotado con \(CV_X\), está dado por \[ CV_X = \left| \frac{\sigma_X}{\mu_X} \right|. \]

8.4 Ejemplo

Continuando con el ejemplo en el que \(X\) es el “número de caras obtenido” al final de los tres lanzamientos y su f.d.m está dada por: \[ f_X(x)= \begin{cases} 0.125, & \text{si $x=0,3$}; \\ 0.375, & \text{si $x=1,2$}; \\ 0, & \text{en otro caso}. \\ \end{cases} \]

El valor de la varianza está dado por:

\[\mathbb V[X]= \mathbb E[X^2]-\left(\mathbb E[X]\right)^2\]

x <- 0:3
# f.m.p.
fx <- c(1, 3, 3, 1)/8
#valor esperado
Ex<-sum(x*fx)
#valor esperado x^2
Ex2<-sum(x^2*fx)
#varianza
Vx<-Ex2-(Ex)^2
print(Vx)
## [1] 0.75
#desviación estándar
print(sqrt(Vx))
## [1] 0.8660254
#coeficiente de variación
print(sqrt(Vx)/Ex*100)
## [1] 57.73503

9 Bibliografía

  1. Barón F.J. Bioestadística. Universidad de Málaga. http://www.bioestadistica.uma.es/baron/bioestadistica.pdf

  2. Soto O, Franco D. Fundamentos conceptuales de estadística. Universidad Nacional de Colombia. Notas de clase.

  3. Blanco L. Probabilidad. Universidad Nacional de Colombia.