1 Introducción

En general, cuando hacemos experimentos aleatorios, el resultado de nuestro interés es numérico, dicho resultado podemos expresarlo como una variable aleatoria (v.a.). Según si la v.a. es discreta o continua, es posible describir su comportamiento probabilístico a partir de la función de probabilidad o de la función de densidad, respectivamente. Adicionalmente, con la ayuda de dicha función es posible calcular medidas de tendencia central, de variabilidad, localización y forma, tal como lo hicimos al inicio del curso, pero esta vez a nivel poblacional (más adelante las llamaremos parámetros) .

2 Objetivos

Apropiarse del concepto de variable aleatoria.
Conocer, entender y usar apropiadamente los conceptos de función de probabilidad o función de distribución, según sea el caso.
Apropiarse de los conceptos de valor esperado, varianza, momentos poblacionales y función generadora de momentos.

3 Competencias

En este módulo el estudiante aprenderá los conceptos básicos relacionados con variables aleatorias y su función de probabilidad o de distribución, desde la selección de la apropiada, el cálculo de probabilidades a partir de ella,de igual forma, aprenderá como cálcular e interpretar valores esperados, varianza, momentos y función generadora de momentos.

4 Conceptos preliminares

Las siguientes definiciones están siempre basadas en un espacio de probabilidad \((\Omega, \mathcal{A},P)\).

4.1 Variable aleatoria (v.a.)

Una v.a. \(X\) es una función cuyo dominio es \(\Omega\) y recorrido \(\mathcal{R}\), es decir que a cada evento en \(\Omega\) le asigna un número real. De tal forma que la inversa de \(X\) calculada en un subconjunto de los reales, siempre pertenece a \(\mathcal{A}\). Las v.a.s pueden ser de dos tipos dependiendo su recorrido:

Discretas: Cuando su recorrido es numerable. Un buen ejemplo de variables discretas son los conteos, como el número de casos incidentes de determinada enfermedad en un mes.
Continuas: Cuando su recorrido es no numerable, es decir cuando entre dos valores de la variable hay infinitos posibles valores de ésta.

4.1.1 Ejemplo

Supongamos el experimento \(E:\text{Lanzamiento de dos monedas}\), con \(\Omega=\left\lbrace (C,C), (C,S),(S,C),(S,S)\right\rbrace\) y \(\mathcal{A}=\mathcal{P}(\Omega)\)

Sea \(X(\omega):\text{número de caras obtenidas en }\omega\), así:

\[X((C,C))=2\]

\[X((S,C))=X((C,S))=1\] \[X((S,S))=0\] Veamos qué pasa con su función inversa:

\[X^{-1}(2)=(C,C)\in\mathcal{A}\]

\[X^{-1}(1)=\left\lbrace (S,C),(C,S)\right\rbrace \in\mathcal{A}\]

\[X^{-1}(0)=\phi\in\mathcal{A}\]

Así, de una forma muy empírica, hemos visto que \(X\) es una v.a. y como su recorrido es contable, es discreta.

4.2 Función de probabilidad (f.d.p)}

Cuando \(X\) es una v.a discreta, la f.d.p, \(f_X(x)\), es aquella que rige el comportamiento probabilístico de ella. Debe cumplir con los siguientes requisitos:

\(\sum_{\forall x}f_X(x)=1\)
\(P(X=x_i)=f_X(x_i)\)

4.2.1 Ejemplo

Dada \(X\): suma del lanzamiento de dos dados. Se sabe que su f.d.p está dada por:

\[f_X(x)=\frac{6-|7-x|}{36}\text{, }x=2,3,...,12\] Calcular: 1. \(P(X=3)=\frac{6-|7-3|}{36}=\frac{2}{36}\)

f<-function(x) (6-abs(7-x))/36 
f(3)

## [1] 0.05555556

\(P(X\leq 4.5)=P(X\leq 4)=P(X=2\text{ o }X=3\text{ o }X=4)=f_X(2)+f_X(3)+f_X(4)=\frac{1}{36}+\frac{2}{36}+\frac{3}{36}=\frac{1}{6}\)

f(2)+f(3)+f(4)

## [1] 0.1666667

\(P(3\leq X\leq 6)=f_X(3)+f_X(4)+f_X(5)+f_X(6)\)

f(3)+f(4)+f(5)+f(6)

## [1] 0.3888889

\(P(3\leq X<leq 6)=f_X(3)+f_X(4)+f_X(5)\)

f(3)+f(4)+f(5)

## [1] 0.25

La distribución de probabilidad completa estaría dada por

#valores de la variable
x<-2:12
#calculo de la función de probabilidad para cada valor de la variable
fx<-f(x)
cbind(x, fx)

##        x         fx
##  [1,]  2 0.02777778
##  [2,]  3 0.05555556
##  [3,]  4 0.08333333
##  [4,]  5 0.11111111
##  [5,]  6 0.13888889
##  [6,]  7 0.16666667
##  [7,]  8 0.13888889
##  [8,]  9 0.11111111
##  [9,] 10 0.08333333
## [10,] 11 0.05555556
## [11,] 12 0.02777778

#Función de probabilidad
barplot(f(x), names.arg =as.character(x), ylim=c(0,0.2), xlab="Suma de dos dados", ylab="f.d.p", col = "light blue")

4.3 Función de densidad (f.d.p)}

Cuando \(X\) es una v.a. continua, la f.d.p. debe cumplir con las siguientes características:

\(f_X(x)\geq 0\)
\(\int_{-\infty}^{\infty}f_X(x)dx=1\)
\(\int_{a}^{b}f_X(x)dx=P(a\leq X\leq b)\), \(a<b\)

4.3.1 Ejemplo

Suponga que \(X\):estancia hospitalaria en días, tiene la siguiente función de densidad:

\[f_X(x)=\frac{1}{15}e^{-\frac{1}{15}x}I_{(0,\infty)(x)}\] Calcular la probabilidad de que un paciente tenga menos de 10 días de estancia hospitalaria.

Nos piden calcular \(P(X>10)\), es decir, el área bajo la curva de la función de densidad entre 0 y 10:

x1<-seq(0,30,0.01)
#función de densidad
fx1<-function(x) 1/15*exp(-1/15*x)
plot(x1,fx1(x1), type="l")
abline(v=0, col="blue")
abline(v=10, col="blue")

#área bajo la curva
library(pracma)
integral(fx1,0,10)

## [1] 0.4865829

Nota: Notaremos como f.d.p a la función de probabilidad o de densidad según sea el caso. Es decir que el lector, de acuerdo a la variable debe identificar sobre cuál estamos hablando.

4.4 Función de distribución

La función de distribución de una v.a. \(X\) es aquella que calcula la probabilidad acumulada hasta un punto \(x\), es decir:

\[F_X(x)=P(X\leq x)\]

Así, cuando \(X\) es continua, \(P(a\leq X\leq b)=F_X(b)-F_X(a)\) y cuando \(X\) es discreta \(P(a\leq X\leq b)=F_X(b)-F_X(a-1)\), siendo \(a-1\) el punto inmediatamente anterior a \(a\).

4.4.1 Ejercicio

Escriba en términos de la función de distribución las probabilidades obtenidas en el ejemplo de la suma de dos dados.
Escriba en términos de la función de distribución, teniendo en cuenta los dos casos, v.a continua o discreta, las siguientes probabilidades:

\(P(a\leq X<b)\)
\(P(a<X\leq b)\)
\(P(a<X<b)\)
\(P(X\geq b)\)
\(P(X>b)\)

5 El valor esperado (\(E(X)=\mu\))

El valor esperado de una función, cumple el mismo papel del promedio en una muestra, pero esta vez a nivel poblacional, es decir, es el centro de gravedad de todos los posibles datos de una variable. Su cálculo depende de la naturaleza de la variable:

Discreta: \(E(X)=\sum x_if_X(x_i)\)
Continua: \(E(X)=\int xf_X(x)dx\)

5.1 Propiedades

\(\min X\leq E(X)\leq\max X\)
\(E(k)=k\), con \(k\) constante
\(E(X+k)=E(X)+k\)
\(E(kX)=kE(X)\)
Si \(X_1, X_2,...,X_m\) son variables aleatorias, \(E\left(\sum_{i=1}^{m}X_j\right)=\sum_{i=1}^{m}E(X_j)\)

En general, es posible calcular el valor esperado de cualquier función \(g(.)\) de \(X\), nuevamente su cálculo depende de la naturaleza de la variable :

Discreta: \(E(g(X))=\sum g(x_i)f_X(x_i)\)
Continua: \(E(g(X))=\int g(x)f_X(x)dx\)

Para reflexionar: \(E(X-\mu)=?\)

5.1.1 Para reflexionar

¿En dónde se ubicarían los promedios de las siguientes distribuciones?

par(mfrow=c(1,2))
curve(dchisq(x, df = 4),col = 3, lwd = 2, from=0, to=9, ylab="f(x)", ylim=c(0,0.2))
curve(dnorm(x, mean=4, sd=2), col=2, lwd = 2, from=-1, to=9,ylab="f(x)")

Ejercicio: Calcular el valor esperado para la suma de dos dados

6 La Varianza

Al igual que en el caso muestral, la varianza es una medida de dispersión, pero en este caso de poblacional, la cual mide las distancia entre los valores que puede tomar la variable y su valor esperado. Se define como:

\[V(X)=E((X-\mu)^2)\]

6.1 Propiedades

\(V(X)\geq 0\)
\(V(k)=0\), con \(k\) constante
\(V(X+k)=V(X)\), con \(k\) constante
\(V(kX)=k^2V(X)\), con \(k\) constante
Si \(X_1, X_2,...,X_m\) son variables aleatorias independientes, \(V\left(\sum_{i=1}^{m}X_j\right)=\sum_{i=1}^{m}V(X_j)\)

6.1.1 Para reflexionar

¿Cuál de las tres distribuciones tiene mayor varianza?

curve(dnorm(x, mean=4, sd=2), col=2, lwd = 2, from=-3, to=11,ylab="f(x)")
curve(dnorm(x, mean=4, sd=4), col=3, lwd = 2, from=-3, to=11,ylab="f(x)",add=T)
curve(dnorm(x, mean=4, sd=6), col=4, lwd = 2, from=-3, to=11,ylab="f(x)",add=T)

7 Los momentos

Existen dos tipos de momentos: centrales y no centrales. Al igual que en la parte descriptiva, su finalidad es la de conocer la centralidad, la variabilidad o la forma de una distribución.

Momento central de orden r: \(\mu_r=E((X-\mu)^r)\)
Momento no central de orden r: \(\mu^,_r=E(X^r)\)

7.1 Ejercicio

Identifique a qué momentos corresponden el valor esperado y la varianza.

7.2 Función generadora de momentos

La función generadora de momentos de una variable aleatoria, al igual que la función de distribución, identifica plenamente la distribución de dicha variable, se podría decir que es casi como una huella digital de la misma. Por definición, la función generadora de momentos corresponde a:

\[m_X(t)=E(e^{tX})\]

Su nombre se le atribuye al hecho de que a partir de ella es posible determinar los momentos de una v.a., así:

\[m'_X(0)=m_1\] \[m''_X(0)=m_2\] \[m^{(r)}(0)=m_r\]

donde \(m^{(r)}(0)\) es la \(r\)-ésima derivada de la función generadora de momentos evaluada en \(t=0\).

8 Los percentiles

Son valores de la variable (percentiles, \(P_t\)) que delimitan superiormente una probabilidad determinada.

\[P_t=\left\lbrace\ x| F_X(x)=t/100\right\rbrace\] ## Ejercicio

Calcule los cuartiles para la suma de dos dados.

9 Bibliografía

Barón F.J. Bioestadística. Universidad de Málaga. http://www.bioestadistica.uma.es/baron/bioestadistica.pdf
Soto O, Franco D. Fundamentos conceptuales de estadística. Universidad Nacional de Colombia. Notas de clase.
Blanco L. Probabilidad. Universidad Nacional de Colombia.

Variables aleatorias

Lina Angélica Buitrago Reyes - lina.buitrago2@unisabana.edu.co