Una de las desigualdades más importantes en la estadística es la famosa Desigualdad de Markov (Markov’s inequality en inglés). Esta desigualdad es muy sencilla de representar matemáticamente, y relaciona el concepto de una probabilidad en las colas y la esperanza de una variable aleatoria (v.a). Buscaremos hacer una explicación geométrica de como se representa esta desigualdad y la relación de sus miembros, y así, profundizar más en tan importante teorema.

Empezamos definiendo una variable aleatoria \(X\), no-negativa, y cuya esperanza, \(E(X)<\infty\), exista. Para cualquier número real \(t>0\), la desigualdad de Markov establece lo siguiente:

 \[ P(X \geq t)\leq \dfrac{E(X)}{t}\]

Sin perdidad de generalidad, asumamos una v.a \(X\) continua no-negativa (también pude asumirse para la forma discreta). Dado que \(X \geq 0\), por definición de esperanza de una v.a continua:

\[E(X)=\int^{\infty}_{0}xf(x)dx\]

Dividimos los limites de integración de tal forma que,

\[E(X)= \int^{t}_{0}xf(x)dx + \int^{\infty}_{t}xf(x)dx\]

Como \(\int^{t}_{0}xf(x)dx>0\), entonces:

\[E(X) \geq \int^{\infty}_{t}xf(x)dx\]

Como \(X>t\), entonces \(\int^{\infty}_{t}xf(x)dx \geq \int^{\infty}_{t}tf(x)dx\), con lo cual,

\[E(X) \geq \int^{\infty}_{t}tf(x)dx = t\int^{\infty}_{t}f(x)dx \]

La integral definida en intervalo \(<t,\infty>\), pude escribirse como \(\int^{\infty}_{t}f(x)dx=P(X>t)\). Con lo cual,

\[E(X) \geq tP(X \geq t)\] \[P(X \geq t) \leq \dfrac{E(X)}{t}\]

Por lo tanto se cumple la desigualdad.

Simulación de la variable aleatoria X

A partir de la demostración formal, pondremos nuestro esfuerzo en mostrar graficamente que sucede en el interior de esta desigualdad. De la demostración notemos lo siguiente:

\[tP(X \geq t) \leq E(X)\]

Recordemos que la esperanza de una variable aleatoria, tambien la podemos escribir en terminos de la función de distribución acumulada (ver Proposición 3.1, Intermediate Probability, Barry James-pag. 62).

\[ E(X) = \int^{\infty}_{0}(1-F(x))dx\]

Geométricamente, la integral se define como el área bajo la curva; y en este caso, el area bajo la curva descrita por \(1-F(x)\).

Representación geométrica

Para simular y representar graficamente lo planteado, supongamos \(X \sim N(0, 1)\), una variable aleatoria con distribucion normal con parámetros \(\mu=0\) y \(\sigma^2=1\).

set.seed(3000)
x <- seq(-4,4,.01) #cuantiles o valores de la variable aleatoria X
plot(x, dnorm(x, 0, 1), type="l",main = "Distribución Normal N(0,1)", xlab = "x", ylab="Probabilidad")

Ahora, graficamos las distribución acumulada \(F(x)\),

cumulative<- pnorm(x, 0, 1) # probabilidad acumulada en cada valor de X (Px)
plot(x, cumulative, col="darkorange", xlab="x", ylab="Probabilidad",type="l",lwd=2, cex=2, main="Función de Distribución Acumulada de la N(0,1)", cex.axis=.8)

De la definición alternativa de \(E(x)\) en terminos de la acumulada \(1-F(x)\) presentada lineas arriba, podemos visualizar la esperanza como el área bajo la curva,

#grafico de la esperanza = integral de 1-F(x)
expected <- 1-cumulative
plot(x, expected, col="blue", xlab="x", ylab="Probabilidad",type="l",lwd=2, cex=2, main="Esperanza de X", cex.axis=.8)
polygon(c(min(x),x),c(min(expected),expected), density = 5, angle = 45,col="blue")

Ahora, sea un \(t=1>0\), la cual representamos como una recta vertical roja

#grafico de la esperanza = integral de 1-F(x)
t <- 1
plot(x, expected, col="blue", xlab="x", ylab="Probabilidad",type="l",lwd=2, cex=2, main="Esperanza de X", cex.axis=.8)
polygon(c(min(x),x),c(min(expected),expected), density = 5, angle = 45,col="blue")
abline(v=t, col="red")
axis(side = 1, at = t)

Luego, hallamos la probabilidad \(P(X>1)= 1- P(X<=1)\),

t <- 1
Pt <- 1-pnorm(t);Pt
## [1] 0.1586553

Ahora, graficamos \(P(X \geq 1)\) con una recta horizontal roja,

#grafico de la esperanza = integral de 1-F(x)
plot(x, expected, col="blue", xlab="", ylab="Cumulative",type="l",lwd=2, cex=2, 
     main="Esperanza de X", cex.axis=.8, yaxt="n")
abline(v=t, col="red", lty=2)
axis(side = 1, at = c(0, t, 0.5, 1), las=2)
abline(h=Pt, col="red", lty=2)
axis(side = 2, at = round(Pt,2),tick = c(0,0.5,1))
polygon(c(min(x),x),c(min(expected),expected), density = 5, angle = 45,col="blue")

Sombreamos de rojo, el area de rojo definida por \(tP(X>t)\),

plot(x, expected, col="blue", xlab="x", ylab="Probabilidad",type="l",lwd=2, cex=2, main="Desigualdad de Markov", cex.axis=.8)
abline(v=t, col="red", lty=2)
abline(h=Pt, col="red", lty=2)
polygon(c(min(x),x),c(min(expected),expected), density = 5, angle = 45,col="blue")
usr <- par('usr')
rect(-4, 0, t , Pt, col='coral')

Se observa del gráfico, que cualquiera sea el valor de la probabilidad en las colas \(P(X>t)\), la esperanza, \(E(X)\), siempre va ser mayor, para cualquier valor de \(t>0\). El area sombreada de rojo siempre será menor al area sombreada de azul, sin importar el tamaño del rectangulo \(tP(X>t)\).

Comprobación numérica

A modo de comprobar numéricamente lo expuesto, realizamos los calculos de las areas sombreadas

print("Calculo de t*P(X>t)", t*Pt)
## [1] "Calculo de t*P(X>t)"

Los limites de integración de la simulación son \(\left[ -4,4 \right]\); entonces en R usaremos el comando integrate para el cálculo de la integral \(E(X) = \int^{4}_{-4}(1-F(x))dx\).

EX <- integrate(function(x) (1 - pnorm(x,0,1)) , -4, 4)$value
print("La esperanza o área bajo la curva es:", EX)
## [1] "La esperanza o área bajo la curva es:"

Por lo tanto se comprueba numericamente que \(t*P(X>t) \leq E(X)\).

Bibliografía