Una de las desigualdades más importantes en la estadística es la famosa Desigualdad de Markov (Markov’s inequality en inglés). Esta desigualdad es muy sencilla de representar matemáticamente, y relaciona el concepto de una probabilidad en las colas y la esperanza de una variable aleatoria (v.a). Buscaremos hacer una explicación geométrica de como se representa esta desigualdad y la relación de sus miembros, y así, profundizar más en tan importante teorema.
Empezamos definiendo una variable aleatoria \(X\), no-negativa, y cuya esperanza, \(E(X)<\infty\), exista. Para cualquier número real \(t>0\), la desigualdad de Markov establece lo siguiente:
\[ P(X \geq t)\leq \dfrac{E(X)}{t}\]
Sin perdidad de generalidad, asumamos una v.a \(X\) continua no-negativa (también pude asumirse para la forma discreta). Dado que \(X \geq 0\), por definición de esperanza de una v.a continua:
\[E(X)=\int^{\infty}_{0}xf(x)dx\]
Dividimos los limites de integración de tal forma que,
\[E(X)= \int^{t}_{0}xf(x)dx + \int^{\infty}_{t}xf(x)dx\]
Como \(\int^{t}_{0}xf(x)dx>0\), entonces:
\[E(X) \geq \int^{\infty}_{t}xf(x)dx\]
Como \(X>t\), entonces \(\int^{\infty}_{t}xf(x)dx \geq \int^{\infty}_{t}tf(x)dx\), con lo cual,
\[E(X) \geq \int^{\infty}_{t}tf(x)dx = t\int^{\infty}_{t}f(x)dx \]
La integral definida en intervalo \(<t,\infty>\), pude escribirse como \(\int^{\infty}_{t}f(x)dx=P(X>t)\). Con lo cual,
\[E(X) \geq tP(X \geq t)\] \[P(X \geq t) \leq \dfrac{E(X)}{t}\]
Por lo tanto se cumple la desigualdad.
A partir de la demostración formal, pondremos nuestro esfuerzo en mostrar graficamente que sucede en el interior de esta desigualdad. De la demostración notemos lo siguiente:
\[tP(X \geq t) \leq E(X)\]
Recordemos que la esperanza de una variable aleatoria, tambien la podemos escribir en terminos de la función de distribución acumulada (ver Proposición 3.1, Intermediate Probability, Barry James-pag. 62).
\[ E(X) = \int^{\infty}_{0}(1-F(x))dx\]
Geométricamente, la integral se define como el área bajo la curva; y en este caso, el area bajo la curva descrita por \(1-F(x)\).
Para simular y representar graficamente lo planteado, supongamos \(X \sim N(0, 1)\), una variable aleatoria con distribucion normal con parámetros \(\mu=0\) y \(\sigma^2=1\).
set.seed(3000)
x <- seq(-4,4,.01) #cuantiles o valores de la variable aleatoria X
plot(x, dnorm(x, 0, 1), type="l",main = "Distribución Normal N(0,1)", xlab = "x", ylab="Probabilidad")
Ahora, graficamos las distribución acumulada \(F(x)\),
cumulative<- pnorm(x, 0, 1) # probabilidad acumulada en cada valor de X (Px)
plot(x, cumulative, col="darkorange", xlab="x", ylab="Probabilidad",type="l",lwd=2, cex=2, main="Función de Distribución Acumulada de la N(0,1)", cex.axis=.8)
De la definición alternativa de \(E(x)\) en terminos de la acumulada \(1-F(x)\) presentada lineas arriba, podemos visualizar la esperanza como el área bajo la curva,
#grafico de la esperanza = integral de 1-F(x)
expected <- 1-cumulative
plot(x, expected, col="blue", xlab="x", ylab="Probabilidad",type="l",lwd=2, cex=2, main="Esperanza de X", cex.axis=.8)
polygon(c(min(x),x),c(min(expected),expected), density = 5, angle = 45,col="blue")
Ahora, sea un \(t=1>0\), la cual representamos como una recta vertical roja
#grafico de la esperanza = integral de 1-F(x)
t <- 1
plot(x, expected, col="blue", xlab="x", ylab="Probabilidad",type="l",lwd=2, cex=2, main="Esperanza de X", cex.axis=.8)
polygon(c(min(x),x),c(min(expected),expected), density = 5, angle = 45,col="blue")
abline(v=t, col="red")
axis(side = 1, at = t)
Luego, hallamos la probabilidad \(P(X>1)= 1- P(X<=1)\),
t <- 1
Pt <- 1-pnorm(t);Pt
## [1] 0.1586553
Ahora, graficamos \(P(X \geq 1)\) con una recta horizontal roja,
#grafico de la esperanza = integral de 1-F(x)
plot(x, expected, col="blue", xlab="", ylab="Cumulative",type="l",lwd=2, cex=2,
main="Esperanza de X", cex.axis=.8, yaxt="n")
abline(v=t, col="red", lty=2)
axis(side = 1, at = c(0, t, 0.5, 1), las=2)
abline(h=Pt, col="red", lty=2)
axis(side = 2, at = round(Pt,2),tick = c(0,0.5,1))
polygon(c(min(x),x),c(min(expected),expected), density = 5, angle = 45,col="blue")
Sombreamos de rojo, el area de rojo definida por \(tP(X>t)\),
plot(x, expected, col="blue", xlab="x", ylab="Probabilidad",type="l",lwd=2, cex=2, main="Desigualdad de Markov", cex.axis=.8)
abline(v=t, col="red", lty=2)
abline(h=Pt, col="red", lty=2)
polygon(c(min(x),x),c(min(expected),expected), density = 5, angle = 45,col="blue")
usr <- par('usr')
rect(-4, 0, t , Pt, col='coral')
Se observa del gráfico, que cualquiera sea el valor de la probabilidad en las colas \(P(X>t)\), la esperanza, \(E(X)\), siempre va ser mayor, para cualquier valor de \(t>0\). El area sombreada de rojo siempre será menor al area sombreada de azul, sin importar el tamaño del rectangulo \(tP(X>t)\).
A modo de comprobar numéricamente lo expuesto, realizamos los calculos de las areas sombreadas
print("Calculo de t*P(X>t)", t*Pt)
## [1] "Calculo de t*P(X>t)"
Los limites de integración de la simulación son \(\left[ -4,4 \right]\); entonces en R usaremos el comando integrate
para el cálculo de la integral \(E(X) = \int^{4}_{-4}(1-F(x))dx\).
EX <- integrate(function(x) (1 - pnorm(x,0,1)) , -4, 4)$value
print("La esperanza o área bajo la curva es:", EX)
## [1] "La esperanza o área bajo la curva es:"
Por lo tanto se comprueba numericamente que \(t*P(X>t) \leq E(X)\).