Una Representación Geométrica de la Desigualdad de Markov

Una de las desigualdades más importantes en la estadística es la famosa Desigualdad de Markov (Markov’s inequality en inglés). Esta desigualdad es muy sencilla de representar matemáticamente, y relaciona el concepto de una probabilidad en las colas y la esperanza de una variable aleatoria (v.a). Buscaremos hacer una explicación geométrica de como se representa esta desigualdad y la relación de sus miembros, y así, profundizar más en tan importante teorema.

Empezamos definiendo una variable aleatoria \(X\), no-negativa, y cuya esperanza, \(E(X)<\infty\), exista. Para cualquier número real \(t>0\), la desigualdad de Markov establece lo siguiente:

\[ P(X \geq t)\leq \dfrac{E(X)}{t}\]

Sin perdidad de generalidad, asumamos una v.a \(X\) continua no-negativa (también pude asumirse para la forma discreta). Dado que \(X \geq 0\), por definición de esperanza de una v.a continua:

\[E(X)=\int^{\infty}_{0}xf(x)dx\]

Dividimos los limites de integración de tal forma que,

\[E(X)= \int^{t}_{0}xf(x)dx + \int^{\infty}_{t}xf(x)dx\]

Como \(\int^{t}_{0}xf(x)dx>0\), entonces:

\[E(X) \geq \int^{\infty}_{t}xf(x)dx\]

Como \(X>t\), entonces \(\int^{\infty}_{t}xf(x)dx \geq \int^{\infty}_{t}tf(x)dx\), con lo cual,

\[E(X) \geq \int^{\infty}_{t}tf(x)dx = t\int^{\infty}_{t}f(x)dx \]

La integral definida en intervalo \(<t,\infty>\), pude escribirse como \(\int^{\infty}_{t}f(x)dx=P(X>t)\). Con lo cual,

\[E(X) \geq tP(X \geq t)\] \[P(X \geq t) \leq \dfrac{E(X)}{t}\]

Por lo tanto se cumple la desigualdad.

Simulación de la variable aleatoria X

A partir de la demostración formal, pondremos nuestro esfuerzo en mostrar graficamente que sucede en el interior de esta desigualdad. De la demostración notemos lo siguiente:

\[tP(X \geq t) \leq E(X)\]

Recordemos que la esperanza de una variable aleatoria, tambien la podemos escribir en terminos de la función de distribución acumulada (ver Proposición 3.1, Intermediate Probability, Barry James-pag. 62).

\[ E(X) = \int^{\infty}_{0}(1-F(x))dx\]

Geométricamente, la integral se define como el área bajo la curva; y en este caso, el area bajo la curva descrita por \(1-F(x)\).

Representación geométrica

Para simular y representar graficamente lo planteado, supongamos \(X \sim N(0, 1)\), una variable aleatoria con distribucion normal con parámetros \(\mu=0\) y \(\sigma^2=1\).

set.seed(3000)
x <- seq(-4,4,.01) #cuantiles o valores de la variable aleatoria X
plot(x, dnorm(x, 0, 1), type="l",main = "Distribución Normal N(0,1)", xlab = "x", ylab="Probabilidad")

Ahora, graficamos las distribución acumulada \(F(x)\),

cumulative<- pnorm(x, 0, 1) # probabilidad acumulada en cada valor de X (Px)
plot(x, cumulative, col="darkorange", xlab="x", ylab="Probabilidad",type="l",lwd=2, cex=2, main="Función de Distribución Acumulada de la N(0,1)", cex.axis=.8)

De la definición alternativa de \(E(x)\) en terminos de la acumulada \(1-F(x)\) presentada lineas arriba, podemos visualizar la esperanza como el área bajo la curva,

#grafico de la esperanza = integral de 1-F(x)
expected <- 1-cumulative
plot(x, expected, col="blue", xlab="x", ylab="Probabilidad",type="l",lwd=2, cex=2, main="Esperanza de X", cex.axis=.8)
polygon(c(min(x),x),c(min(expected),expected), density = 5, angle = 45,col="blue")

Ahora, sea un \(t=1>0\), la cual representamos como una recta vertical roja

#grafico de la esperanza = integral de 1-F(x)
t <- 1
plot(x, expected, col="blue", xlab="x", ylab="Probabilidad",type="l",lwd=2, cex=2, main="Esperanza de X", cex.axis=.8)
polygon(c(min(x),x),c(min(expected),expected), density = 5, angle = 45,col="blue")
abline(v=t, col="red")
axis(side = 1, at = t)

Luego, hallamos la probabilidad \(P(X>1)= 1- P(X<=1)\),

t <- 1
Pt <- 1-pnorm(t);Pt

## [1] 0.1586553

Ahora, graficamos \(P(X \geq 1)\) con una recta horizontal roja,

#grafico de la esperanza = integral de 1-F(x)
plot(x, expected, col="blue", xlab="", ylab="Cumulative",type="l",lwd=2, cex=2, 
     main="Esperanza de X", cex.axis=.8, yaxt="n")
abline(v=t, col="red", lty=2)
axis(side = 1, at = c(0, t, 0.5, 1), las=2)
abline(h=Pt, col="red", lty=2)
axis(side = 2, at = round(Pt,2),tick = c(0,0.5,1))
polygon(c(min(x),x),c(min(expected),expected), density = 5, angle = 45,col="blue")

Sombreamos de rojo, el area de rojo definida por \(tP(X>t)\),

plot(x, expected, col="blue", xlab="x", ylab="Probabilidad",type="l",lwd=2, cex=2, main="Desigualdad de Markov", cex.axis=.8)
abline(v=t, col="red", lty=2)
abline(h=Pt, col="red", lty=2)
polygon(c(min(x),x),c(min(expected),expected), density = 5, angle = 45,col="blue")
usr <- par('usr')
rect(-4, 0, t , Pt, col='coral')

Se observa del gráfico, que cualquiera sea el valor de la probabilidad en las colas \(P(X>t)\), la esperanza, \(E(X)\), siempre va ser mayor, para cualquier valor de \(t>0\). El area sombreada de rojo siempre será menor al area sombreada de azul, sin importar el tamaño del rectangulo \(tP(X>t)\).

Comprobación numérica

A modo de comprobar numéricamente lo expuesto, realizamos los calculos de las areas sombreadas

Área del rectángulo \(t*P(X>t)\).

print("Calculo de t*P(X>t)", t*Pt)

## [1] "Calculo de t*P(X>t)"

Área definida por la \(E(X)\)

Los limites de integración de la simulación son \(\left[ -4,4 \right]\); entonces en R usaremos el comando integrate para el cálculo de la integral \(E(X) = \int^{4}_{-4}(1-F(x))dx\).

EX <- integrate(function(x) (1 - pnorm(x,0,1)) , -4, 4)$value
print("La esperanza o área bajo la curva es:", EX)

## [1] "La esperanza o área bajo la curva es:"

Por lo tanto se comprueba numericamente que \(t*P(X>t) \leq E(X)\).

Bibliografía

An Intermediate Probability Course, Barry James.
The Expected Value. https://www.math.arizona.edu/~jwatkins/H_expectedvalue.pdf
Notas del curso Fundamentos de Probabilidad. Jose Flores. Pontificia Universidad Católica del Perú (PUCP).
Finding-expected-values-of-random-variables https://mikmart.rbind.io/2018/02/17/finding-expected-values-of-random-variables/

Una Representación Geométrica de la Desigualdad de Markov

Omar E. Benites Alfaro

Simulación de la variable aleatoria X

Representación geométrica

Comprobación numérica

Bibliografía