Variable aleatoria

Variables aleatorias

Introducción

Como resultado de los experimentos aleatorios se obtienen o se expresan los resultados valores numéricos, dichos resultados es posible expresarlos como variables aleatorias (va), y según si ésta es discreta o continua, se puede describir su comportamiento probabilístico a partir de las funciones de probabilidad o de densidad. Además, a partir de esta función es posible calcular las medidas de tendencia central, de variabilidad, de localización y de forma a nivel poblacional; estos valores son denominados parámetros.

Definiciones previas

Espacio de probabilidad

Un espacio de probabilidad es una terna de elementos \((\Omega, \mathcal{F}, \mathbf{Prob})\).

Ejemplo

Al lanzar dos dados distinguibles, se obtiene como resultado cualquiera de los puntos muestrales del siguiente espacio de probabilidad.

Omega <- c(
            "(1,1)","(1,2)","(1,3)","(1,4)","(1,5)","(1,6)",
            "(2,1)","(2,2)","(2,3)","(2,4)","(2,5)","(2,6)",
            "(3,1)","(3,2)","(3,3)","(3,4)","(3,5)","(3,6)",
            "(4,1)","(4,2)","(4,3)","(4,4)","(4,5)","(4,6)",
            "(5,1)","(5,2)","(5,3)","(5,4)","(5,5)","(5,6)",
            "(6,1)","(6,2)","(6,3)","(6,4)","(6,5)","(6,6)"
          )
Omega

##  [1] "(1,1)" "(1,2)" "(1,3)" "(1,4)" "(1,5)" "(1,6)" "(2,1)" "(2,2)" "(2,3)"
## [10] "(2,4)" "(2,5)" "(2,6)" "(3,1)" "(3,2)" "(3,3)" "(3,4)" "(3,5)" "(3,6)"
## [19] "(4,1)" "(4,2)" "(4,3)" "(4,4)" "(4,5)" "(4,6)" "(5,1)" "(5,2)" "(5,3)"
## [28] "(5,4)" "(5,5)" "(5,6)" "(6,1)" "(6,2)" "(6,3)" "(6,4)" "(6,5)" "(6,6)"

Variable aleatoria (va)

Una va \(X\) es una función cuyo dominio es \(\Omega\) y su recorrido es \(R\), es decir, que a cada evento \(\omega{\in}\Omega\) le es asignado un número real, de forma tal que la función inversa calculada en \(X\), un subconjunto de los reales, siempre pertenece a \(\mathcal{F}\).

\[X:\Omega\rightarrow\mathcal{R}\]

que asigna un número real \(X\left(\omega\right)\) a cada elemento \(\omega\) en el espacio de resultados. Las va’s pueden ser de dos tipos dependiendo su recorrido:

Discretas: Cuando su recorrido es numerable. Un buen ejemplo de variables discretas son los conteos, como el número de enfermos de coronavirus en un mes.
Continuas: Cuando su recorrido es no numerable, es decir cuando entre dos valores de la variable hay infinitos posibles valores de ésta, un ejemplo de ello es la tasa de mortalidad del coronavirus en un determinado mes.

Ejemplo

Supongamos el experimento \(E:=\text{Lanzamiento de dos monedas}\), con \(\Omega=\left\{\omega_1=(C,C),\omega_2=(C,S),\omega_3=(S,C),\omega_4=(S,S)\right\}\) y \(\mathcal{F}=\mathcal{P}(\Omega)\)

Si se define \(X[\omega_i]:\text{número de caras obtenidas en }\omega_i\), así:

\[X[(C,C)]=2\]

\[X[(C,S)]=X[(S,C)]=1\]

\[X[(S,S)]=0\]

Al calcular su función inversa se tiene lo siguiente:

\[X^{-1}[2]=(C,C)\in\mathcal{F}\]

\[X^{-1}[1]=\left\{(C,S),(S,C)\right\}\in\mathcal{F}\]

\[X^{-1}[0]=(S,S)\in\mathcal{F}\]

Esto se resume en que de una manera empirica se ha mostrado que \(X\) es una varaible aleatoria cuyo recorrido es numerable; por lotanto la va es discreta.

Ejemplo

library(prob)

## Loading required package: combinat

## 
## Attaching package: 'combinat'

## The following object is masked from 'package:utils':
## 
##     combn

## Loading required package: fAsianOptions

## Loading required package: timeDate

## Loading required package: timeSeries

## Loading required package: fBasics

## Loading required package: fOptions

## 
## Attaching package: 'prob'

## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, union

tosscoin(2, makespace = T)

Ejemplo

X <- NULL
for(i in 1:length(Omega)) X[i] <- sum(as.numeric(substr(Omega[i], 2, 2)),as.numeric(substr(Omega[i], 4, 4)))
X

##  [1]  2  3  4  5  6  7  3  4  5  6  7  8  4  5  6  7  8  9  5  6  7  8  9 10  6
## [26]  7  8  9 10 11  7  8  9 10 11 12

tail(rolldie(2, makespace = T))

#1/36

Función de probabilidad (f.d.p)}

Siendo \(X\) una va discreta, la f.d.p, \(f_{X}(x)\) es una función discreta que rige su comportamiento probabilístico; y debe cumplir con las siguientes propiedades:

\[\sum\limits_{{\forall}x\in\Omega}f_{X}(x)=1\] \[P(X=x_{i})=f_{X}(x_{i})\]

Ejemplo

La función de densidad de \(X:=\text{resultado de la suma de las caras que quedan hacia arriba en el lanzamiento de dos dados}\) esta determinada por la siguiente expresión:

\[f_{x}(x)=\frac{6-\left|7-x\right|}{36}\text{; para }x=2,3,\ldots,12\] La función de probabilidades esta determinada por el siguiente código en \(R\)

f <- function(x) (6-abs(7-x))/36

Otra forma alternativa de hallar la función de probabilidades para cada punto muestral es la siguiente:

p <- 1/length(Omega)
cat("La probabilidad para cada punto muestral es: ", p)

## La probabilidad para cada punto muestral es:  0.02777778

Asi que:

la probabilidad de obtener un dos es:

\[f_{x}(2)=\frac{6-\left|7-2\right|}{36}=\frac{6-\left|5\right|}{36}=\frac{6-5}{36}=\frac{1}{36}\]

f(2)

## [1] 0.02777778

1/36

## [1] 0.02777778

la probabilidad de obtener un tres es:

\[f_{x}(3)=\frac{6-\left|7-3\right|}{36}=\frac{6-\left|4\right|}{36}=\frac{6-4}{36}=\frac{2}{36}\]

f(3)

## [1] 0.05555556

2/36

## [1] 0.05555556

la probabilidad de obtener un cuatro es: también lo puedo obtener dividiendo tres entre treinta y seis

\[f_{x}(4)=\frac{6-\left|7-4\right|}{36}=\frac{6-\left|3\right|}{36}=\frac{6-3}{36}=\frac{3}{36}\]

f(4)

## [1] 0.08333333

3/36

## [1] 0.08333333

la probabilidad de obtener un cinco es:

\[f_{x}(5)=\frac{6-\left|7-5\right|}{36}=\frac{6-\left|2\right|}{36}=\frac{6-2}{36}=\frac{4}{36}\]

f(5)

## [1] 0.1111111

4/36

## [1] 0.1111111

la probabilidad de obtener un seis es:

\[f_{x}(6)=\frac{6-\left|7-6\right|}{36}=\frac{6-\left|1\right|}{36}=\frac{6-1}{36}=\frac{5}{36}\]

f(6)

## [1] 0.1388889

5/36

## [1] 0.1388889

la probabilidad de obtener un siete es:

\[f_{x}(7)=\frac{6-\left|7-7\right|}{36}=\frac{6-\left|0\right|}{36}=\frac{6-0}{36}=\frac{6}{36}\]

f(7)

## [1] 0.1666667

6/36

## [1] 0.1666667

la probabilidad de obtener un ocho es:

\[f_{x}(8)=\frac{6-\left|7-8\right|}{36}=\frac{6-\left|-1\right|}{36}=\frac{6-1}{36}=\frac{5}{36}\]

f(8)

## [1] 0.1388889

5/36

## [1] 0.1388889

la probabilidad de obtener un nueve es:

\[f_{x}(9)=\frac{6-\left|7-9\right|}{36}=\frac{6-\left|-2\right|}{36}=\frac{6-2}{36}=\frac{4}{36}\]

f(9)

## [1] 0.1111111

4/36

## [1] 0.1111111

la probabilidad de obtener un diez es:

\[f_{x}(10)=\frac{6-\left|7-10\right|}{36}=\frac{6-\left|-3\right|}{36}=\frac{6-3}{36}=\frac{3}{36}\]

f(10)

## [1] 0.08333333

3/36

## [1] 0.08333333

la probabilidad de obtener un once es:

\[f_{x}(11)=\frac{6-\left|7-11\right|}{36}=\frac{6-\left|-4\right|}{36}=\frac{6-4}{36}=\frac{2}{36}\]

f(11)

## [1] 0.05555556

2/36

## [1] 0.05555556

la probabilidad de obtener un doce es:

\[f_{x}(12)=\frac{6-\left|7-12\right|}{36}=\frac{6-\left|-5\right|}{36}=\frac{6-5}{36}=\frac{1}{36}\]

f(12)

## [1] 0.02777778

1/36

## [1] 0.02777778

La suma de todas las probabilidades de cada punto muestral debe ser igual igual a uno

\[\sum_{x=2}^{12}f_{x}(x)=\frac{6-\left|7-x\right|}{36}\]

f(2)+f(3)+f(4)+f(5)+f(6)+f(7)+f(8)+f(9)+f(10)+f(11)+f(12)

## [1] 1

sum(f(2:12))

## [1] 1

Y por ejemplo pueden calcularse probabilidades como las siguientes:

\(P(X{\leq}4.5)=P(X{\leq}4)\)

f(2) + f(3) + f(4)

## [1] 0.1666667

1/36 + 2/36 + 3/36

## [1] 0.1666667

O lo que es lo mismo

sum(subset(rolldie(2,makespace = T), X1 + X2 <= 4.5)$probs)

## [1] 0.1666667

sum(subset(rolldie(2,makespace = T), X1 + X2 < 4.5)$probs)

## [1] 0.1666667

\[P(X{\leq}4.5)=P(X=2{\cup}X=3{\cup}X=4)=f_{X}(2)+f_{X}(3)+f_{X}(4)\]

sum(f(2:4))

## [1] 0.1666667

(1+2+3)/36

## [1] 0.1666667

\(P(3{\leq}X{\leq}6)=\sum\limits_{x\in\left\{3,4,5,6\right\}}f_{X}(x)\)

f(3) + f(4) + f(5) + f(6)

## [1] 0.3888889

2/36 + 3/36 + 4/36 + 5/36

## [1] 0.3888889

O lo que es lo mismo

\[P(3{\leq}X{\leq}6)=P(X=3{\cup}X=4{\cup}X=5{\cup}X=6)=f_{X}(3)+f_{X}(4)+f_{X}(5)+f_{X}(6)\]

sum(subset(rolldie(2, makespace = T), 2 < X1 + X2 & X1 + X2 < 7)$probs)

## [1] 0.3888889

sum(subset(rolldie(2, makespace = T), 3 <= X1 + X2 & X1 + X2 <= 6)$probs)

## [1] 0.3888889

sum(f(3:6))

## [1] 0.3888889

(2+3+4+5)/36

## [1] 0.3888889

Redondeando, su función de probabilidad, de densidad o másica estaría dada numéricamente por lo siguiente:

F <- as.data.frame.ordered(table(X)/length(X))
colnames(F) <- c("P(x)")
F

x <- 2:12
fx <- f(x)
FX <- cbind.data.frame(x, fx)
tail(FX)

Graficamente se vería de la siguiente manera:

library(ggplot2)
ggplot(data = FX, aes(x = as.factor(x), y = fx)) +
geom_bar(stat="identity") +labs(x = "# obtenido al sumar las caras que quedan hacia arriba al lanzar dos dados") +
labs(y = "frecuencia relativa (fr)")

Función de densidad (f.d.d)}

Siendo \(X\) una va continua, la f.d.d, \(f_{X}(x)\) es una función discreta que rige su comportamiento probabilístico; y debe cumplir con las siguientes propiedades:

\[0{\leq}f_{X}(x){\leq}1\]

\[\int\limits_{{\forall}x{\in}\Omega}f_{X}(x)dx=1\] \[\int\limits_{x{\in}(a,b)}f_{X}(x)dx=P(a{\leq}X{\leq}b)\text{ con }a,b{\in}\mathcal{F}\]

Ejemplo

Suponga que \(X:\text{Estancia hospitalaria en días de un infectado por COVID-19}\), tiene la siguiente función de densidad:

\[f_{X}(x)=\frac{1}{15}e^{-\frac{1}{15}x}I_{(0,\infty)}(x)\]

x1 <- seq(0, 50, 0.01)
fx1 <- function(x) 1/15*exp(-1/15*x)
FX1 <- cbind.data.frame("tiempo que tarda en recuperarse" = x1, "probabilidad asociada" = fx1(x1))
#tail(FX1,4)

calcular la probabilidad de que un paciente tenga menos de 10 días de estancia hospitalaria.

library(dplyr)

## 
## Attaching package: 'dplyr'

## The following objects are masked from 'package:prob':
## 
##     intersect, setdiff, union

## The following objects are masked from 'package:timeSeries':
## 
##     filter, lag

## The following objects are masked from 'package:stats':
## 
##     filter, lag

## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union

library(ggplot2)
FX1 %>% mutate(`Probabilidad` = ifelse(0 <= `tiempo que tarda en recuperarse` & `tiempo que tarda en recuperarse` <= 10, "P(X<10)", "P(X>10)")) %>%
ggplot(aes(x = `tiempo que tarda en recuperarse`, y = `probabilidad asociada`, fill = `Probabilidad`)) +
geom_col(width = 0.01) +labs(x = "# de días hospitalizado hasta su recuperación de Covid-19") +
labs(y = "frecuencia relativa (fr)")

Numéricamente la probabilidad puede ser calculada mediante:

\[P_{X}(x<10)=\int_{0}^{10}\frac{1}{15}e^{-\frac{1}{15}x}dx\]

library(pracma)

## 
## Attaching package: 'pracma'

## The following object is masked from 'package:fAsianOptions':
## 
##     erf

## The following objects are masked from 'package:fBasics':
## 
##     akimaInterp, inv, kron, pascal

## The following object is masked from 'package:combinat':
## 
##     fact

integral(fun = fx1, xmin = 0, xmax = 10)

## [1] 0.4865829

la probabilidad de que un paciente tenga más de 10 días de estancia hospitalaria es dada por lo siguiente:

library(dplyr)
library(ggplot2)
FX1 %>% mutate(`Probabilidad` = ifelse(10 >= `tiempo que tarda en recuperarse`, "P(X>10)", "P(X<10)")) %>%
ggplot(aes(x = `tiempo que tarda en recuperarse`, y = `probabilidad asociada`, fill = `Probabilidad`)) +
geom_col(width = 0.01) +labs(x = "# de días hospitalizado hasta su recuperación de Covid-19") +
labs(y = "frecuencia relativa (fr)")

\[P_{X}(x>10)=\int_{10}^{\infty}\frac{1}{15}e^{-\frac{1}{15}x}dx\]

library(pracma)
integral(fun = fx1, xmin = 10, xmax = Inf)

## For infinite domains Gauss integration is applied!

## [1] 0.5134171

library(dplyr)
library(ggplot2)
p1 <- FX1 %>% mutate(`Probabilidad` = ifelse(0 <= `tiempo que tarda en recuperarse` & `tiempo que tarda en recuperarse` <= 50, "P(X<Inf)=1.0000000", "")) %>%
ggplot(aes(x = `tiempo que tarda en recuperarse`, y = `probabilidad asociada`, fill = `Probabilidad`)) +
geom_col(width = 0.01) + labs(x = "# de días hospitalizado hasta su recuperación de Covid-19") +
labs(y = "frecuencia relativa (fr)")

library(dplyr)
library(ggplot2)
p2 <- FX1 %>% mutate(`Probabilidad` = ifelse(0 <= `tiempo que tarda en recuperarse` & `tiempo que tarda en recuperarse` <= 10, "P(X<10)=0.4865829", "P(X>10)1-0.4865829")) %>%
ggplot(aes(x = `tiempo que tarda en recuperarse`, y = `probabilidad asociada`, fill = `Probabilidad`)) +
geom_col(width = 0.01) + labs(x = "# de días hospitalizado hasta su recuperación de Covid-19") +
labs(y = "frecuencia relativa (fr)")

library(gridExtra)

## 
## Attaching package: 'gridExtra'

## The following object is masked from 'package:dplyr':
## 
##     combine

grid.arrange(p1, p2, nrow = 2, top = "Distribución exponencial")

\[P_{X}(x>10)+P_{X}(x{\leq}10)=1\]

\[P_{X}(x>10)+P_{X}(x{\leq}10)-P_{X}(x{\leq}10)=1-P_{X}(x{\leq}10)\]

\[P_{X}(x>10)=1-P_{X}(x{\leq}10)\]

\[1-P_{X}(x{\leq}10)=1-\int_{0}^{10}\frac{1}{15}e^{-\frac{1}{15}x}dx\]

library(pracma)
1 - integral(fun = fx1, xmin = 0, xmax = 10)

## [1] 0.5134171

1-0.4865829

## [1] 0.5134171

la probabilidad de que un paciente tenga exáctamente 10 días de estancia hospitalaria es dada por lo siguiente:

library(dplyr)
library(ggplot2)
FX1 %>% mutate(`Probabilidad` = ifelse(10-0.5 <= `tiempo que tarda en recuperarse` & `tiempo que tarda en recuperarse` <= 10+0.5, "P(X=10)", "P(X!=10)")) %>%
ggplot(aes(x = `tiempo que tarda en recuperarse`, y = `probabilidad asociada`, fill = `Probabilidad`)) +
geom_col(width = 0.01) +labs(x = "# de días hospitalizado hasta su recuperación de Covid-19") +
labs(y = "frecuencia relativa (fr)")

\[P_{X}(x=10)\approx\int_{10-0.5}^{10+0.5}\frac{1}{15}e^{-\frac{1}{15}x}dx\]

library(pracma)
integral(fun = fx1, xmin = 10-0.5, xmax = 10+0.5)

## [1] 0.03423415

dexp(x = 10, rate = 1/15)

## [1] 0.03422781

Función de distribución

La función de distribución de una va \(X\) es aquella que calcula la probabilidad acumulada hasta un punto \(x\), es decir:

La función de distribución acumulada es la función

\[P_{X}(x):R\rightarrow[0,1]\]

es definida como:

\[F_X(x)=P(X{\leq}x)\]

Así;

Cuando X es continua,

\[P(a{\leq}X{\leq}b)=F_X(b)−F_X(a)\]

Ejemplo

La probabilidad de que un paciente se recupere en un tiempo de 10 a 20 dias

\[P_{X}(10<x<20)=\int_{10}^{20}\frac{1}{15}e^{-\frac{1}{15}x}dx\]

library(dplyr)
library(ggplot2)
FX1 %>% mutate(`Probabilidad` = ifelse(10 <= `tiempo que tarda en recuperarse` & `tiempo que tarda en recuperarse` <= 20, "P(10<X<20)", "P(X<10 o X>20)")) %>%
ggplot(aes(x = `tiempo que tarda en recuperarse`, y = `probabilidad asociada`, fill = `Probabilidad`)) +
geom_col(width = 0.01) +labs(x = "# de días hospitalizado hasta su recuperación de Covid-19") +
labs(y = "frecuencia relativa (fr)")

library(pracma)
integral(fun = fx1, xmin = 10, xmax = 20)

## [1] 0.24982

\[P_{X}(10<x<20)=P_{X}(x<20)-P_{X}(x<10)=\int_{0}^{20}\frac{1}{15}e^{-\frac{1}{15}x}dx-\int_{0}^{10}\frac{1}{15}e^{-\frac{1}{15}x}dx\]

library(dplyr)
library(ggplot2)
p1 <- FX1 %>% mutate(`Probabilidad` = ifelse(0 <= `tiempo que tarda en recuperarse` & `tiempo que tarda en recuperarse` <= 20, "P(X<20)", "P(X>20)")) %>%
ggplot(aes(x = `tiempo que tarda en recuperarse`, y = `probabilidad asociada`, fill = `Probabilidad`)) +
geom_col(width = 0.01) + labs(x = "# de días hospitalizado hasta su recuperación de Covid-19") +
labs(y = "frecuencia relativa (fr)")

library(dplyr)
library(ggplot2)
p2 <- FX1 %>% mutate(`Probabilidad` = ifelse(0 <= `tiempo que tarda en recuperarse` & `tiempo que tarda en recuperarse` <= 10, "P(X<10)", "P(X>10)")) %>%
ggplot(aes(x = `tiempo que tarda en recuperarse`, y = `probabilidad asociada`, fill = `Probabilidad`)) +
geom_col(width = 0.01) + labs(x = "# de días hospitalizado hasta su recuperación de Covid-19") +
labs(y = "frecuencia relativa (fr)")

library(gridExtra)
grid.arrange(p1, p2, nrow = 2, top = "Distribución exponencial")

library(pracma)
integral(fun = fx1, xmin = 0, xmax = 20) - integral(fun = fx1, xmin = 0, xmax = 10)

## [1] 0.24982

Cuando X es discreta

\[P(a{\leq}X{\leq}b)=F_X(b)−F_X(a−1)\]

La probabilidad de que la suma de los dados este entre 4 y 6

\[P(4{\leq}X{\leq}6)=F_X(6)−F_X(4−1)=\sum_{x=2}^{6}f_{x}(x)-\sum_{x=2}^{4-1}f_{x}(x)=\sum_{x=2}^{6}\frac{6-\left|7-x\right|}{36}-\sum_{x=2}^{4-1}\frac{6-\left|7-x\right|}{36}\]

f <- function(x) (6-abs(7-x))/36 
(f(2)+f(3)+f(4)+f(5)+f(6))-(f(2)+f(3))

## [1] 0.3333333

sum(f(0:6))-sum(f(0:(4-1)))

## [1] 0.3333333

f(4)+f(5)+f(6)

## [1] 0.3333333

Valor esperado

El valor esperado de una función, cumple el mismo papel del promedio en una muestra, pero esta vez a nivel poblacional, es decir, es el centro de gravedad de todos los posibles datos de una variable. Su cálculo depende de la naturaleza de la variable:

Discreta

\[E(X)=\sum\limits_{{\forall}x_i\in\Omega}x_i{\times}f_{X}(x_i)\]

Ejemplo

2*f(2)+3*f(3)+4*f(4)+5*f(5)+6*f(6)+7*f(7)+8*f(8)+9*f(9)+10*f(10)+11*f(11)+12*f(12)

## [1] 7

hx <- function(x) x*(6-abs(7-x))/36
Ex <- sum(hx(2:12))
Ex

## [1] 7

Continua

\[E(X)=\int\limits_{{\forall}x_i\in\Omega}x_i{\times}f_{X}(x_i)dx\]

library(pracma)
ix1 <- function(x) x*1/15*exp(-1/15*x) 
Ex1 <- integral(fun = ix1, xmin = 0, xmax = Inf)

## For infinite domains Gauss integration is applied!

Ex1

## [1] 15

Propiedades

\[min{X}{\leq}E(X){\leq}max{X}\]

Ejemplo

cat("min(X) = ", min(x), "<", "E(X) = " ,Ex,"<", "max(X) = ", max(x))

## min(X) =  2 < E(X) =  7 < max(X) =  12

cat("min(X) = ", min(x1), "<", "E(X) = " ,Ex1,"<", "max(X) = ", max(x1))

## min(X) =  0 < E(X) =  15 < max(X) =  50

\[E(k)=k\text{, con k constante}\]

k <- 17
jx <- function(x) k*(6-abs(7-x))/36
Ec <- sum(jx(2:12))
Ec

## [1] 17

library(pracma)
k <- 115
kx1 <- function(x) k*1/15*exp(-1/15*x) 
Ex1 <- integral(fun = kx1, xmin = 0, xmax = Inf)

## For infinite domains Gauss integration is applied!

Ex1

## [1] 115

\[E(X+k)=E(X)+k\text{, con k constante}\]

k <- 17
lx <- function(x) (x + k)*(6-abs(7-x))/36
Exmc <- sum(lx(2:12))
Exmc

## [1] 24

library(pracma)
k <- 115
mx1 <- function(x) (x + k)*1/15*exp(-1/15*x) 
Exmc1 <- integral(fun = mx1, xmin = 0, xmax = Inf)

## For infinite domains Gauss integration is applied!

Exmc1

## [1] 130

\[E(kX)=kE(X)\text{, con k constante}\]

k <- 17
nx <- function(x) (k*x)*(6-abs(7-x))/36
Exmc <- sum(nx(2:12))
Exmc

## [1] 119

library(pracma)
k <- 115
ox1 <- function(x) (k*x)*1/15*exp(-1/15*x) 
Exmc1 <- integral(fun = ox1, xmin = 0, xmax = Inf)

## For infinite domains Gauss integration is applied!

Exmc1

## [1] 1725

\[\text{Si }X_1,X_2,\ldots,X_m\text{ son variables aleatorias, }E(\sum_{i=1}^{m}X_j)=\sum_{i=1}^{m}E(X_j)\]

En general, es posible calcular el valor esperado de cualquier función g(.) de X, nuevamente su cálculo depende de la naturaleza de la variable :

Discreta:

\[E[g(X)]=\sum{g}(x_i)f_{X}(x_i)\]

Continua:

\[E(g(X))=\int{g}(x)fX(x)dx\]

Varianza

La varianza es una medida de dispersión, puede ser poblacional o muestral dependiendo de si se recolectó la información de la población o de una muestra o subconjunto de ella, y mide el promedio o valor esperado de las distancisa entre cada uno de los valores que puede tomar la variable y su valor esperado. Se define de la siguiente manera:

Discreta

\[V(X)=\sum\limits_{{\forall}x_i\in\Omega}\left[x_i-E(X)\right]^{2}f_{X}(x)\]

hx <- function(x) x*(6-abs(7-x))/36
Ex <- sum(hx(2:12))
print(paste("El valor esperado es igual a:", Ex))

## [1] "El valor esperado es igual a: 7"

ix <- function(x) ((x-Ex)**2)*(6-abs(7-x))/36
Vx <- sum(ix(2:12))
print(paste("La varianza es igual a:", Vx))

## [1] "La varianza es igual a: 5.83333333333333"

(2-Ex)**2*f(2)+(3-Ex)**2*f(3)+(4-Ex)**2*f(4)+(5-Ex)**2*f(5)+(6-Ex)**2*f(6)+(7-Ex)**2*f(7)+(8-Ex)**2*f(8)+(9-Ex)**2*f(9)+(10-Ex)**2*f(10)+(11-Ex)**2*f(11)+(12-Ex)**2*f(12)

## [1] 5.833333

Continua

\[V(X)=\int\limits_{{\forall}x_i\in\Omega}\left[x_i-E(X)\right]^{2}f_{X}(x_i)dx\]

library(pracma)
gx1 <- function(x) x*1/15*exp(-1/15*x) 
Ex1 <- integral(gx1, 0, Inf)

## For infinite domains Gauss integration is applied!

print(paste("El valor esperado es igual a:", Ex1))

## [1] "El valor esperado es igual a: 15"

hx1 <- function(x) ((x-Ex1)**2)*1/15*exp(-1/15*x)
Vx1 <- integral(hx1, 0, Inf)

## For infinite domains Gauss integration is applied!

print(paste("La varianza es igual a:", Vx1))

## [1] "La varianza es igual a: 225"

Propiedades

\[V(X){\geq}0\]

Vx >= 0

## [1] TRUE

Vx1 >= 0

## [1] TRUE

\[V(k)=0\text{, con k una constante o valor fijo}\]

k <- 10
hx <- function(x) k*(6-abs(7-x))/36
Ex <- sum(hx(2:12))
print(paste("El valor esperado es igual a:", Ex))

## [1] "El valor esperado es igual a: 10"

ix <- function(x) ((k-Ex)**2)*(6-abs(7-x))/36
Vx <- sum(ix(2:12))
print(paste("La varianza es igual a:", Vx))

## [1] "La varianza es igual a: 0"

library(pracma)
k <- 100
gx1 <- function(x) k*1/15*exp(-1/15*x) 
Ex1 <- integral(gx1, 0, Inf)

## For infinite domains Gauss integration is applied!

print(paste("El valor esperado es igual a:", Ex1))

## [1] "El valor esperado es igual a: 99.9999999999999"

hx1 <- function(x) ((k-Ex1)**2)*1/15*exp(-1/15*x)
Vx1 <- integral(hx1, 0, Inf)

## For infinite domains Gauss integration is applied!

print(paste("La varianza es igual a:", Vx1))

## [1] "La varianza es igual a: 2.03093370094964e-26"

\[V(X+k)=V(X)\text{, con k una constante o valor fijo}\]

k <- 10
hx <- function(x) (x+k)*(6-abs(7-x))/36
Ex <- sum(hx(2:12))
print(paste("El valor esperado es igual a:", Ex))

## [1] "El valor esperado es igual a: 17"

ix <- function(x) (((x+k)-Ex)**2)*(6-abs(7-x))/36
Vx <- sum(ix(2:12))
print(paste("La varianza es igual a:", Vx))

## [1] "La varianza es igual a: 5.83333333333333"

library(pracma)
k <- 100
gx1 <- function(x) (x+k)*1/15*exp(-1/15*x) 
Ex1 <- integral(gx1, 0, Inf)

## For infinite domains Gauss integration is applied!

print(paste("El valor esperado es igual a:", Ex1))

## [1] "El valor esperado es igual a: 115"

hx1 <- function(x) (((x+k)-Ex1)**2)*1/15*exp(-1/15*x)
Vx1 <- integral(hx1, 0, Inf)

## For infinite domains Gauss integration is applied!

print(paste("La varianza es igual a:", Vx1))

## [1] "La varianza es igual a: 225"

\[V(kX)=k^2V(X)\text{, con k una constante o valor fijo}\]

k <- 10
hx <- function(x) (k*x)*(6-abs(7-x))/36
Ex <- sum(hx(2:12))
print(paste("El valor esperado es igual a:", Ex))

## [1] "El valor esperado es igual a: 70"

ix <- function(x) (((k*x)-Ex)**2)*(6-abs(7-x))/36
Vx <- sum(ix(2:12))
print(paste("La varianza es igual a:", Vx))

## [1] "La varianza es igual a: 583.333333333333"

library(pracma)
k <- 100
gx1 <- function(x) (k*x)*1/15*exp(-1/15*x) 
Ex1 <- integral(gx1, 0, Inf)

## For infinite domains Gauss integration is applied!

print(paste("El valor esperado es igual a:", Ex1))

## [1] "El valor esperado es igual a: 1500"

hx1 <- function(x) (((k*x)-Ex1)**2)*1/15*exp(-1/15*x)
Vx1 <- integral(hx1, 0, Inf)

## For infinite domains Gauss integration is applied!

print(paste("La varianza es igual a:", Vx1))

## [1] "La varianza es igual a: 2250000"

\[\text{Si }X_1,X_2,\ldots,X_m\text{ son variables aleatorias independientes, }V\left[\sum_{i=1}X_j\right]=\sum_{i=1}V\left(X_j\right)\]

Momentos de una distribución de probabilidad

Existen dos tipos de momentos: centrales y no centrales. Al igual que en la parte descriptiva, su finalidad es la de conocer la centralidad, la variabilidad o la forma de una distribución.

Momento central de orden r

\[\mu_r=E\left[\left(X−\mu\right)^r\right]\]

\[\sigma_X^2=E\left[\left(X−\mu\right)^2\right]\]

hx <- function(x) x*(6-abs(7-x))/36
Ex <- sum(hx(2:12))
print(paste("El valor esperado es igual a:", Ex))

## [1] "El valor esperado es igual a: 7"

ix <- function(x,r=2) ((x-Ex)**r)*(6-abs(7-x))/36
Vx <- sum(ix(2:12))
print(paste("La varianza es igual a:", Vx))

## [1] "La varianza es igual a: 5.83333333333333"

library(pracma)
gx1 <- function(x) x*1/15*exp(-1/15*x) 
Ex1 <- integral(gx1, 0, Inf)

## For infinite domains Gauss integration is applied!

print(paste("El valor esperado es igual a:", Ex1))

## [1] "El valor esperado es igual a: 15"

hx1 <- function(x,r=2) ((x-Ex1)**r)*1/15*exp(-1/15*x)
Vx1 <- integral(hx1, 0, Inf)

## For infinite domains Gauss integration is applied!

print(paste("La varianza es igual a:", Vx1))

## [1] "La varianza es igual a: 225"

Momento no central de orden r

\[\mu_r=E\left[X^r\right]\]

Esperanza

\[\mu_X=E\left[X^1\right]\]

Varianza

\[\mu_2-\mu_1^2=E\left[X^2\right]-\left\{E\left[X^1\right]\right\}^2\]

Ejemplos

ix <- function(x,r=1) ((x)**r)*(6-abs(7-x))/36
Ex.1 <- sum(ix(2:12))
print(paste("El momento no central de orden uno es igual a:", Ex.1))

## [1] "El momento no central de orden uno es igual a: 7"

ix <- function(x,r=2) ((x)**r)*(6-abs(7-x))/36
Ex.2 <- sum(ix(2:12))
print(paste("El momento no central de orden dos es igual a:", Ex.2))

## [1] "El momento no central de orden dos es igual a: 54.8333333333333"

print(paste("La varianza es igual a:", Ex.2-Ex.1**2))

## [1] "La varianza es igual a: 5.83333333333334"

library(pracma)
hx1 <- function(x,r=1) ((x)**r)*1/15*exp(-1/15*x)
Ex.1 <- integral(hx1, 0, Inf)

## For infinite domains Gauss integration is applied!

print(paste("El momento no central de orden uno es igual a:", Ex.1))

## [1] "El momento no central de orden uno es igual a: 15"

hx1 <- function(x,r=2) ((x)**r)*1/15*exp(-1/15*x)
Ex.2 <- integral(hx1, 0, Inf)

## For infinite domains Gauss integration is applied!

print(paste("El momento no central de orden dos es igual a:", Ex.1))

## [1] "El momento no central de orden dos es igual a: 15"

print(paste("La varianza es igual a:", Ex.2-Ex.1**2))

## [1] "La varianza es igual a: 225"

Funciòn generadora de momentos

La función generadora de momentos de una variable aleatoria, al igual que la función de distribución, identifica plenamente la distribución de dicha variable, se podría decir que es casi como una huella digital de la misma. Por definición, la función generadora de momentos corresponde a:

\[m_{X}\left(t\right)=E\left(e^{tX}\right)\text{, }t{\in}\mathbf{R}\]

Su nombre se le atribuye al hecho de que a partir de ella es posible determinar los momentos de una va, así:

\[\frac{d}{dx}m_{X}\left(0\right)=m_1\]

\[\frac{d}{dx^2}m_{X}\left(0\right)=m_2\]

y en general

\[\frac{d}{dx^r}m_{X}\left(0\right)=m_r\]

Cuantiles y percentiles

Sea \(X\) una variable aleatoria con FDA \(P_X\). La función de distribución acumulada inversa o función de cuantiles. Son valores de la variable (percentiles, \(P_t\)) que delimitan superiormente una probabilidad determinada.

\[P_{X}^{−1}(q)=inf\left\{x:PX(x)>q\right\}\text{ para }q{\in}[0,1]\]

Llamamos a \(P^{−1}(1/4)\) el primer cuartil, a \(P^{−1}(1/2)\) la mediana y \(P^{−1}(3/4)\) el tercer cuartil.

\[P_t=\left\{ x:F_X(x)=\frac{t}{100}\right\}\]

Ejercicio

dias.hospitalizado <- rexp(n = 100000,rate = 1/15)
quantile(x = dias.hospitalizado, c(0.5))

##      50% 
## 10.40073

Ejercicio

De una mazo de 52 cartas, en una baraja francesa, describir esquemáticamente el espacio muestral \(\Omega\). Determinar cuantos elementos tendría el conjunto \(\mathcal{F}\) y calcular las siguientes probabilidades:

Omega <- cards(makespace = TRUE)
summary(Omega$suit)

##    Club Diamond   Heart   Spade 
##      13      13      13      13

summary(Omega$rank)

##  2  3  4  5  6  7  8  9 10  J  Q  K  A 
##  4  4  4  4  4  4  4  4  4  4  4  4  4

Que una carta sea de corazón.

Casos favorables

A <- subset(Omega, suit == "Heart")
tail(A)

nrow(A)

## [1] 13

Casos posibles

nrow(Omega)

## [1] 52

Probabilidad de A

Prob(A)

## [1] 0.25

nrow(A)/nrow(Omega)

## [1] 0.25

Que una carta este entre siete y nueve.

Casos favorables

B <- subset(Omega, rank %in% 7:9)
head(B)

nrow(B)

## [1] 12

Casos posibles

nrow(Omega)

## [1] 52

Probabilidad de B

Prob(B)

## [1] 0.2307692

nrow(B)/nrow(Omega)

## [1] 0.2307692

Que una carta no sea de corazón.

Casos favorables

C <- subset(Omega, suit != "Heart")
tail(C)

nrow(C)

## [1] 39

Casos posibles

nrow(Omega)

## [1] 52

Probabilidad de C

Prob(C)

## [1] 0.75

nrow(C)/nrow(Omega)

## [1] 0.75

Que una carta sea de espada.

Casos favorables

D <- subset(Omega, suit == "Spade")
tail(D)

nrow(D)

## [1] 13

Casos posibles

nrow(Omega)

## [1] 52

Probabilidad de D

Prob(D)

## [1] 0.25

nrow(D)/nrow(Omega)

## [1] 0.25

Que una carta no sea de espada.

Casos favorables

E <- subset(Omega, suit != "Spade")
tail(E)

nrow(E)

## [1] 39

Casos posibles

nrow(Omega)

## [1] 52

Probabilidad de D

Prob(E)

## [1] 0.75

nrow(E)/nrow(Omega)

## [1] 0.75

Que una carta sea de corazón o espada.

Casos favorables

F <- subset(Omega, suit %in% c("Heart","Spade"))
tail(F)

nrow(F)

## [1] 26

Casos posibles

head(Omega)

Probabilidad de D

Prob(F)

## [1] 0.5

nrow(F)/nrow(Omega)

## [1] 0.5

Que una carta sea J, Q, K o A.

Casos favorables

G <- subset(Omega, rank %in% c("J","Q","K","A"))
tail(G)

nrow(G)

## [1] 16

Casos posibles

nrow(Omega)

## [1] 52

Probabilidad de D

Prob(G)

## [1] 0.3076923

nrow(G)/nrow(Omega)

## [1] 0.3076923

Que una carta sea de diamante y al tiempo sea J, Q, K o A.

Casos favorables

H <- subset(Omega, suit == "Diamond" & rank %in% c("J","Q","K","A"))
head(H)

nrow(H)

## [1] 4

Casos posibles

nrow(Omega)

## [1] 52

Probabilidad de B

Prob(H)

## [1] 0.07692308

nrow(H)/nrow(Omega)

## [1] 0.07692308

Variable aleatoria

M Sc. Mario Gregorio Saavedra Rodríguez

26/3/2020

Variables aleatorias

Introducción

Definiciones previas

Espacio de probabilidad

Ejemplo

Variable aleatoria (va)

Ejemplo

Ejemplo

Ejemplo

Función de probabilidad (f.d.p)}

Ejemplo

Función de densidad (f.d.d)}

Ejemplo

Función de distribución

Ejemplo

Valor esperado

Ejemplo

Propiedades

Ejemplo

Varianza

Propiedades

Momentos de una distribución de probabilidad

Momento central de orden r

Momento no central de orden r

Esperanza

Varianza

Ejemplos

Funciòn generadora de momentos

Cuantiles y percentiles

Ejercicio

Ejercicio