Como resultado de los experimentos aleatorios se obtienen o se expresan los resultados valores numéricos, dichos resultados es posible expresarlos como variables aleatorias (va), y según si ésta es discreta o continua, se puede describir su comportamiento probabilístico a partir de las funciones de probabilidad o de densidad. Además, a partir de esta función es posible calcular las medidas de tendencia central, de variabilidad, de localización y de forma a nivel poblacional; estos valores son denominados parámetros.
Un espacio de probabilidad es una terna de elementos \((\Omega, \mathcal{F}, \mathbf{Prob})\).
Al lanzar dos dados distinguibles, se obtiene como resultado cualquiera de los puntos muestrales del siguiente espacio de probabilidad.
Omega <- c(
"(1,1)","(1,2)","(1,3)","(1,4)","(1,5)","(1,6)",
"(2,1)","(2,2)","(2,3)","(2,4)","(2,5)","(2,6)",
"(3,1)","(3,2)","(3,3)","(3,4)","(3,5)","(3,6)",
"(4,1)","(4,2)","(4,3)","(4,4)","(4,5)","(4,6)",
"(5,1)","(5,2)","(5,3)","(5,4)","(5,5)","(5,6)",
"(6,1)","(6,2)","(6,3)","(6,4)","(6,5)","(6,6)"
)
Omega
## [1] "(1,1)" "(1,2)" "(1,3)" "(1,4)" "(1,5)" "(1,6)" "(2,1)" "(2,2)" "(2,3)"
## [10] "(2,4)" "(2,5)" "(2,6)" "(3,1)" "(3,2)" "(3,3)" "(3,4)" "(3,5)" "(3,6)"
## [19] "(4,1)" "(4,2)" "(4,3)" "(4,4)" "(4,5)" "(4,6)" "(5,1)" "(5,2)" "(5,3)"
## [28] "(5,4)" "(5,5)" "(5,6)" "(6,1)" "(6,2)" "(6,3)" "(6,4)" "(6,5)" "(6,6)"
Una va \(X\) es una función cuyo dominio es \(\Omega\) y su recorrido es \(R\), es decir, que a cada evento \(\omega{\in}\Omega\) le es asignado un número real, de forma tal que la función inversa calculada en \(X\), un subconjunto de los reales, siempre pertenece a \(\mathcal{F}\).
\[X:\Omega\rightarrow\mathcal{R}\]
que asigna un número real \(X\left(\omega\right)\) a cada elemento \(\omega\) en el espacio de resultados. Las va’s pueden ser de dos tipos dependiendo su recorrido:
Discretas: Cuando su recorrido es numerable. Un buen ejemplo de variables discretas son los conteos, como el número de enfermos de coronavirus en un mes.
Continuas: Cuando su recorrido es no numerable, es decir cuando entre dos valores de la variable hay infinitos posibles valores de ésta, un ejemplo de ello es la tasa de mortalidad del coronavirus en un determinado mes.
Supongamos el experimento \(E:=\text{Lanzamiento de dos monedas}\), con \(\Omega=\left\{\omega_1=(C,C),\omega_2=(C,S),\omega_3=(S,C),\omega_4=(S,S)\right\}\) y \(\mathcal{F}=\mathcal{P}(\Omega)\)
Si se define \(X[\omega_i]:\text{número de caras obtenidas en }\omega_i\), así:
\[X[(C,C)]=2\]
\[X[(C,S)]=X[(S,C)]=1\]
\[X[(S,S)]=0\]
Al calcular su función inversa se tiene lo siguiente:
\[X^{-1}[2]=(C,C)\in\mathcal{F}\]
\[X^{-1}[1]=\left\{(C,S),(S,C)\right\}\in\mathcal{F}\]
\[X^{-1}[0]=(S,S)\in\mathcal{F}\]
Esto se resume en que de una manera empirica se ha mostrado que \(X\) es una varaible aleatoria cuyo recorrido es numerable; por lotanto la va es discreta.
library(prob)
## Loading required package: combinat
##
## Attaching package: 'combinat'
## The following object is masked from 'package:utils':
##
## combn
## Loading required package: fAsianOptions
## Loading required package: timeDate
## Loading required package: timeSeries
## Loading required package: fBasics
## Loading required package: fOptions
##
## Attaching package: 'prob'
## The following objects are masked from 'package:base':
##
## intersect, setdiff, union
tosscoin(2, makespace = T)
X <- NULL
for(i in 1:length(Omega)) X[i] <- sum(as.numeric(substr(Omega[i], 2, 2)),as.numeric(substr(Omega[i], 4, 4)))
X
## [1] 2 3 4 5 6 7 3 4 5 6 7 8 4 5 6 7 8 9 5 6 7 8 9 10 6
## [26] 7 8 9 10 11 7 8 9 10 11 12
tail(rolldie(2, makespace = T))
#1/36
Siendo \(X\) una va discreta, la f.d.p, \(f_{X}(x)\) es una función discreta que rige su comportamiento probabilístico; y debe cumplir con las siguientes propiedades:
\[\sum\limits_{{\forall}x\in\Omega}f_{X}(x)=1\] \[P(X=x_{i})=f_{X}(x_{i})\]
La función de densidad de \(X:=\text{resultado de la suma de las caras que quedan hacia arriba en el lanzamiento de dos dados}\) esta determinada por la siguiente expresión:
\[f_{x}(x)=\frac{6-\left|7-x\right|}{36}\text{; para }x=2,3,\ldots,12\] La función de probabilidades esta determinada por el siguiente código en \(R\)
f <- function(x) (6-abs(7-x))/36
Otra forma alternativa de hallar la función de probabilidades para cada punto muestral es la siguiente:
p <- 1/length(Omega)
cat("La probabilidad para cada punto muestral es: ", p)
## La probabilidad para cada punto muestral es: 0.02777778
Asi que:
\[f_{x}(2)=\frac{6-\left|7-2\right|}{36}=\frac{6-\left|5\right|}{36}=\frac{6-5}{36}=\frac{1}{36}\]
f(2)
## [1] 0.02777778
1/36
## [1] 0.02777778
\[f_{x}(3)=\frac{6-\left|7-3\right|}{36}=\frac{6-\left|4\right|}{36}=\frac{6-4}{36}=\frac{2}{36}\]
f(3)
## [1] 0.05555556
2/36
## [1] 0.05555556
\[f_{x}(4)=\frac{6-\left|7-4\right|}{36}=\frac{6-\left|3\right|}{36}=\frac{6-3}{36}=\frac{3}{36}\]
f(4)
## [1] 0.08333333
3/36
## [1] 0.08333333
\[f_{x}(5)=\frac{6-\left|7-5\right|}{36}=\frac{6-\left|2\right|}{36}=\frac{6-2}{36}=\frac{4}{36}\]
f(5)
## [1] 0.1111111
4/36
## [1] 0.1111111
\[f_{x}(6)=\frac{6-\left|7-6\right|}{36}=\frac{6-\left|1\right|}{36}=\frac{6-1}{36}=\frac{5}{36}\]
f(6)
## [1] 0.1388889
5/36
## [1] 0.1388889
\[f_{x}(7)=\frac{6-\left|7-7\right|}{36}=\frac{6-\left|0\right|}{36}=\frac{6-0}{36}=\frac{6}{36}\]
f(7)
## [1] 0.1666667
6/36
## [1] 0.1666667
\[f_{x}(8)=\frac{6-\left|7-8\right|}{36}=\frac{6-\left|-1\right|}{36}=\frac{6-1}{36}=\frac{5}{36}\]
f(8)
## [1] 0.1388889
5/36
## [1] 0.1388889
\[f_{x}(9)=\frac{6-\left|7-9\right|}{36}=\frac{6-\left|-2\right|}{36}=\frac{6-2}{36}=\frac{4}{36}\]
f(9)
## [1] 0.1111111
4/36
## [1] 0.1111111
\[f_{x}(10)=\frac{6-\left|7-10\right|}{36}=\frac{6-\left|-3\right|}{36}=\frac{6-3}{36}=\frac{3}{36}\]
f(10)
## [1] 0.08333333
3/36
## [1] 0.08333333
\[f_{x}(11)=\frac{6-\left|7-11\right|}{36}=\frac{6-\left|-4\right|}{36}=\frac{6-4}{36}=\frac{2}{36}\]
f(11)
## [1] 0.05555556
2/36
## [1] 0.05555556
\[f_{x}(12)=\frac{6-\left|7-12\right|}{36}=\frac{6-\left|-5\right|}{36}=\frac{6-5}{36}=\frac{1}{36}\]
f(12)
## [1] 0.02777778
1/36
## [1] 0.02777778
La suma de todas las probabilidades de cada punto muestral debe ser igual igual a uno
\[\sum_{x=2}^{12}f_{x}(x)=\frac{6-\left|7-x\right|}{36}\]
f(2)+f(3)+f(4)+f(5)+f(6)+f(7)+f(8)+f(9)+f(10)+f(11)+f(12)
## [1] 1
sum(f(2:12))
## [1] 1
Y por ejemplo pueden calcularse probabilidades como las siguientes:
f(2) + f(3) + f(4)
## [1] 0.1666667
1/36 + 2/36 + 3/36
## [1] 0.1666667
O lo que es lo mismo
sum(subset(rolldie(2,makespace = T), X1 + X2 <= 4.5)$probs)
## [1] 0.1666667
sum(subset(rolldie(2,makespace = T), X1 + X2 < 4.5)$probs)
## [1] 0.1666667
\[P(X{\leq}4.5)=P(X=2{\cup}X=3{\cup}X=4)=f_{X}(2)+f_{X}(3)+f_{X}(4)\]
sum(f(2:4))
## [1] 0.1666667
(1+2+3)/36
## [1] 0.1666667
f(3) + f(4) + f(5) + f(6)
## [1] 0.3888889
2/36 + 3/36 + 4/36 + 5/36
## [1] 0.3888889
O lo que es lo mismo
\[P(3{\leq}X{\leq}6)=P(X=3{\cup}X=4{\cup}X=5{\cup}X=6)=f_{X}(3)+f_{X}(4)+f_{X}(5)+f_{X}(6)\]
sum(subset(rolldie(2, makespace = T), 2 < X1 + X2 & X1 + X2 < 7)$probs)
## [1] 0.3888889
sum(subset(rolldie(2, makespace = T), 3 <= X1 + X2 & X1 + X2 <= 6)$probs)
## [1] 0.3888889
sum(f(3:6))
## [1] 0.3888889
(2+3+4+5)/36
## [1] 0.3888889
Redondeando, su función de probabilidad, de densidad o másica estaría dada numéricamente por lo siguiente:
F <- as.data.frame.ordered(table(X)/length(X))
colnames(F) <- c("P(x)")
F
x <- 2:12
fx <- f(x)
FX <- cbind.data.frame(x, fx)
tail(FX)
Graficamente se vería de la siguiente manera:
library(ggplot2)
ggplot(data = FX, aes(x = as.factor(x), y = fx)) +
geom_bar(stat="identity") +labs(x = "# obtenido al sumar las caras que quedan hacia arriba al lanzar dos dados") +
labs(y = "frecuencia relativa (fr)")
Siendo \(X\) una va continua, la f.d.d, \(f_{X}(x)\) es una función discreta que rige su comportamiento probabilístico; y debe cumplir con las siguientes propiedades:
\[0{\leq}f_{X}(x){\leq}1\]
\[\int\limits_{{\forall}x{\in}\Omega}f_{X}(x)dx=1\] \[\int\limits_{x{\in}(a,b)}f_{X}(x)dx=P(a{\leq}X{\leq}b)\text{ con }a,b{\in}\mathcal{F}\]
Suponga que \(X:\text{Estancia hospitalaria en días de un infectado por COVID-19}\), tiene la siguiente función de densidad:
\[f_{X}(x)=\frac{1}{15}e^{-\frac{1}{15}x}I_{(0,\infty)}(x)\]
x1 <- seq(0, 50, 0.01)
fx1 <- function(x) 1/15*exp(-1/15*x)
FX1 <- cbind.data.frame("tiempo que tarda en recuperarse" = x1, "probabilidad asociada" = fx1(x1))
#tail(FX1,4)
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:prob':
##
## intersect, setdiff, union
## The following objects are masked from 'package:timeSeries':
##
## filter, lag
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(ggplot2)
FX1 %>% mutate(`Probabilidad` = ifelse(0 <= `tiempo que tarda en recuperarse` & `tiempo que tarda en recuperarse` <= 10, "P(X<10)", "P(X>10)")) %>%
ggplot(aes(x = `tiempo que tarda en recuperarse`, y = `probabilidad asociada`, fill = `Probabilidad`)) +
geom_col(width = 0.01) +labs(x = "# de días hospitalizado hasta su recuperación de Covid-19") +
labs(y = "frecuencia relativa (fr)")
Numéricamente la probabilidad puede ser calculada mediante:
\[P_{X}(x<10)=\int_{0}^{10}\frac{1}{15}e^{-\frac{1}{15}x}dx\]
library(pracma)
##
## Attaching package: 'pracma'
## The following object is masked from 'package:fAsianOptions':
##
## erf
## The following objects are masked from 'package:fBasics':
##
## akimaInterp, inv, kron, pascal
## The following object is masked from 'package:combinat':
##
## fact
integral(fun = fx1, xmin = 0, xmax = 10)
## [1] 0.4865829
library(dplyr)
library(ggplot2)
FX1 %>% mutate(`Probabilidad` = ifelse(10 >= `tiempo que tarda en recuperarse`, "P(X>10)", "P(X<10)")) %>%
ggplot(aes(x = `tiempo que tarda en recuperarse`, y = `probabilidad asociada`, fill = `Probabilidad`)) +
geom_col(width = 0.01) +labs(x = "# de días hospitalizado hasta su recuperación de Covid-19") +
labs(y = "frecuencia relativa (fr)")
\[P_{X}(x>10)=\int_{10}^{\infty}\frac{1}{15}e^{-\frac{1}{15}x}dx\]
library(pracma)
integral(fun = fx1, xmin = 10, xmax = Inf)
## For infinite domains Gauss integration is applied!
## [1] 0.5134171
library(dplyr)
library(ggplot2)
p1 <- FX1 %>% mutate(`Probabilidad` = ifelse(0 <= `tiempo que tarda en recuperarse` & `tiempo que tarda en recuperarse` <= 50, "P(X<Inf)=1.0000000", "")) %>%
ggplot(aes(x = `tiempo que tarda en recuperarse`, y = `probabilidad asociada`, fill = `Probabilidad`)) +
geom_col(width = 0.01) + labs(x = "# de días hospitalizado hasta su recuperación de Covid-19") +
labs(y = "frecuencia relativa (fr)")
library(dplyr)
library(ggplot2)
p2 <- FX1 %>% mutate(`Probabilidad` = ifelse(0 <= `tiempo que tarda en recuperarse` & `tiempo que tarda en recuperarse` <= 10, "P(X<10)=0.4865829", "P(X>10)1-0.4865829")) %>%
ggplot(aes(x = `tiempo que tarda en recuperarse`, y = `probabilidad asociada`, fill = `Probabilidad`)) +
geom_col(width = 0.01) + labs(x = "# de días hospitalizado hasta su recuperación de Covid-19") +
labs(y = "frecuencia relativa (fr)")
library(gridExtra)
##
## Attaching package: 'gridExtra'
## The following object is masked from 'package:dplyr':
##
## combine
grid.arrange(p1, p2, nrow = 2, top = "Distribución exponencial")
\[P_{X}(x>10)+P_{X}(x{\leq}10)=1\]
\[P_{X}(x>10)+P_{X}(x{\leq}10)-P_{X}(x{\leq}10)=1-P_{X}(x{\leq}10)\]
\[P_{X}(x>10)=1-P_{X}(x{\leq}10)\]
\[1-P_{X}(x{\leq}10)=1-\int_{0}^{10}\frac{1}{15}e^{-\frac{1}{15}x}dx\]
library(pracma)
1 - integral(fun = fx1, xmin = 0, xmax = 10)
## [1] 0.5134171
1-0.4865829
## [1] 0.5134171
library(dplyr)
library(ggplot2)
FX1 %>% mutate(`Probabilidad` = ifelse(10-0.5 <= `tiempo que tarda en recuperarse` & `tiempo que tarda en recuperarse` <= 10+0.5, "P(X=10)", "P(X!=10)")) %>%
ggplot(aes(x = `tiempo que tarda en recuperarse`, y = `probabilidad asociada`, fill = `Probabilidad`)) +
geom_col(width = 0.01) +labs(x = "# de días hospitalizado hasta su recuperación de Covid-19") +
labs(y = "frecuencia relativa (fr)")
\[P_{X}(x=10)\approx\int_{10-0.5}^{10+0.5}\frac{1}{15}e^{-\frac{1}{15}x}dx\]
library(pracma)
integral(fun = fx1, xmin = 10-0.5, xmax = 10+0.5)
## [1] 0.03423415
dexp(x = 10, rate = 1/15)
## [1] 0.03422781
La función de distribución de una va \(X\) es aquella que calcula la probabilidad acumulada hasta un punto \(x\), es decir:
La función de distribución acumulada es la función
\[P_{X}(x):R\rightarrow[0,1]\]
es definida como:
\[F_X(x)=P(X{\leq}x)\]
Así;
\[P(a{\leq}X{\leq}b)=F_X(b)−F_X(a)\]
La probabilidad de que un paciente se recupere en un tiempo de 10 a 20 dias
\[P_{X}(10<x<20)=\int_{10}^{20}\frac{1}{15}e^{-\frac{1}{15}x}dx\]
library(dplyr)
library(ggplot2)
FX1 %>% mutate(`Probabilidad` = ifelse(10 <= `tiempo que tarda en recuperarse` & `tiempo que tarda en recuperarse` <= 20, "P(10<X<20)", "P(X<10 o X>20)")) %>%
ggplot(aes(x = `tiempo que tarda en recuperarse`, y = `probabilidad asociada`, fill = `Probabilidad`)) +
geom_col(width = 0.01) +labs(x = "# de días hospitalizado hasta su recuperación de Covid-19") +
labs(y = "frecuencia relativa (fr)")
library(pracma)
integral(fun = fx1, xmin = 10, xmax = 20)
## [1] 0.24982
\[P_{X}(10<x<20)=P_{X}(x<20)-P_{X}(x<10)=\int_{0}^{20}\frac{1}{15}e^{-\frac{1}{15}x}dx-\int_{0}^{10}\frac{1}{15}e^{-\frac{1}{15}x}dx\]
library(dplyr)
library(ggplot2)
p1 <- FX1 %>% mutate(`Probabilidad` = ifelse(0 <= `tiempo que tarda en recuperarse` & `tiempo que tarda en recuperarse` <= 20, "P(X<20)", "P(X>20)")) %>%
ggplot(aes(x = `tiempo que tarda en recuperarse`, y = `probabilidad asociada`, fill = `Probabilidad`)) +
geom_col(width = 0.01) + labs(x = "# de días hospitalizado hasta su recuperación de Covid-19") +
labs(y = "frecuencia relativa (fr)")
library(dplyr)
library(ggplot2)
p2 <- FX1 %>% mutate(`Probabilidad` = ifelse(0 <= `tiempo que tarda en recuperarse` & `tiempo que tarda en recuperarse` <= 10, "P(X<10)", "P(X>10)")) %>%
ggplot(aes(x = `tiempo que tarda en recuperarse`, y = `probabilidad asociada`, fill = `Probabilidad`)) +
geom_col(width = 0.01) + labs(x = "# de días hospitalizado hasta su recuperación de Covid-19") +
labs(y = "frecuencia relativa (fr)")
library(gridExtra)
grid.arrange(p1, p2, nrow = 2, top = "Distribución exponencial")
library(pracma)
integral(fun = fx1, xmin = 0, xmax = 20) - integral(fun = fx1, xmin = 0, xmax = 10)
## [1] 0.24982
\[P(a{\leq}X{\leq}b)=F_X(b)−F_X(a−1)\]
La probabilidad de que la suma de los dados este entre 4 y 6
\[P(4{\leq}X{\leq}6)=F_X(6)−F_X(4−1)=\sum_{x=2}^{6}f_{x}(x)-\sum_{x=2}^{4-1}f_{x}(x)=\sum_{x=2}^{6}\frac{6-\left|7-x\right|}{36}-\sum_{x=2}^{4-1}\frac{6-\left|7-x\right|}{36}\]
f <- function(x) (6-abs(7-x))/36
(f(2)+f(3)+f(4)+f(5)+f(6))-(f(2)+f(3))
## [1] 0.3333333
sum(f(0:6))-sum(f(0:(4-1)))
## [1] 0.3333333
f(4)+f(5)+f(6)
## [1] 0.3333333
El valor esperado de una función, cumple el mismo papel del promedio en una muestra, pero esta vez a nivel poblacional, es decir, es el centro de gravedad de todos los posibles datos de una variable. Su cálculo depende de la naturaleza de la variable:
\[E(X)=\sum\limits_{{\forall}x_i\in\Omega}x_i{\times}f_{X}(x_i)\]
2*f(2)+3*f(3)+4*f(4)+5*f(5)+6*f(6)+7*f(7)+8*f(8)+9*f(9)+10*f(10)+11*f(11)+12*f(12)
## [1] 7
hx <- function(x) x*(6-abs(7-x))/36
Ex <- sum(hx(2:12))
Ex
## [1] 7
\[E(X)=\int\limits_{{\forall}x_i\in\Omega}x_i{\times}f_{X}(x_i)dx\]
library(pracma)
ix1 <- function(x) x*1/15*exp(-1/15*x)
Ex1 <- integral(fun = ix1, xmin = 0, xmax = Inf)
## For infinite domains Gauss integration is applied!
Ex1
## [1] 15
\[min{X}{\leq}E(X){\leq}max{X}\]
cat("min(X) = ", min(x), "<", "E(X) = " ,Ex,"<", "max(X) = ", max(x))
## min(X) = 2 < E(X) = 7 < max(X) = 12
cat("min(X) = ", min(x1), "<", "E(X) = " ,Ex1,"<", "max(X) = ", max(x1))
## min(X) = 0 < E(X) = 15 < max(X) = 50
\[E(k)=k\text{, con k constante}\]
k <- 17
jx <- function(x) k*(6-abs(7-x))/36
Ec <- sum(jx(2:12))
Ec
## [1] 17
library(pracma)
k <- 115
kx1 <- function(x) k*1/15*exp(-1/15*x)
Ex1 <- integral(fun = kx1, xmin = 0, xmax = Inf)
## For infinite domains Gauss integration is applied!
Ex1
## [1] 115
\[E(X+k)=E(X)+k\text{, con k constante}\]
k <- 17
lx <- function(x) (x + k)*(6-abs(7-x))/36
Exmc <- sum(lx(2:12))
Exmc
## [1] 24
library(pracma)
k <- 115
mx1 <- function(x) (x + k)*1/15*exp(-1/15*x)
Exmc1 <- integral(fun = mx1, xmin = 0, xmax = Inf)
## For infinite domains Gauss integration is applied!
Exmc1
## [1] 130
\[E(kX)=kE(X)\text{, con k constante}\]
k <- 17
nx <- function(x) (k*x)*(6-abs(7-x))/36
Exmc <- sum(nx(2:12))
Exmc
## [1] 119
library(pracma)
k <- 115
ox1 <- function(x) (k*x)*1/15*exp(-1/15*x)
Exmc1 <- integral(fun = ox1, xmin = 0, xmax = Inf)
## For infinite domains Gauss integration is applied!
Exmc1
## [1] 1725
\[\text{Si }X_1,X_2,\ldots,X_m\text{ son variables aleatorias, }E(\sum_{i=1}^{m}X_j)=\sum_{i=1}^{m}E(X_j)\]
En general, es posible calcular el valor esperado de cualquier función g(.) de X, nuevamente su cálculo depende de la naturaleza de la variable :
Discreta:
\[E[g(X)]=\sum{g}(x_i)f_{X}(x_i)\]
Continua:
\[E(g(X))=\int{g}(x)fX(x)dx\]
La varianza es una medida de dispersión, puede ser poblacional o muestral dependiendo de si se recolectó la información de la población o de una muestra o subconjunto de ella, y mide el promedio o valor esperado de las distancisa entre cada uno de los valores que puede tomar la variable y su valor esperado. Se define de la siguiente manera:
\[V(X)=\sum\limits_{{\forall}x_i\in\Omega}\left[x_i-E(X)\right]^{2}f_{X}(x)\]
hx <- function(x) x*(6-abs(7-x))/36
Ex <- sum(hx(2:12))
print(paste("El valor esperado es igual a:", Ex))
## [1] "El valor esperado es igual a: 7"
ix <- function(x) ((x-Ex)**2)*(6-abs(7-x))/36
Vx <- sum(ix(2:12))
print(paste("La varianza es igual a:", Vx))
## [1] "La varianza es igual a: 5.83333333333333"
(2-Ex)**2*f(2)+(3-Ex)**2*f(3)+(4-Ex)**2*f(4)+(5-Ex)**2*f(5)+(6-Ex)**2*f(6)+(7-Ex)**2*f(7)+(8-Ex)**2*f(8)+(9-Ex)**2*f(9)+(10-Ex)**2*f(10)+(11-Ex)**2*f(11)+(12-Ex)**2*f(12)
## [1] 5.833333
\[V(X)=\int\limits_{{\forall}x_i\in\Omega}\left[x_i-E(X)\right]^{2}f_{X}(x_i)dx\]
library(pracma)
gx1 <- function(x) x*1/15*exp(-1/15*x)
Ex1 <- integral(gx1, 0, Inf)
## For infinite domains Gauss integration is applied!
print(paste("El valor esperado es igual a:", Ex1))
## [1] "El valor esperado es igual a: 15"
hx1 <- function(x) ((x-Ex1)**2)*1/15*exp(-1/15*x)
Vx1 <- integral(hx1, 0, Inf)
## For infinite domains Gauss integration is applied!
print(paste("La varianza es igual a:", Vx1))
## [1] "La varianza es igual a: 225"
\[V(X){\geq}0\]
Vx >= 0
## [1] TRUE
Vx1 >= 0
## [1] TRUE
\[V(k)=0\text{, con k una constante o valor fijo}\]
k <- 10
hx <- function(x) k*(6-abs(7-x))/36
Ex <- sum(hx(2:12))
print(paste("El valor esperado es igual a:", Ex))
## [1] "El valor esperado es igual a: 10"
ix <- function(x) ((k-Ex)**2)*(6-abs(7-x))/36
Vx <- sum(ix(2:12))
print(paste("La varianza es igual a:", Vx))
## [1] "La varianza es igual a: 0"
library(pracma)
k <- 100
gx1 <- function(x) k*1/15*exp(-1/15*x)
Ex1 <- integral(gx1, 0, Inf)
## For infinite domains Gauss integration is applied!
print(paste("El valor esperado es igual a:", Ex1))
## [1] "El valor esperado es igual a: 99.9999999999999"
hx1 <- function(x) ((k-Ex1)**2)*1/15*exp(-1/15*x)
Vx1 <- integral(hx1, 0, Inf)
## For infinite domains Gauss integration is applied!
print(paste("La varianza es igual a:", Vx1))
## [1] "La varianza es igual a: 2.03093370094964e-26"
\[V(X+k)=V(X)\text{, con k una constante o valor fijo}\]
k <- 10
hx <- function(x) (x+k)*(6-abs(7-x))/36
Ex <- sum(hx(2:12))
print(paste("El valor esperado es igual a:", Ex))
## [1] "El valor esperado es igual a: 17"
ix <- function(x) (((x+k)-Ex)**2)*(6-abs(7-x))/36
Vx <- sum(ix(2:12))
print(paste("La varianza es igual a:", Vx))
## [1] "La varianza es igual a: 5.83333333333333"
library(pracma)
k <- 100
gx1 <- function(x) (x+k)*1/15*exp(-1/15*x)
Ex1 <- integral(gx1, 0, Inf)
## For infinite domains Gauss integration is applied!
print(paste("El valor esperado es igual a:", Ex1))
## [1] "El valor esperado es igual a: 115"
hx1 <- function(x) (((x+k)-Ex1)**2)*1/15*exp(-1/15*x)
Vx1 <- integral(hx1, 0, Inf)
## For infinite domains Gauss integration is applied!
print(paste("La varianza es igual a:", Vx1))
## [1] "La varianza es igual a: 225"
\[V(kX)=k^2V(X)\text{, con k una constante o valor fijo}\]
k <- 10
hx <- function(x) (k*x)*(6-abs(7-x))/36
Ex <- sum(hx(2:12))
print(paste("El valor esperado es igual a:", Ex))
## [1] "El valor esperado es igual a: 70"
ix <- function(x) (((k*x)-Ex)**2)*(6-abs(7-x))/36
Vx <- sum(ix(2:12))
print(paste("La varianza es igual a:", Vx))
## [1] "La varianza es igual a: 583.333333333333"
library(pracma)
k <- 100
gx1 <- function(x) (k*x)*1/15*exp(-1/15*x)
Ex1 <- integral(gx1, 0, Inf)
## For infinite domains Gauss integration is applied!
print(paste("El valor esperado es igual a:", Ex1))
## [1] "El valor esperado es igual a: 1500"
hx1 <- function(x) (((k*x)-Ex1)**2)*1/15*exp(-1/15*x)
Vx1 <- integral(hx1, 0, Inf)
## For infinite domains Gauss integration is applied!
print(paste("La varianza es igual a:", Vx1))
## [1] "La varianza es igual a: 2250000"
\[\text{Si }X_1,X_2,\ldots,X_m\text{ son variables aleatorias independientes, }V\left[\sum_{i=1}X_j\right]=\sum_{i=1}V\left(X_j\right)\]
Existen dos tipos de momentos: centrales y no centrales. Al igual que en la parte descriptiva, su finalidad es la de conocer la centralidad, la variabilidad o la forma de una distribución.
\[\mu_r=E\left[\left(X−\mu\right)^r\right]\]
\[\sigma_X^2=E\left[\left(X−\mu\right)^2\right]\]
hx <- function(x) x*(6-abs(7-x))/36
Ex <- sum(hx(2:12))
print(paste("El valor esperado es igual a:", Ex))
## [1] "El valor esperado es igual a: 7"
ix <- function(x,r=2) ((x-Ex)**r)*(6-abs(7-x))/36
Vx <- sum(ix(2:12))
print(paste("La varianza es igual a:", Vx))
## [1] "La varianza es igual a: 5.83333333333333"
library(pracma)
gx1 <- function(x) x*1/15*exp(-1/15*x)
Ex1 <- integral(gx1, 0, Inf)
## For infinite domains Gauss integration is applied!
print(paste("El valor esperado es igual a:", Ex1))
## [1] "El valor esperado es igual a: 15"
hx1 <- function(x,r=2) ((x-Ex1)**r)*1/15*exp(-1/15*x)
Vx1 <- integral(hx1, 0, Inf)
## For infinite domains Gauss integration is applied!
print(paste("La varianza es igual a:", Vx1))
## [1] "La varianza es igual a: 225"
\[\mu_r=E\left[X^r\right]\]
\[\mu_X=E\left[X^1\right]\]
\[\mu_2-\mu_1^2=E\left[X^2\right]-\left\{E\left[X^1\right]\right\}^2\]
ix <- function(x,r=1) ((x)**r)*(6-abs(7-x))/36
Ex.1 <- sum(ix(2:12))
print(paste("El momento no central de orden uno es igual a:", Ex.1))
## [1] "El momento no central de orden uno es igual a: 7"
ix <- function(x,r=2) ((x)**r)*(6-abs(7-x))/36
Ex.2 <- sum(ix(2:12))
print(paste("El momento no central de orden dos es igual a:", Ex.2))
## [1] "El momento no central de orden dos es igual a: 54.8333333333333"
print(paste("La varianza es igual a:", Ex.2-Ex.1**2))
## [1] "La varianza es igual a: 5.83333333333334"
library(pracma)
hx1 <- function(x,r=1) ((x)**r)*1/15*exp(-1/15*x)
Ex.1 <- integral(hx1, 0, Inf)
## For infinite domains Gauss integration is applied!
print(paste("El momento no central de orden uno es igual a:", Ex.1))
## [1] "El momento no central de orden uno es igual a: 15"
hx1 <- function(x,r=2) ((x)**r)*1/15*exp(-1/15*x)
Ex.2 <- integral(hx1, 0, Inf)
## For infinite domains Gauss integration is applied!
print(paste("El momento no central de orden dos es igual a:", Ex.1))
## [1] "El momento no central de orden dos es igual a: 15"
print(paste("La varianza es igual a:", Ex.2-Ex.1**2))
## [1] "La varianza es igual a: 225"
La función generadora de momentos de una variable aleatoria, al igual que la función de distribución, identifica plenamente la distribución de dicha variable, se podría decir que es casi como una huella digital de la misma. Por definición, la función generadora de momentos corresponde a:
\[m_{X}\left(t\right)=E\left(e^{tX}\right)\text{, }t{\in}\mathbf{R}\]
Su nombre se le atribuye al hecho de que a partir de ella es posible determinar los momentos de una va, así:
\[\frac{d}{dx}m_{X}\left(0\right)=m_1\]
\[\frac{d}{dx^2}m_{X}\left(0\right)=m_2\]
y en general
\[\frac{d}{dx^r}m_{X}\left(0\right)=m_r\]
Sea \(X\) una variable aleatoria con FDA \(P_X\). La función de distribución acumulada inversa o función de cuantiles. Son valores de la variable (percentiles, \(P_t\)) que delimitan superiormente una probabilidad determinada.
\[P_{X}^{−1}(q)=inf\left\{x:PX(x)>q\right\}\text{ para }q{\in}[0,1]\]
Llamamos a \(P^{−1}(1/4)\) el primer cuartil, a \(P^{−1}(1/2)\) la mediana y \(P^{−1}(3/4)\) el tercer cuartil.
\[P_t=\left\{ x:F_X(x)=\frac{t}{100}\right\}\]
dias.hospitalizado <- rexp(n = 100000,rate = 1/15)
quantile(x = dias.hospitalizado, c(0.5))
## 50%
## 10.40073
De una mazo de 52 cartas, en una baraja francesa, describir esquemáticamente el espacio muestral \(\Omega\). Determinar cuantos elementos tendría el conjunto \(\mathcal{F}\) y calcular las siguientes probabilidades:
Omega <- cards(makespace = TRUE)
summary(Omega$suit)
## Club Diamond Heart Spade
## 13 13 13 13
summary(Omega$rank)
## 2 3 4 5 6 7 8 9 10 J Q K A
## 4 4 4 4 4 4 4 4 4 4 4 4 4
Casos favorables
A <- subset(Omega, suit == "Heart")
tail(A)
nrow(A)
## [1] 13
Casos posibles
nrow(Omega)
## [1] 52
Probabilidad de A
Prob(A)
## [1] 0.25
nrow(A)/nrow(Omega)
## [1] 0.25
Casos favorables
B <- subset(Omega, rank %in% 7:9)
head(B)
nrow(B)
## [1] 12
Casos posibles
nrow(Omega)
## [1] 52
Probabilidad de B
Prob(B)
## [1] 0.2307692
nrow(B)/nrow(Omega)
## [1] 0.2307692
Casos favorables
C <- subset(Omega, suit != "Heart")
tail(C)
nrow(C)
## [1] 39
Casos posibles
nrow(Omega)
## [1] 52
Probabilidad de C
Prob(C)
## [1] 0.75
nrow(C)/nrow(Omega)
## [1] 0.75
Casos favorables
D <- subset(Omega, suit == "Spade")
tail(D)
nrow(D)
## [1] 13
Casos posibles
nrow(Omega)
## [1] 52
Probabilidad de D
Prob(D)
## [1] 0.25
nrow(D)/nrow(Omega)
## [1] 0.25
Casos favorables
E <- subset(Omega, suit != "Spade")
tail(E)
nrow(E)
## [1] 39
Casos posibles
nrow(Omega)
## [1] 52
Probabilidad de D
Prob(E)
## [1] 0.75
nrow(E)/nrow(Omega)
## [1] 0.75
Casos favorables
F <- subset(Omega, suit %in% c("Heart","Spade"))
tail(F)
nrow(F)
## [1] 26
Casos posibles
head(Omega)
Probabilidad de D
Prob(F)
## [1] 0.5
nrow(F)/nrow(Omega)
## [1] 0.5
Casos favorables
G <- subset(Omega, rank %in% c("J","Q","K","A"))
tail(G)
nrow(G)
## [1] 16
Casos posibles
nrow(Omega)
## [1] 52
Probabilidad de D
Prob(G)
## [1] 0.3076923
nrow(G)/nrow(Omega)
## [1] 0.3076923
Casos favorables
H <- subset(Omega, suit == "Diamond" & rank %in% c("J","Q","K","A"))
head(H)
nrow(H)
## [1] 4
Casos posibles
nrow(Omega)
## [1] 52
Probabilidad de B
Prob(H)
## [1] 0.07692308
nrow(H)/nrow(Omega)
## [1] 0.07692308