Las variables aleatorias \(X\) pueden ser discontinuas o discretas y tomar un número finito \(D={x1,…,xn}\), o infinito \(R= {-∞,…,∞}\) de valores, donde \(R\) es el rango de la variable aleatoria, es decir intervalo de valores que puede tomar la variable aleatoria.
Una variable aleatoria es una variable cuyos valores son inciertos, es decir que no estan asociados a una medida de incertidumbre o probabilidad. Una función de probabilidad se asocia a cada valor de \(x\), \(f(x)=P(X=x)\) tal que \(f(x)\ge0\) y \(\sum_{X∈R}{P(X=x)=p_1+p_2+...+p_n=1 }\).
En este documento nos interesa estudiar aquellas variables aleatorias que resultan de experimentos aleatorios en ingeniería. Estos experimentos pueden ser mediciones de los valores que toma una variable de un fenómeno o de un proceso; las cuales presentan un cierto grado de variabilidad.
Esta distribución resulta de un experimento para el cual no es posible establecer un modelo matemático bien definido; pero se observa una cierta destribución de frecuencias para los valores que toma la variable aleatoria \(X\). A partir de las frecuencias relativas de aparición de un número finito de valores o resultados discontinuos \({x1,…,xn}\) se define la función de probabilidad.
La función de probabilidad para el dominio de valores de la variable aleatoria se representa de la siguiente forma
\[P(X=x)= \left\{ \begin{array}{lcc} p_{1} & \ x=x_1, \\ p_{2} & \ x=x_2, \\ p_{3} & \ x=x_3, \\ \ldots \\ 0 & \text{si no}. \end{array} \right.\]
Esta función de probabilidad \(f(x)=P(X=x)\) es tal que \(f(x)\ge0\) y \(\sum_{X∈R}{P(X=x)=p_1+p_2+...+p_n=1 }\).
También se puede establecer la función de probabilidad acumulada F(x) para intervalos de valores que toma la variable aleatoria.
\[F(x)=P(X≤x)= \left\{ \begin{array}{lcc} 0 & \ -∞<x<x_1, \\ p_{1} & \ x_1≤x<x_2, \\ p_{1}+ p_{2} & \ x_2≤x<x_3, \\ \ldots \\ p_{1}+ p_{2}+...+p_{n} & \ x_n≤x<∞. \end{array} \right.\]
Esta función de probabilidad acumulada \(F(X)=P(X\le x)\) tiene las siguiemtes propiedades:
Como toda variable aleatoria es posible establecer medidas de tendencia, variabilidad, e incluso de simetria.
En el caso de una variable aleatoria discreta se define el valor esperado como:
\[μ=E(X)=\sum_{x∈R}^{}{ x*f(x)}=\sum_{x∈R}^{}{ x*P(X=x)}\] la varianza como:
\[σ^2=V(x)=\sum_{x∈R}^{}{(x-μ)^2f(x) }=\sum_{x∈R}^{}{x^2f(x)-μ^2 }\] y la desviación estándar es \(\sigma= \sqrt(V(x))\)
donde el rango de la variable aleatoria es \(R={x1,…,xn}\)
A continuación se presentan diversos ejemplos con el fin de manejar esta disrribución y conocer sus propiedades.
Ejemplo. Se lanzan tres monedas al aire, considerando 1 como sol y 2 como águila. Los resultados posibles son
## moneda1 moneda2 moneda3 nsoles proba
## 1 1 1 1 3 0.125
## 2 2 1 1 2 0.125
## 3 1 2 1 2 0.125
## 4 2 2 1 1 0.125
## 5 1 1 2 2 0.125
## 6 2 1 2 1 0.125
## 7 1 2 2 1 0.125
## 8 2 2 2 0 0.125
Si se considera el número de soles. La función de probabilidad \(f(x)\) de la variable X = número de soles se representa, considerando \(n = 3\), \(k = 0,1,2,3\) y \(p=1/2\) de la siguiente forma
\[f(x)=P(X=x)=\begin{cases}1/8&x=0\\3/8&x=1\\3/8&x=2\\3/8&x=3\end{cases}\]
La gráfica de la función de probabilidad \(f(x)\) puede obtenerse mediante:
k<-c(0,1,2,3)
f=c((1/8),3/8,3/8,1/8)
plot(k,f,type="h", xlab="k",ylab="P(X=k)",main="Función de Probabilidad # soles", col ="red", ylim=c(0,1))
mientras que la función de probabilidad acumulada \(F(x)\) puede escribirse como:
\[F(x)=P(X\lt x)=\begin{cases}1/8& x\lt 0\\3/8&0 \le x\lt1\\4/8&1 \le x\lt 2\\7/8& 2 \le x \lt3 \\1 & x \ge 3 \end{cases}\]
y su gráfica se obtiene mediante
k<-c(0,1,2,3)
f=c(0,1/8,3/8,3/8,1/8)
f1<-cumsum(f)
plot(stepfun(k,f1, right= TRUE), col ="red", main= "F(X)", cex = 1.5, pch=1, verticals=FALSE)
#abline (h = 1/8, lty = 2:3)
#abline (h = 4/8, lty = 2:3)
#abline (h = 7/8, lty = 2:3)
#abline (h = 1, lty = 2:3)
Observe que esta función \(F(x)\) se define en limites cerrado a la izquierda y abierto a la derecha, excepto para el último valor
Para este ejemplo Calcular:
Respuesta: La probabilidad se representa como : \(P(X=2)\) De la función anterior se puede observar que para k= 2, la probabilidad es \(3/8\)
Respuesta: La probabilidad se representa como : \(P(X<2)\) o bien \(P(X\le 1)\) Se piden las probabilidades para k=0 y 1, las probabilidades respectivas son es \(P(X=0)=1/8\) y \(P(X=1)=3/8\), por lo que:
\[P(X\le 1)= P(X= 0)+P(X= 1)=1/8+3/8 = 1/2 \]
Observar que, aunque en este caso el resultado es el mismo, es diferente, la probabilidad de que resulten al menos de dos soles, es decir \(P(X\ge 2)\)
Observe que de la función de probabilidad acumulada se obtiene P(X), pues \[F(1)= P(X\le 1)=P(X=0)+P(X=1)=4/8\]
Ejemplo.- Se tiene \(P(X=0)=0.886\), \(P(X=1)=0.111\) y \(P(X=2)=0.003\) Graficar la función de probabilidad, Encontrar la función de probabilidad acumulada y Graficar.
Respuesta:
x<-c(0,1,2)
f<-c(0.886, 0.111, 0.003)
plot(x,f,type="h", xlab="k",ylab="P(X=k)",main="Función de Probabilidad f(x)", ylim=c(0,1), col = "blue")
x<-c(0,1,2)
f<-c(0, 0.886, 0.111, 0.003)
f1<-cumsum(f)
f1
## [1] 0.000 0.886 0.997 1.000
y<-f1
plot(stepfun(x,y, right= TRUE), col ="red", verticals = FALSE, main ="Función de Probabilidad Acumulada F(x)")
abline (v = 0, lty = 2:3)
Ejemplo: Obtener el valor esperado y la varianza de
\[P(X=k)= \left\{ \begin{array}{lcc} 0.08 & \ k=10, \\ 0.15 & \ k=11, \\ 0.30 & \ k=12, \\ 0.20 & \ k=13, \\ 0.20 & \ k=14, \\ 0.07 & \ k=15, \end{array} \right.\]
Respuesta
\[μ=E(X)=\sum_{x∈R}^{}{ x*f(x)}=\sum_{x∈R}^{}{ x*P(X=x)}\] \[μ=E(X)=10*0.08+11*0.15+12*0.30+13*0.12+14*0.20+15*0.07\]
x<-c(10,11,12,13,14,15)
f<-c(0.08,0.15, 0.30, 0.20,0.20,0.07)
Ex<-sum(x*f)
Ex
## [1] 12.5
La varianza es:
\(σ^2=V(x)=\)
\((10-12.5)^2*0.08+(11-12.5)^2*0.15+(12-12.5)^2*0.30\) \(+(13-12.5)^2*0.12+(14-12.5)^2*0.20+(15-12.5)^2*0.07\)
Vx<-sum(f*(x-Ex)^2)
Vx
## [1] 1.85
y
\[σ=\sqrt(V(x))\]
resulta:
Dx=sqrt(Vx)
Dx
## [1] 1.360147
Ejemplo Sea X una variable aleatoria con posibles valores x= 0,1,2 tal que P(X=0)=1/3, P(X=1)=1/6 y P(X=2)=1/2. Establecer las funciones f(x), F(x) y las gráficas de probabilidad y de probabilidad acumulada.
La función f(x) se representa como:
\[f(x)=P(X=x)= \left\{ \begin{array}{lcc} 1/3 & \ x=0, \\ 1/6 & \ x=1, \\ 1/2 & \ x=2 \end{array} \right.\]
x<-c(0,1,2)
f<-c(1/3, 1/6, 1/2)
plot(x,f,type="h", xlab="x",ylab="P(X=k)",main="Función de Probabilidad f(x)", ylim=c(0,1), col = "blue")
La función F(x) de probabilidad acumulada
\[F(x)=P(X\le x)= \left\{ \begin{array}{lcc} 0 & \ -∞<x\lt0 \\ 2/6 & \ 0≤x\lt1 \\ 3/6 & \ 1≤x\lt2 \\ 1 & \ x\ge2 \end{array} \right.\]
x<-c(0,1,2)
f<-c(0, 1/3, 1/6, 1/2)
f1<-cumsum(f)
f1
## [1] 0.0000000 0.3333333 0.5000000 1.0000000
y<-f1
plot(stepfun(x,y, right= TRUE), col ="red", verticals = FALSE,main="Función de Probabilidad Acumulada F(x)")
abline (v = 0, lty = 2:3)
abline (v = 1.9, lty = 2:3)
Observar que
\(F(2)=P(X\le2)=P(X=0)+P(X=1)+P(X=2)=\frac{2}{3}+\frac{1}{6}+\frac{1}{2}\)
f<-c(0, 1/3, 1/6, 1/2)
sum(f)
## [1] 1
\(F(0.5)=P(X\le0.5)=P(X\le0)=P(X=0)=\frac{1}{3}\) ver gráfica de F(x)
\(F(1.9)=P(X\le1.9)=P(X\le1.0)=P(X=0)+P(X=1)=\frac{1}{2}\) ver gráfica de F(x)
Otras referencias son:
Fuente https://rpubs.com/AndresCruz/634182
\(X\) es una variable aleatoria con distribución uniforme discreta, finita. Es decir sólo puede tomar un número finito de valores o resultados discontinuos \({x1,…,xn}\) de tal forma que la probabilidad de que se obtenga cada valor es igual (es decir la misma): \(1/n\). Si la variable toma valores entre 0 y n, se escribe \(X∼U(0,n)\) si
\[P(X=x)= \left\{ \begin{array}{lcc} 1/n & \text{si} & x=x_1,x_2,\ldots,x_n. \\ \\ 0 & & \text{si no}. \end{array} \right.\]
Referencia:https://rpubs.com/hllinas/R_Binomial
https://estadistica-dma.ulpgc.es/cursoR4ULPGC/10-distribProbabilidad.html
La función de probabilidad binomial se representa mediante
\[f(k)=P(X=k)=b(k,n,p)= {n\choose k} p^k\, (1-p)^{n-k} \qquad k=0,1,2, \ldots, n\]
En R la probabilidad en un punto \(P(X=k)\) se calcula con dbinom(k,n,p).
La probabilidad en un intervalo \(P(X\le k)\) se obtiene mediante pbinom(k,n,p)
El cuantil \(q_{a}=\min\left\{ x:\, P\left(X\le x\right)\ge a\right\}\) se obtiene mediante qbinom(a,n,p) y
m números aleatorios con una distribución binomial se generan con rbinom(m,n,p)
Ejemplo: Una urna contiene 6 esferas, 4 blancas y 2 rojas. Si se toman 5 esferas, una después de la otra, se anota el color y se regresa a la urna, antes de elegir la siguiente (muestreo con remplazo).
Encontrar la probabilidad de que resulten dos rojas \[P(X=2)\] \[P(X= 2) = {5\choose 2} (1/6)^2\, (1-1/6)^{6-2} = 0.3292181\]
Solución a: La función de probabilidad se puede calcular de acuerdo a lo siguiente:
n<- 5
k <- 2
p<-2/6
combinaciones <- choose(n,k)
exito <- p^k # salen tres rojas
fracaso <- (1-p)^(n-k)
probabilidad <- combinaciones*exito*fracaso
probabilidad
## [1] 0.3292181
o bien, mediante la función propuesta por R.
\[P(X=k) = b(k,n,p)\]
n<- 5
k <- 2
p<-2/6
dbinom(k,n,p)
## [1] 0.3292181
En seis ensayos, la variabe asociada a este experimento binomial (extracción de 5 esferas con remplazo), es decir X = # de rojas tienw el siguiente dominio \(D={0,1,2,3,4,5}\). Las probabilidades son:
dbinom(0:5,5,2/6)
## [1] 0.131687243 0.329218107 0.329218107 0.164609053 0.041152263 0.004115226
cbind(0:5,dbinom(0:5,5,2/6))
## [,1] [,2]
## [1,] 0 0.131687243
## [2,] 1 0.329218107
## [3,] 2 0.329218107
## [4,] 3 0.164609053
## [5,] 4 0.041152263
## [6,] 5 0.004115226
La representación gráfica de esta función puede obtenerse siguiendo la idea descrita para la función de probabilidad f(x) se obtiene mediante:
x<-0:5
f<-dbinom(0:5,5,2/6)
plot(x,f,type="h",las=1, lwd=2, xlab="x",ylab="P(X=k)",main="Función de Probabilidad b(k,n,p)", ylim=c(0,0.6), col = "blue")
f<-c(0,dbinom(0:5,5,2/6)) # observe la inclusión de cero
f1<-cumsum(f)
f1
## [1] 0.0000000 0.1316872 0.4609053 0.7901235 0.9547325 0.9958848 1.0000000
y<-f1
plot(stepfun(x,y,,right= TRUE), col ="red", verticals = FALSE,main="Función de Probabilidad Acumulada B(n,p)",las=1, lwd=2)
Ejercicio 4.46
Respuesta
La función de probabilidad también se denomina función de masa
La gráfica es:
x<-0:10
f<-dbinom(0:10,10,0.5)
plot(x,f,type="h",las=1, lwd=2, xlab="x",ylab="P(X=k)",main="Función de Probabilidad b(k,n,p)", ylim=c(0,0.6), col = "blue")
Los valores de probabilidad para cada valor de la variable X son:
cbind(0:10,dbinom(0:10,10,0.5))
## [,1] [,2]
## [1,] 0 0.0009765625
## [2,] 1 0.0097656250
## [3,] 2 0.0439453125
## [4,] 3 0.1171875000
## [5,] 4 0.2050781250
## [6,] 5 0.2460937500
## [7,] 6 0.2050781250
## [8,] 7 0.1171875000
## [9,] 8 0.0439453125
## [10,] 9 0.0097656250
## [11,] 10 0.0009765625
El mas factible es para el valor de X = 5
max(dbinom(0:10,10,0.5))
## [1] 0.2460938
El menos factible es para el valor de X = 0
min(dbinom(0:10,10,0.5))
## [1] 0.0009765625
d).- \(P(3\le X\lt5)=P(X\le4)- P(X\le2)\)
pbinom(4,10,0.5)-pbinom(2,10,0.5)
## [1] 0.3222656
o bien
\(P(3\le X\lt5)=P(X=3)+ P(X=4)\)
dbinom(3,10,0.5)+dbinom(4,10,0.5)
## [1] 0.3222656
Respuesta
a).- \(P(X=5)=b(5,10,0.5)\)
dbinom(5,10,0.5)
## [1] 0.2460938
b).- \(P(X\le2)=\sum_{k=0}^{k=2}{b(k,10,0.5)}\)
sum(dbinom(0:2,10,0.5))
## [1] 0.0546875
c).- \(P(X\ge9)=\sum_{k=9}^{k=10}{b(k,10,0.5)}=1-P(X\lt9)=1-P(\le8)=b(0:8,10,0.5)\)
sum(dbinom(9:10,10,0.5))
## [1] 0.01074219
o bien
\(P(X\ge9)=1-P(X\lt9)=1-P(X\le8)=1-b(0:8,10,0.5)\)
1-sum(dbinom(0:8,10,0.5))
## [1] 0.01074219
La función de probabilidad binomial con diferentes tamaños de muestra n=5,15,25,35,50,100, para la probabilidad de p=0.5.
plot(dbinom(0:10,10,0.6),type="h",xlab="k",ylab="P(X=k)",main="Función de Probabilidad B(10,0.6)")
https://rkabacoff.github.io/datavis/Customizing.html#labels-1