Distribuciones Discretas o Discontinuas.

Las variables aleatorias \(X\) pueden ser discontinuas o discretas y tomar un número finito \(D={x1,…,xn}\), o infinito \(R= {-∞,…,∞}\) de valores, donde \(R\) es el rango de la variable aleatoria, es decir intervalo de valores que puede tomar la variable aleatoria.

Una variable aleatoria es una variable cuyos valores son inciertos, es decir que no estan asociados a una medida de incertidumbre o probabilidad. Una función de probabilidad se asocia a cada valor de \(x\), \(f(x)=P(X=x)\) tal que \(f(x)\ge0\) y \(\sum_{X∈R}{P(X=x)=p_1+p_2+...+p_n=1 }\).

En este documento nos interesa estudiar aquellas variables aleatorias que resultan de experimentos aleatorios en ingeniería. Estos experimentos pueden ser mediciones de los valores que toma una variable de un fenómeno o de un proceso; las cuales presentan un cierto grado de variabilidad.

Distribución de una variable discontinua o discreta (empírica)

Esta distribución resulta de un experimento para el cual no es posible establecer un modelo matemático bien definido; pero se observa una cierta destribución de frecuencias para los valores que toma la variable aleatoria \(X\). A partir de las frecuencias relativas de aparición de un número finito de valores o resultados discontinuos \({x1,…,xn}\) se define la función de probabilidad.

La función de probabilidad para el dominio de valores de la variable aleatoria se representa de la siguiente forma

\[P(X=x)= \left\{ \begin{array}{lcc} p_{1} & \ x=x_1, \\ p_{2} & \ x=x_2, \\ p_{3} & \ x=x_3, \\ \ldots \\ 0 & \text{si no}. \end{array} \right.\]

Esta función de probabilidad \(f(x)=P(X=x)\) es tal que \(f(x)\ge0\) y \(\sum_{X∈R}{P(X=x)=p_1+p_2+...+p_n=1 }\).

También se puede establecer la función de probabilidad acumulada F(x) para intervalos de valores que toma la variable aleatoria.

\[F(x)=P(X≤x)= \left\{ \begin{array}{lcc} 0 & \ -∞<x<x_1, \\ p_{1} & \ x_1≤x<x_2, \\ p_{1}+ p_{2} & \ x_2≤x<x_3, \\ \ldots \\ p_{1}+ p_{2}+...+p_{n} & \ x_n≤x<∞. \end{array} \right.\]

Esta función de probabilidad acumulada \(F(X)=P(X\le x)\) tiene las siguiemtes propiedades:

  • \(0 \le F(x)\le1\)
  • \(x \le y ⇒ F(x) \le F(y)\)
  • \(P(X \gt x) = 1-P(X\le x) = 1 - F(x)\)

Como toda variable aleatoria es posible establecer medidas de tendencia, variabilidad, e incluso de simetria.

En el caso de una variable aleatoria discreta se define el valor esperado como:

\[μ=E(X)=\sum_{x∈R}^{}{ x*f(x)}=\sum_{x∈R}^{}{ x*P(X=x)}\] la varianza como:

\[σ^2=V(x)=\sum_{x∈R}^{}{(x-μ)^2f(x) }=\sum_{x∈R}^{}{x^2f(x)-μ^2 }\] y la desviación estándar es \(\sigma= \sqrt(V(x))\)

donde el rango de la variable aleatoria es \(R={x1,…,xn}\)

A continuación se presentan diversos ejemplos con el fin de manejar esta disrribución y conocer sus propiedades.

Ejemplo. Se lanzan tres monedas al aire, considerando 1 como sol y 2 como águila. Los resultados posibles son

##   moneda1 moneda2 moneda3 nsoles proba
## 1       1       1       1      3 0.125
## 2       2       1       1      2 0.125
## 3       1       2       1      2 0.125
## 4       2       2       1      1 0.125
## 5       1       1       2      2 0.125
## 6       2       1       2      1 0.125
## 7       1       2       2      1 0.125
## 8       2       2       2      0 0.125

Si se considera el número de soles. La función de probabilidad \(f(x)\) de la variable X = número de soles se representa, considerando \(n = 3\), \(k = 0,1,2,3\) y \(p=1/2\) de la siguiente forma

\[f(x)=P(X=x)=\begin{cases}1/8&x=0\\3/8&x=1\\3/8&x=2\\3/8&x=3\end{cases}\]

La gráfica de la función de probabilidad \(f(x)\) puede obtenerse mediante:

k<-c(0,1,2,3)
f=c((1/8),3/8,3/8,1/8)
plot(k,f,type="h", xlab="k",ylab="P(X=k)",main="Función de Probabilidad # soles", col ="red", ylim=c(0,1))

mientras que la función de probabilidad acumulada \(F(x)\) puede escribirse como:

\[F(x)=P(X\lt x)=\begin{cases}1/8& x\lt 0\\3/8&0 \le x\lt1\\4/8&1 \le x\lt 2\\7/8& 2 \le x \lt3 \\1 & x \ge 3 \end{cases}\]

y su gráfica se obtiene mediante

k<-c(0,1,2,3)
f=c(0,1/8,3/8,3/8,1/8)
f1<-cumsum(f)
plot(stepfun(k,f1, right= TRUE), col ="red", main= "F(X)", cex = 1.5, pch=1, verticals=FALSE)

#abline (h = 1/8, lty = 2:3)
#abline (h = 4/8,  lty = 2:3)
#abline (h = 7/8,  lty = 2:3)
#abline (h = 1,  lty = 2:3)

Observe que esta función \(F(x)\) se define en limites cerrado a la izquierda y abierto a la derecha, excepto para el último valor

Para este ejemplo Calcular:

  • La probabilidad de que resulten dos soles

Respuesta: La probabilidad se representa como : \(P(X=2)\) De la función anterior se puede observar que para k= 2, la probabilidad es \(3/8\)

  • La probabilidad de que resulten menos de dos soles

Respuesta: La probabilidad se representa como : \(P(X<2)\) o bien \(P(X\le 1)\) Se piden las probabilidades para k=0 y 1, las probabilidades respectivas son es \(P(X=0)=1/8\) y \(P(X=1)=3/8\), por lo que:

\[P(X\le 1)= P(X= 0)+P(X= 1)=1/8+3/8 = 1/2 \]

Observar que, aunque en este caso el resultado es el mismo, es diferente, la probabilidad de que resulten al menos de dos soles, es decir \(P(X\ge 2)\)

Observe que de la función de probabilidad acumulada se obtiene P(X), pues \[F(1)= P(X\le 1)=P(X=0)+P(X=1)=4/8\]

Ejemplo.- Se tiene \(P(X=0)=0.886\), \(P(X=1)=0.111\) y \(P(X=2)=0.003\) Graficar la función de probabilidad, Encontrar la función de probabilidad acumulada y Graficar.

Respuesta:

x<-c(0,1,2)
f<-c(0.886, 0.111, 0.003)
plot(x,f,type="h", xlab="k",ylab="P(X=k)",main="Función de Probabilidad f(x)", ylim=c(0,1), col = "blue")

x<-c(0,1,2)
f<-c(0, 0.886, 0.111, 0.003)
f1<-cumsum(f)
f1
## [1] 0.000 0.886 0.997 1.000
y<-f1
plot(stepfun(x,y, right= TRUE), col ="red", verticals = FALSE, main ="Función de Probabilidad Acumulada F(x)")
abline (v = 0, lty = 2:3)

Ejemplo: Obtener el valor esperado y la varianza de

\[P(X=k)= \left\{ \begin{array}{lcc} 0.08 & \ k=10, \\ 0.15 & \ k=11, \\ 0.30 & \ k=12, \\ 0.20 & \ k=13, \\ 0.20 & \ k=14, \\ 0.07 & \ k=15, \end{array} \right.\]

Respuesta

\[μ=E(X)=\sum_{x∈R}^{}{ x*f(x)}=\sum_{x∈R}^{}{ x*P(X=x)}\] \[μ=E(X)=10*0.08+11*0.15+12*0.30+13*0.12+14*0.20+15*0.07\]

x<-c(10,11,12,13,14,15)
f<-c(0.08,0.15, 0.30, 0.20,0.20,0.07)
Ex<-sum(x*f)
Ex
## [1] 12.5

La varianza es:

\(σ^2=V(x)=\)

\((10-12.5)^2*0.08+(11-12.5)^2*0.15+(12-12.5)^2*0.30\) \(+(13-12.5)^2*0.12+(14-12.5)^2*0.20+(15-12.5)^2*0.07\)

Vx<-sum(f*(x-Ex)^2)
Vx
## [1] 1.85

y

\[σ=\sqrt(V(x))\]

resulta:

Dx=sqrt(Vx)
Dx
## [1] 1.360147

Ejemplo Sea X una variable aleatoria con posibles valores x= 0,1,2 tal que P(X=0)=1/3, P(X=1)=1/6 y P(X=2)=1/2. Establecer las funciones f(x), F(x) y las gráficas de probabilidad y de probabilidad acumulada.

La función f(x) se representa como:

\[f(x)=P(X=x)= \left\{ \begin{array}{lcc} 1/3 & \ x=0, \\ 1/6 & \ x=1, \\ 1/2 & \ x=2 \end{array} \right.\]

x<-c(0,1,2)
f<-c(1/3, 1/6, 1/2)
plot(x,f,type="h", xlab="x",ylab="P(X=k)",main="Función de Probabilidad f(x)", ylim=c(0,1), col = "blue")

La función F(x) de probabilidad acumulada

\[F(x)=P(X\le x)= \left\{ \begin{array}{lcc} 0 & \ -∞<x\lt0 \\ 2/6 & \ 0≤x\lt1 \\ 3/6 & \ 1≤x\lt2 \\ 1 & \ x\ge2 \end{array} \right.\]

x<-c(0,1,2)
f<-c(0, 1/3, 1/6, 1/2)
f1<-cumsum(f)
f1
## [1] 0.0000000 0.3333333 0.5000000 1.0000000
y<-f1
plot(stepfun(x,y, right= TRUE), col ="red", verticals = FALSE,main="Función de Probabilidad Acumulada F(x)")
abline (v = 0, lty = 2:3)
abline (v = 1.9, lty = 2:3)

Observar que

\(F(2)=P(X\le2)=P(X=0)+P(X=1)+P(X=2)=\frac{2}{3}+\frac{1}{6}+\frac{1}{2}\)

f<-c(0, 1/3, 1/6, 1/2)
sum(f)
## [1] 1

\(F(0.5)=P(X\le0.5)=P(X\le0)=P(X=0)=\frac{1}{3}\) ver gráfica de F(x)

\(F(1.9)=P(X\le1.9)=P(X\le1.0)=P(X=0)+P(X=1)=\frac{1}{2}\) ver gráfica de F(x)

Otras referencias son:

https://rpubs.com/noatravassos/835541

Distribución Uniforme

Fuente https://rpubs.com/AndresCruz/634182

\(X\) es una variable aleatoria con distribución uniforme discreta, finita. Es decir sólo puede tomar un número finito de valores o resultados discontinuos \({x1,…,xn}\) de tal forma que la probabilidad de que se obtenga cada valor es igual (es decir la misma): \(1/n\). Si la variable toma valores entre 0 y n, se escribe \(X∼U(0,n)\) si

\[P(X=x)= \left\{ \begin{array}{lcc} 1/n & \text{si} & x=x_1,x_2,\ldots,x_n. \\ \\ 0 & & \text{si no}. \end{array} \right.\]

Distribución Binomial

Función de Probabilidad Binomial

Referencia:https://rpubs.com/hllinas/R_Binomial

https://estadistica-dma.ulpgc.es/cursoR4ULPGC/10-distribProbabilidad.html

La función de probabilidad binomial se representa mediante

\[f(k)=P(X=k)=b(k,n,p)= {n\choose k} p^k\, (1-p)^{n-k} \qquad k=0,1,2, \ldots, n\]

  • En R la probabilidad en un punto \(P(X=k)\) se calcula con dbinom(k,n,p).

  • La probabilidad en un intervalo \(P(X\le k)\) se obtiene mediante pbinom(k,n,p)

  • El cuantil \(q_{a}=\min\left\{ x:\, P\left(X\le x\right)\ge a\right\}\) se obtiene mediante qbinom(a,n,p) y

  • m números aleatorios con una distribución binomial se generan con rbinom(m,n,p)

Ejemplo: Una urna contiene 6 esferas, 4 blancas y 2 rojas. Si se toman 5 esferas, una después de la otra, se anota el color y se regresa a la urna, antes de elegir la siguiente (muestreo con remplazo).

Encontrar la probabilidad de que resulten dos rojas \[P(X=2)\] \[P(X= 2) = {5\choose 2} (1/6)^2\, (1-1/6)^{6-2} = 0.3292181\]

Solución a: La función de probabilidad se puede calcular de acuerdo a lo siguiente:

n<- 5
k <- 2
p<-2/6
combinaciones <- choose(n,k)
exito <- p^k # salen tres rojas
fracaso <- (1-p)^(n-k)
probabilidad <- combinaciones*exito*fracaso
probabilidad
## [1] 0.3292181

o bien, mediante la función propuesta por R.

\[P(X=k) = b(k,n,p)\]

n<- 5
k <- 2
p<-2/6
dbinom(k,n,p)
## [1] 0.3292181

En seis ensayos, la variabe asociada a este experimento binomial (extracción de 5 esferas con remplazo), es decir X = # de rojas tienw el siguiente dominio \(D={0,1,2,3,4,5}\). Las probabilidades son:

dbinom(0:5,5,2/6)
## [1] 0.131687243 0.329218107 0.329218107 0.164609053 0.041152263 0.004115226
cbind(0:5,dbinom(0:5,5,2/6))
##      [,1]        [,2]
## [1,]    0 0.131687243
## [2,]    1 0.329218107
## [3,]    2 0.329218107
## [4,]    3 0.164609053
## [5,]    4 0.041152263
## [6,]    5 0.004115226

La representación gráfica de esta función puede obtenerse siguiendo la idea descrita para la función de probabilidad f(x) se obtiene mediante:

x<-0:5
f<-dbinom(0:5,5,2/6)
plot(x,f,type="h",las=1, lwd=2, xlab="x",ylab="P(X=k)",main="Función de Probabilidad b(k,n,p)", ylim=c(0,0.6), col = "blue")

f<-c(0,dbinom(0:5,5,2/6)) # observe la inclusión de cero 
f1<-cumsum(f)
f1
## [1] 0.0000000 0.1316872 0.4609053 0.7901235 0.9547325 0.9958848 1.0000000
y<-f1
plot(stepfun(x,y,,right= TRUE), col ="red", verticals = FALSE,main="Función de Probabilidad Acumulada B(n,p)",las=1, lwd=2)

Ejercicio 4.46

Respuesta

La función de probabilidad también se denomina función de masa

La gráfica es:

x<-0:10
f<-dbinom(0:10,10,0.5)
plot(x,f,type="h",las=1, lwd=2, xlab="x",ylab="P(X=k)",main="Función de Probabilidad b(k,n,p)", ylim=c(0,0.6), col = "blue")

Los valores de probabilidad para cada valor de la variable X son:

cbind(0:10,dbinom(0:10,10,0.5))
##       [,1]         [,2]
##  [1,]    0 0.0009765625
##  [2,]    1 0.0097656250
##  [3,]    2 0.0439453125
##  [4,]    3 0.1171875000
##  [5,]    4 0.2050781250
##  [6,]    5 0.2460937500
##  [7,]    6 0.2050781250
##  [8,]    7 0.1171875000
##  [9,]    8 0.0439453125
## [10,]    9 0.0097656250
## [11,]   10 0.0009765625

El mas factible es para el valor de X = 5

max(dbinom(0:10,10,0.5))
## [1] 0.2460938

El menos factible es para el valor de X = 0

min(dbinom(0:10,10,0.5))
## [1] 0.0009765625

d).- \(P(3\le X\lt5)=P(X\le4)- P(X\le2)\)

pbinom(4,10,0.5)-pbinom(2,10,0.5)
## [1] 0.3222656

o bien

\(P(3\le X\lt5)=P(X=3)+ P(X=4)\)

dbinom(3,10,0.5)+dbinom(4,10,0.5)
## [1] 0.3222656

Respuesta

a).- \(P(X=5)=b(5,10,0.5)\)

dbinom(5,10,0.5)
## [1] 0.2460938

b).- \(P(X\le2)=\sum_{k=0}^{k=2}{b(k,10,0.5)}\)

sum(dbinom(0:2,10,0.5))
## [1] 0.0546875

c).- \(P(X\ge9)=\sum_{k=9}^{k=10}{b(k,10,0.5)}=1-P(X\lt9)=1-P(\le8)=b(0:8,10,0.5)\)

sum(dbinom(9:10,10,0.5))
## [1] 0.01074219

o bien

\(P(X\ge9)=1-P(X\lt9)=1-P(X\le8)=1-b(0:8,10,0.5)\)

1-sum(dbinom(0:8,10,0.5))
## [1] 0.01074219

La función de probabilidad binomial con diferentes tamaños de muestra n=5,15,25,35,50,100, para la probabilidad de p=0.5.

plot(dbinom(0:10,10,0.6),type="h",xlab="k",ylab="P(X=k)",main="Función de Probabilidad B(10,0.6)")

https://rkabacoff.github.io/datavis/Customizing.html#labels-1

https://fhernanb.github.io/Manual-de-R/discretas.html