A continuación se presenta el objetivo general de la práctica:
A continuación, se presenta los objetivos específicos que tiene la siguiente práctica:
Calcular Las Densidades De La Distribución Exponencial Manualmente Emplela La Función Dexp().
Calcular Las Probabilidades Acumuladas De Acuerdo A La Función De Probabilidades Pexp() De Varios Ejercicios Relacionados Con Distribución Exponencial.
Mostrar Los Gráficos De Densidad Y Probabilidad Acumulada Con Las Funciones Visualzie() De La Librería Visualize Y Distplot() De La Librería Mosaic
Realizar la Interpretación De La Práctica Correspondiente.
La probabilidad y la estadística están relacionadas en una forma importante. La probabilidad se emplea como herramienta; permite que se evalúe la confiabilidad de las conclusiones acerca de la población cuando tenga sólo información muestral.
Por otra parte, la probabilidad indica el grado de certidumbre o certeza de un suceso o fenómeno estudiado, en la investigación científica existen muchos fenómenos en los cuales es necesario determinar la probabilidad de que un evento ocurra o dejen de ocurrir, para lo cual el estudio de este campo, es necesario.
Además tiene aplicaciones muy importantes en investigación; dado que es base para la inferencia estadística que permite el estudio de muestras con el objetivo de inferir o extrapolar características de estas a una población.
La definición propia de una variables estadísticas es la siguiente, de acuerdo con los estipulado por Enciclopedia en su sitio web (2022):
Una variable estadística es una característica de una muestra o población de datos que puede adoptar diferentes valores.
Cuando hablamos de variable estadística estamos hablando de una cualidad que, generalmente adopta forma numérica. Por ejemplo, la altura de Juan es de 180 centímetros. La variable estadística es la altura y está medida en centímetros.
Claro que no todas las variables estadísticas son iguales y, por supuesto, no todas se pueden (en principio) expresar en forma de número.
Aunque hay decenas de tipos de variables estadísticas, por norma general podemos encontrarnos dos tipos de variables:
Variable Cuantitativa: Son variables que se expresan numéricamente.
Variable Continua: Toman un valor infinito de valores entre un intervalo de datos. El tiempo que tarda un corredor en completar los 100 metros lisos.
Variable Discreta: Toman un valor finito de valores entre un intervalo de datos. Número de helados vendidos.
Variable Cualitativa: Son variables que se expresan, por norma general, en palabras.
Variable Ordinal: Expresa diferentes niveles y orden.
Variable Nominal: Expresa un nombre claramente diferenciado. Por ejemplo el color de ojos puede ser azul, negro, castaño, verde, etc.
La definición propia de una variable aleatoria continua es la siguiente, de acuerdo con los estipulado por Enciclopedia en su sitio web (2019):
Una variable aleatoria es la función matemática de un experimento aleatorio.
Cómo podemos comprobar la frase se compone básicamente de dos conceptos: función matemática y experimento aleatorio. Es decir, debemos entender primero qué es una función matemática y, posteriormente, definir qué entendemos por experimento aleatorio.
Función matemática: Dicho de manera sencilla, es una ecuación que asigna valores a una variable (variable dependiente) en función de otras variables (variables independientes).
Experimento aleatorio: Es un fenómeno de la vida real cuyos resultados se deben completamente al azar. Es decir, bajo las mismas condiciones iniciales arroja resultados diferentes.
Por la tanto una variable aleatoria, es una ecuación que describe o intenta describir los resultados (con un número) de un evento cuyos resultados se deben al azar.
En otras palabras, pensemos en una variable aleatoria que tome valores enteros.
Cabe ser preciso, así como recalcar que una variable continua es un tipo de variable cuantitativa, o lo que es lo mismo, que se puede expresar mediante cifras. De esta forma, a parte de estos datos se pueden realizar análisis estadísticos y operaciones matemáticas.
Sea X una variable aleatoria continua. Entonces, una distribución de probabilidad o función de densidad de probabilidad (pdf) de X es una función \(f(x)\) de modo tal que para dos números cualesquiera a y b con \(a \le b\)
En teoría de la probabilidad y estadística, la distribución de probabilidad de una variable aleatoria es una función que asigna a cada suceso definido sobre la variable, la probabilidad de que dicho suceso ocurra.
La distribución de probabilidad está definida sobre el conjunto de todos los sucesos y cada uno de los sucesos es el rango de valores de la variable aleatoria. También puede decirse que tiene una relación estrecha con las distribuciones de frecuencia.
La distribución de probabilidad está completamente especificada por la función de distribución, cuyo valor en cada x real es la probabilidad de que la variable aleatoria sea menor o igual que x.
Esta división se realiza dependiendo del tipo de variable a estudiar. Las cuatro principales (de las que nacen todas las demás) son:
A) Si la variable es una variable discreta (números enteros), corresponderá una distribución discreta, de las cuales existen:
Distribución Binomial (eventos independientes).
Distribución De Poisson (eventos independientes).
Distribución Hipergeométrica (eventos dependientes).
B) Si la variable es continua (números reales), la distribución que se generará será una distribución continua. Ejemplos de ellas son:
Distribución Normal.
Distribución Exponencial
De Acuerdo Anderson (2018) la distribución de probabilidad exponencial se aplica a variables como las llegadas de automóviles a un centro de lavado de autos, los tiempos requeridos para cargar un camión, las distancias entre dos averías en una carretera, entre otras situaciones.
Otros contextos para tratar con distribución exponencial ptiene que ver con la cantidad de tiempo que transcurre hasta que se produce algún evento específico. Por ejemplo, la cantidad de tiempo (que comienza ahora) hasta que se produzca un terremoto tiene una distribución exponencial. Otros ejemplos son la duración, en minutos, de las llamadas telefónicas de larga distancia comerciales y la cantidad de tiempo, en meses, que dura la batería de un automóvil. También se puede demostrar que el valor del cambio que se tiene en el bolsillo o en el monedero sigue una distribución exponencial aproximadamente.
Por otra parte la representación visual de la densidad de una distribución exponencial significa que hay valores de densidad altos a valores de \(x\) pequeños y viceversa, hay valores de densidad bajo a grandes valores de \(x\).
La distribución exponencial es una distribución de probabilidad continua que se utiliza para modelar el tiempo o espacio entre eventos en un proceso y tiene relación directa con la distribución discreta de Poisson.
La distribución exponencial es la distribución de probabilidad del tiempo o espacio entre dos eventos en un proceso de Poisson, donde los eventos ocurren de manera continua e independiente a una tasa constante \(\lambda\) llamado lambda.
\(\lambda\) lambda representa una tasa constante (valor constante) sobre la ocurrencia de eventos de manera continua e independiente.
En R existen las funciones estadísticas para tratar con distribución expnencial que se obervarán en este caso:
dexp() para densidad,
pexp() para probabilidad acumulada
qexp para devolver valores de x de acuerdo a probabilidades acumuladas. Es la inversa de pexp()
rexp() para generación de valores aleatorios de x.
\[ f(x) = \lambda \cdot e^{-\lambda\cdot x} \]
La función de densidad en R se obtiene con dexp()
Se requiere el valor de lambda \(\lambda\) taza constante y continua y/o valor de media a la inversa. Si se tiene la media de la distribución, entonces \(\lambda = 1/\mu\) que es la inversa de la media.
Se requiere el valor de \(e =2.718282\)
Se requiere el valor de la variable aleatoria continua \(x\)
\[ F(x) = P(X\le x) = 1 - e^{-\lambda\cdot x} \text{ si x } \ge 0 \]
La función acumulada de probabilidad en R se obtiene con pexp()
\[ \frac{1}{\lambda} = \mu \]
\[ Varianza = \sigma^{2}= \frac{1}{\lambda^{2}} \]
\[ Desv.Std = \sigma = \sqrt{\sigma^{2}} \]
En los siguientes ejercicios también se utilizan funciones de paquetes predeterminados de lenguaje de R para una mejor comprensión de la distribución binomial.
# Importación De Los Paquetes Y Librerías Necesarias Para La Realización De La Práctica
library(dplyr) # Para filtros entre otros
library(mosaic) # Para gráficos
library(ggplot2) # Para gráficos
library(cowplot) # Imágenes en el mismo renglón
library(visualize) # Para gráficos
# Acomodo Del Tipo De Notación Para El Muestro De Los Valores Obtenidos
options(scipen=999) # Notación normal
# options(scipen=1) # Notación científica
source("https://raw.githubusercontent.com/rpizarrog/probabilidad-y-estad-stica/master/2023/funciones/funciones%20para%20disribuciones%20de%20probabilidad.R")
##
## Attaching package: 'gtools'
## The following object is masked from 'package:mosaic':
##
## logit
##
## Attaching package: 'plotly'
## The following object is masked from 'package:mosaic':
##
## do
## The following object is masked from 'package:ggplot2':
##
## last_plot
## The following object is masked from 'package:stats':
##
## filter
## The following object is masked from 'package:graphics':
##
## layout
Se necesita implementar una semilla para la generación de valores aleatorios, ya qwue, en alguna actividad será necesario hacer uso de estos.
# Implementación De Una Semilla Aleatoria
set.seed(2023)
Se crea una secuencia de valores de x desde 0 hasta 10 de saltos 0.2 en .2 para generar 50 valores continuos.
La constante lambda vale 1 \(1/\mu = 1/1=1\) que representa el parámetro de tasa (inversa de la media) en la distribución exponencial de acuerdo a la fórmula de densidad y de la probabilidad acumulada de la distribución exponencial.
Calcular la densidad de acuerdo a la fórmula de densidad de la distribución exponencial: \(densidad = f(x) = \lambda \cdot e^{-\lambda\cdot x}\) y usando la función dexp() respectivamente. Los valores de densidad deben salir igual por cualquiera de las dos alternativas.
media = 1
lambda = 1/media
e = exp(1)
x=0.5
# Densidad conforme a la fórmula
densidad = lambda * e ^(-lambda*x)
densidad
## [1] 0.6065307
# Densidad usando dexp()
dexp(x = x, rate = lambda)
## [1] 0.6065307
Ahora calculando probabilidades acumuladas con la fórmula \(Prob. Acumulada = F(x) = 1 - e^{-\lambda\cdot x}\) y con la función pexp(). Deben salir los valores calculados exactamente iguales. Por defecto la probabilidad acumulada es cola a la izquierda, si se cola a la derecha hay que restarle la probabilidad a 1 que representa el 100%.
print("Por medio de la fórmula")
## [1] "Por medio de la fórmula"
prob.acum = 1 - e^(-lambda * x)
prob.acum
## [1] 0.3934693
print("Usando la función pexp()")
## [1] "Usando la función pexp()"
pexp(q = x, rate = lambda)
## [1] 0.3934693
Por defecto la probabilidad acumulada es cola a la izquierda, si se probabilidad mayor que x, significa cola a la derecha, por lo que hay que restarle la probabilidad a 1 que representa el 100%. Se utiliza el argumento lower.tail = FALSE en la función pexp() para indicarle que es cola a la derecha o que la probabilidad es mayor o igual al valor de \(x\) especificado.
# Probabilidad a la derecha F(x>0.5)
1 - prob.acum
## [1] 0.6065307
# Probabilidad cola a la derecha con pexp()
pexp(q = x, rate = lambda, lower.tail = FALSE)
## [1] 0.6065307
Ahora construyendo una serie de densidades y probabilidades acumuladas a partir de una secuencia de 0 a 10 con saltos de 0.2 en 0.2.
# media = 1
# lambda = 1/media
x = seq(from = 0, to= 10, by=0.2)
# Densidad
print("Densidad")
## [1] "Densidad"
densidad <- round(dexp(x = x, rate = lambda), 6)
densidad
## [1] 1.000000 0.818731 0.670320 0.548812 0.449329 0.367879 0.301194 0.246597
## [9] 0.201897 0.165299 0.135335 0.110803 0.090718 0.074274 0.060810 0.049787
## [17] 0.040762 0.033373 0.027324 0.022371 0.018316 0.014996 0.012277 0.010052
## [25] 0.008230 0.006738 0.005517 0.004517 0.003698 0.003028 0.002479 0.002029
## [33] 0.001662 0.001360 0.001114 0.000912 0.000747 0.000611 0.000500 0.000410
## [41] 0.000335 0.000275 0.000225 0.000184 0.000151 0.000123 0.000101 0.000083
## [49] 0.000068 0.000055 0.000045
# Acumulada
print("Probabilidad Acumulada")
## [1] "Probabilidad Acumulada"
acumulada <- round(pexp(q = x, rate = lambda), 6)
acumulada
## [1] 0.000000 0.181269 0.329680 0.451188 0.550671 0.632121 0.698806 0.753403
## [9] 0.798103 0.834701 0.864665 0.889197 0.909282 0.925726 0.939190 0.950213
## [17] 0.959238 0.966627 0.972676 0.977629 0.981684 0.985004 0.987723 0.989948
## [25] 0.991770 0.993262 0.994483 0.995483 0.996302 0.996972 0.997521 0.997971
## [33] 0.998338 0.998640 0.998886 0.999088 0.999253 0.999389 0.999500 0.999590
## [41] 0.999665 0.999725 0.999775 0.999816 0.999849 0.999877 0.999899 0.999917
## [49] 0.999932 0.999945 0.999955
datos <- data.frame(x = x, f.x = densidad, F.x = acumulada)
datos
## x f.x F.x
## 1 0.0 1.000000 0.000000
## 2 0.2 0.818731 0.181269
## 3 0.4 0.670320 0.329680
## 4 0.6 0.548812 0.451188
## 5 0.8 0.449329 0.550671
## 6 1.0 0.367879 0.632121
## 7 1.2 0.301194 0.698806
## 8 1.4 0.246597 0.753403
## 9 1.6 0.201897 0.798103
## 10 1.8 0.165299 0.834701
## 11 2.0 0.135335 0.864665
## 12 2.2 0.110803 0.889197
## 13 2.4 0.090718 0.909282
## 14 2.6 0.074274 0.925726
## 15 2.8 0.060810 0.939190
## 16 3.0 0.049787 0.950213
## 17 3.2 0.040762 0.959238
## 18 3.4 0.033373 0.966627
## 19 3.6 0.027324 0.972676
## 20 3.8 0.022371 0.977629
## 21 4.0 0.018316 0.981684
## 22 4.2 0.014996 0.985004
## 23 4.4 0.012277 0.987723
## 24 4.6 0.010052 0.989948
## 25 4.8 0.008230 0.991770
## 26 5.0 0.006738 0.993262
## 27 5.2 0.005517 0.994483
## 28 5.4 0.004517 0.995483
## 29 5.6 0.003698 0.996302
## 30 5.8 0.003028 0.996972
## 31 6.0 0.002479 0.997521
## 32 6.2 0.002029 0.997971
## 33 6.4 0.001662 0.998338
## 34 6.6 0.001360 0.998640
## 35 6.8 0.001114 0.998886
## 36 7.0 0.000912 0.999088
## 37 7.2 0.000747 0.999253
## 38 7.4 0.000611 0.999389
## 39 7.6 0.000500 0.999500
## 40 7.8 0.000410 0.999590
## 41 8.0 0.000335 0.999665
## 42 8.2 0.000275 0.999725
## 43 8.4 0.000225 0.999775
## 44 8.6 0.000184 0.999816
## 45 8.8 0.000151 0.999849
## 46 9.0 0.000123 0.999877
## 47 9.2 0.000101 0.999899
## 48 9.4 0.000083 0.999917
## 49 9.6 0.000068 0.999932
## 50 9.8 0.000055 0.999945
## 51 10.0 0.000045 0.999955
Usando ggplot
ggplot(data = datos, aes(x = x, y = f.x)) +
geom_point(color = 'blue') +
geom_line(color = 'red')
Aquí otra forma de representar curvas de densidad de una distribución exponencial [@rubio][@rubio]
curve(dexp(x, rate = 1.0), from=0, to=10, col='blue')
curve(dexp(x, rate = 1.5), from=0, to=10, col='red', add=TRUE)
curve(dexp(x, rate = 2.0), from=0, to=10, col='purple', add=TRUE)
legend("topright",
legend=c("rate=1.0", "rate=1.5", "rate=2.0"),
col = c("blue", "red", "purple"),
lty=1, cex=1.2)
También se puede usar visualize() y plotDist() para visualizar gráficas de distribuciones en este caso de la distribución exponencial, esta se muestra más adelante su uso.
Siguiendo con el ejercicio inicial de lambda = 1 con valores desde 0 hasta 10 de 0.2 en 0.2.
\(f(x\le0.5)\)
Entonces :
prob = round(pexp(q = 0.5, rate = lambda), 6)
paste("La probabilida área bajo la curva es ...", prob, " aproximadamente " , prob * 100, "%")
## [1] "La probabilida área bajo la curva es ... 0.393469 aproximadamente 39.3469 %"
Usando la función visualize.exp() de la librería visualize
visualize.exp(stat = 0.5, theta = lambda, section = "lower")
Visualizando con plotDist() de la librería mosaic
El área de color rosa representa aproximadamente el 39% del total del área bajo la curva.
plotDist(dist = "exp", media = lambda, type="h",xlab ="Valores de la variable continua X", ylab = "Densidad" , groups = x <= 0.5, xlim = c(0:5), ylim=c(0,1), main=paste("F(x ≤ 0.5):", prob), sub= paste('Lambda =', lambda))
Usando la función pre codificada f_exponencial_all() previamente cargada. La función recibe tres argumento en los tres parámetros que deben recibir: El valor de la media, el intervalo que puede ser empezar en 0 y terminar en un valor mayor que 0 y el tipo qe puede ser 1 cola a la izquierda, 2 cola a la derecha y 3 intervalo intermedio con valores a y b.
Esta primera opción es cola a la izquierda con valor tipo == 1
resultado <- f_exponencial_all(media = media, intervalo = c(0, 0.5), tipo = 1)
resultado$g_curva
\(P(0.5 \le X \le 2)\)
prob = round(pexp(q = 2, rate = lambda) - pexp(q = 0.5, rate = lambda), 6)
paste("La probabilidad del área bajo la curva es ...", prob, " aproximadamente " , prob * 100, "%")
## [1] "La probabilidad del área bajo la curva es ... 0.471195 aproximadamente 47.1195 %"
Nuevamente usando la función visualize.exp() de la librería visualize
visualize.exp(stat = c(0.5, 2), theta = lambda, section = "bounded")
Nuevamente usando la función distPlot() de la librería mosaic
plotDist(dist = "exp", media = lambda, type="h",xlab ="Valores de la variable continua X", ylab = "Densidad" , groups = x >= 0.5 & x<= 2, xlim = c(0:5), ylim=c(0,1), main=paste("F(0.5 ≤ x ≤ 2):", prob), sub= paste('Lambda =', lambda))
Esta segunda opción es un intervalo con valor tipo == 3
resultado <- f_exponencial_all(media = media, intervalo = c(0.5, 2), tipo = 3)
resultado$g_curva
\(P(X \ge 2)\)
prob = round(pexp(q = 2, rate = lambda, lower.tail = FALSE), 6)
paste("La probabilida área bajo la curva es ...", prob, " aproximadamente " , prob * 100, "%")
## [1] "La probabilida área bajo la curva es ... 0.135335 aproximadamente 13.5335 %"
Nuevamente usando la función visualize.exp() de la librería visualize
visualize.exp(stat = 2, theta = lambda, section = "upper")
Ahora usando plotDist()
plotDist(dist = "exp", media = lambda, type="h",xlab ="Valores de la variable continua X", ylab = "Densidad" , groups = x >= 2, xlim = c(0:5), ylim=c(0,1), main=paste("F(x ≥ 2):", prob), sub= paste('Lambda =', lambda))
Esta tercera opción usando la función f_exponencial_all() es cola a la derecha, es decir, tipo == 2
resultado <- f_exponencial_all(media = media, intervalo = c(0, 2), tipo = 2)
resultado$g_curva
De acuerdo a la fórmula arriba presentada:
VE = 1 / lambda
paste ("El valor esperado es ...", VE)
## [1] "El valor esperado es ... 1"
De acuerdo a la fórmula arriba presentada:
varianza = round(1 / lambda^2, 6)
desv.std = round(sqrt(varianza), 6)
paste("Varianza = ", varianza, "Desv.Std = ", desv.std)
## [1] "Varianza = 1 Desv.Std = 1"
Valor de x a partir de q
qexp(p = 0.393469, rate = lambda)
## [1] 0.4999994
print("Muy cercano al valor de x = 0.5")
## [1] "Muy cercano al valor de x = 0.5"
aleatorios = rexp
aleatorios
## function (n, rate = 1)
## .Call(C_rexp, n, 1/rate)
## <bytecode: 0x55a2ac9bb7f0>
## <environment: namespace:stats>
Ejercicio extraído de: [@probafácil]. El tiempo de revisión del motor de un avión sigue una distribución exponencial con media 22 minutos. Encontrar y resolver algunas probabilidades:
Encontrar la probabilidad de que el tiempo de revisión sea menor o igual a 10 minutos. \(F(X\le 10)\)
media <- 22
lambda <- 1/media
x <- 10
prob = round(pexp(q = x, rate = lambda), 6)
paste("La probabilidad es ...", prob, " aproximadamente " , prob * 100, "%")
## [1] "La probabilidad es ... 0.365264 aproximadamente 36.5264 %"
Se presenta la gráfica con la función visualize()
visualize.exp(stat = x, theta = lambda, section = "lower")
Se visualiza con la función plotDist() de librería mosaic.
plotDist(dist = "exp", media = lambda, type="h",xlab ="Valores de la variable continua X", ylab = "Densidad" , groups = x<=10, xlim = c(0:22), ylim=c(0,1), main=paste("F(x<=10):", prob), sub= paste('Lambda =:', lambda))
Ahora se presenta la misma gráfica pero usando la función f_exponencial_all(), cola a la izquierda.
Se envía parámetro tipo == 1 es cola a la derecha
resultado <- f_exponencial_all(media = media, intervalo = c(0, 10), tipo = 1)
resultado$g_curva
Encontrar la probabilidad de que el tiempo de revisión sea mayor o igual a 10 minutos. \(F(X\ge 10)\)
Se envía parámetro tipo == 2 es cola ala derecha
resultado <- f_exponencial_all(media = media, intervalo = c(10, 10), tipo = 2)
resultado$g_curva
Encontrar la probabilidad de que el tiempo de revisión sea mayor o igual 5 y menor o igual a 10 minutos. \(F(X\le 10)\)
Se envía parámetro tipo == 3 es ambas colas
resultado <- f_exponencial_all(media = media, intervalo = c(5, 10), tipo = 3)
resultado$g_curva
El valor esperado
resultado$VE
## [1] 22
Varianza y desviación estándar
resultado$varianza; resultado$desv.std
## [1] 484
## [1] 22
Se espera que haya un tiempo esperado medio de 22 minutos con una varición de
En este caso se representó un histograma para una serie de datos simulados.
La distribución exponencial es un modelo matemático que se utiliza para modelar el tiempo entre dos eventos sucesivos e independientes. Se trata de una distribución en la que la probabilidad de que el tiempo transcurrido entre dos eventos se ajuste a una curva exponencial es muy alta, y se utiliza en una serie de aplicaciones prácticas en la vida real, desde la ingeniería hasta la economía y la medicina.
Uno de los usos más comunes de la distribución exponencial es en el diseño de sistemas de mantenimiento y reparación de equipos. En estos casos, los tiempos entre los fallos y los costos asociados a la reparación de los mismos son variables aleatorias que siguen una distribución exponencial, algo que permite a los ingenieros calcular la frecuencia de las averías y los costos de mantenimiento.
Levine, D. M. (2010) Estadística para administración y economía. (7ª. ed.) México : Pearson Educación.
Mendenhall, W. (2010). Introducción a la Probabilidad y Estadística. (13ª. ed.) México: Cengage Learning.
Montgomery, D. C. (2011). Probabilidad y estadística aplicadas a la ingeniería. (2ª. ed.) México : Limusa: Wiley.
Quezada, L. (2010). Estadística para ingenieros. México : Empresa Editora Macro.ía