Calcular densidad y probabilidades de cualquier distribuciones Binomial, Poisson Hipergeométrica Normal, Normal Estándar y T Student
Calcular densidad y probabilidades de las distribuciones con variables continuas continuas Binomial, Poisson Hipergeométrica con variables discretas y Normal, Normal Estándar, T Student con variables continuas continuas
Cargar librerías
library(ggplot2)
library(mosaic)
## Registered S3 method overwritten by 'mosaic':
## method from
## fortify.SpatialPolygonsDataFrame ggplot2
##
## The 'mosaic' package masks several functions from core packages in order to add
## additional features. The original behavior of these functions should not be affected by this.
##
## Attaching package: 'mosaic'
## The following objects are masked from 'package:dplyr':
##
## count, do, tally
## The following object is masked from 'package:Matrix':
##
## mean
## The following object is masked from 'package:ggplot2':
##
## stat
## The following objects are masked from 'package:stats':
##
## binom.test, cor, cor.test, cov, fivenum, IQR, median, prop.test,
## quantile, sd, t.test, var
## The following objects are masked from 'package:base':
##
## max, mean, min, prod, range, sample, sum
library(visualize)
¿Cuál es el valor de x = 5, cuando la probabilidad de éxito es de 60% de una distribución binomial que tiene 10 observaciones?
dens <- dbinom(x = 5, size = 10, prob = 0.60)
dens
## [1] 0.2006581
plotDist('binom', params=list( 10, .60))
¿Cuál es el valor de x = 7, cuando la probabilidad de éxito es de 60% de una distribución binomial que tiene 10 observaciones?
dens <- dbinom(x = 7, size = 10, prob = 0.60)
dens
## [1] 0.2149908
plotDist('binom', params=list( 10, .60))
¿Cuál es el valor de x = 6, cuando la probabilidad de éxito es de 40% de una distribución binomial que tiene 12 observaciones?
dens <- dbinom(x = 6, size = 12, prob = 0.40)
dens
## [1] 0.1765791
plotDist('binom', params=list( 12, .40))
La probabilidad de que una persona de en el blanco con un arco es del 0.25% (éxito)
¿Cuál es la probabilidad de que haciendo 10 intentos le atine al tercer intento x = 3
dens <- dbinom(x=3, size = 10, prob = 0.25)
dens
## [1] 0.2502823
plotDist('binom', kind = "cdf", params=list( 10, .25))
¿Cuál es la probabilidad de que haciendo 10 intentos le atine cuando mucho a tres o le atine máximo en tres ocasiones?
prob <- pbinom(q = 3, size = 10, prob = 0.25)
prob
## [1] 0.7758751
plotDist('binom', kind = "cdf", params=list( 10, .25))
¿Cuál es la probabilidad de que haciendo 10 intentos le atine cuando menos a 4 ocasiones?
prob <- pbinom(q = 4, size = 10, prob = 0.25, lower.tail = FALSE)
prob
## [1] 0.07812691
plotDist('binom', params=list( 10, .25))
¿Cuál es el valor de la densidad de x=2 en una distribución de Poisson cuando la media es igual a 4?
dens <- dpois(x = 2, lambda = 4)
dens
## [1] 0.1465251
plotDist(dist = "pois", kind = "density", params=list(4))
¿Cuál es el valor de la densidad de x=5 en una distribución de Poisson cuando la media es igual a 4?
dens <- dpois(x = 5, lambda = 4)
dens
## [1] 0.1562935
plotDist(dist = "pois", kind = "density", params=list(4))
¿Cuál es el valor de la probabilidad acumulada x≤5 en una distribución de Poisson cuando la media (lambda λ) es igual a 4?
prob <- ppois(q = 5, lambda = 4)
prob
## [1] 0.7851304
plotDist(dist = "pois", kind = "cdf", params=list(4))
¿Cuál es el valor de la probabilidad acumulada x≤7 en una distribución de Poisson cuando la media (lambda λ) es igual a 4?
prob <- ppois(q = 7, lambda = 4)
prob
## [1] 0.9488664
plotDist(dist = "pois", kind = "cdf", params=list(4))
Si un banco recibe en promedio 6 cheques sin fondo por día, ¿cuáles son las probabilidades de que reciba,
cuatro cheques sin fondo en un día dado, \(P(x=4)\)
media <- 6
dpois(x = 4, lambda = media)
## [1] 0.1338526
plotDist(dist = "pois", kind = "density", params = media)
10 cheques o menos sin fondos en un dia? \(P(x\le10)\)
media <- 6
ppois(q = 10, lambda = media)
## [1] 0.9573791
plotDist(dist = "pois", kind = "cdf", params = media)
mas de siete cheques sin fondos en un dia? \(P(x\ge7)\)
media <- 6
ppois(q = 7, lambda = media, lower.tail = FALSE)
## [1] 0.2560202
plotDist(dist = "pois", kind = "cdf", params = media)
##Hipergeométrica
Diez refrigeradores de cierto tipo han sido devueltos a un distribuidor debido al a presencia de un ruido oscilante agudo cuando el refrigerador está funcionando.
Supongamos que 4 de estos 10 refrigeradores tienen compresores defectuosos y los otros 6 tienen problemas más leves.
Si se examinan al azar 5 de estos 10 refrigeradores, y se define la variable aleatoria X: “el número entre los 5 examinados que tienen un compresor defectuoso.”
La variable aleatoria es x=0,1,2,3….compresor defectuoso
N <- 10 # Total de refrigeradores
k <-5 # Los que se extraen
m <- 4 # Los que posiblemente están con problema de compresor
n <- N - m # Los que no tienen problemas
¿Cuál es la probabilidad de que más de uno incluyendo el uno tenga fallas de compresor? P(x≥0)
phyper(q = 0, m = m, n = n, k = k, lower.tail = FALSE)
## [1] 0.9761905
plotDist(dist = "hyper", kind = "density", params = list(m = m, n= n, k=k))
La probabilidad de que a lo mas 1 tenga fallas de compresor P(x≤1)
phyper(q = 1, m = m, n = n, k = k)
## [1] 0.2619048
plotDist(dist = "hyper", kind = "cdf", params = list(m = m, n= n, k=k))
La media de los pesos de 500 estudiantes de un colegio es 70kgs y la desviación típica 3kgs. Los datos se distribuyen normalmente.
¿Cuál es la probabilidad de encontrar estudiantes que pesen entre 65 y 75 P(65≤x≤75)
media <- 70
desv <- 3
pnorm(q = 75, mean = media, sd = desv) - pnorm(q = 65, mean = media, sd = desv)
## [1] 0.9044193
plotDist(dist = "norm", mean=media, sd= desv, groups = x >=65 & x<=75, type = "h")
¿Cuál es la probabilidad de encontrar estudiantes que pesen mas de 75 kgs P(x≥75)
pnorm(q = 75, mean = media, sd = desv, lower.tail = FALSE)
## [1] 0.04779035
plotDist(dist = "norm", mean=media, sd= desv, groups = x >=75, type = "h")
¿Cuál es la probabilidad de encontrar estudiantes que pesen menos o igual a 65 P(x≤65)
pnorm(q = 65, mean = media, sd = desv)
## [1] 0.04779035
plotDist(dist = "norm", mean=media, sd= desv, groups = x<=65, type = "h")
Del ejercicio anterior de una distribución normal con media igual a 70 y desviación igual a 3 μ=0;σ=3, convertir o transformar los valores de x=60,61,62…78,79,80 a valores en z y determianar probabilidades
media <- 70
desv <- 3
xs <- 60:80
#xs
zs <- (xs - media) / desv
#zs
tabla <- data.frame(xs, zs)
tabla
## xs zs
## 1 60 -3.3333333
## 2 61 -3.0000000
## 3 62 -2.6666667
## 4 63 -2.3333333
## 5 64 -2.0000000
## 6 65 -1.6666667
## 7 66 -1.3333333
## 8 67 -1.0000000
## 9 68 -0.6666667
## 10 69 -0.3333333
## 11 70 0.0000000
## 12 71 0.3333333
## 13 72 0.6666667
## 14 73 1.0000000
## 15 74 1.3333333
## 16 75 1.6666667
## 17 76 2.0000000
## 18 77 2.3333333
## 19 78 2.6666667
## 20 79 3.0000000
## 21 80 3.3333333
¿Cuál es la probabilidad de encontrar personas entre 65 y 75 convertidos a valores en z?
x1 = 65; x2 = 75
z1 = (x1 - media) / desv;
z2 = (x2 - media) / desv;
pnorm(q = z2) - pnorm(q = z1)
## [1] 0.9044193
plotDist(dist = "norm", groups = x >=z1 & x<=z2, type = "h")
¿Cuál es la probabilidad de encontrar estudiantes que pesen mas de 75 kgs P(x≥75) valores en z
x <- 75
z <- (x - media) / desv;
pnorm(q = z, lower.tail = FALSE)
## [1] 0.04779035
plotDist(dist = "norm", groups = x >=z , type = "h")
¿Cuál es la probabilidad de encontrar estudiantes que pesen menos o igual a 65 P(x≤65) convertidos a z
x <- 65
z <- (x - media) / desv;
pnorm(q = z)
## [1] 0.04779035
plotDist(dist = "norm", groups = x >=z , type = "h")
Cuál es el intervalo de confianza y el valor estimado de una media poblacional que esté dentro de ese intervalo a un 90% de confianza con 10 grados de libertad, de una muestra t Student con media = 5, y desviación = 1.5. gd=10;x¯=5,S=1.5
media.m <- 5
desv.m <- 1.5
n <- 11
confianza <- 0.90
tabla <- data.frame(variables = c("n", "Grados libertad", "Media muestra", "Desv.Std muestra", "Media Pob.", "Confianza"), datos = c(n, (n-1), media.m, desv.m, NA, confianza))
tabla
## variables datos
## 1 n 11.0
## 2 Grados libertad 10.0
## 3 Media muestra 5.0
## 4 Desv.Std muestra 1.5
## 5 Media Pob. NA
## 6 Confianza 0.9
t <- qt(p = (1 - confianza) / 2, df = n-1) # dos colas
t <- abs(t)
t
## [1] 1.812461
li <- media.m - t * (desv.m /sqrt(n) )
ls <- media.m + t * (desv.m /sqrt(n) )
print("intervalo")
## [1] "intervalo"
intervalo <- c(li, ls)
intervalo
## [1] 4.180284 5.819716
El intervalo de confianza con valores entre 4.1802836 y 5.8197164 con un 90% de confianza se interpreta que la media de la población debe estar en ese intervalo.
visualize.t(stat = c(-t, t), df = n-1, section = "tails") +
text(0, 0.2, paste(confianza*100, "%"), col = "red")
## integer(0)
Se puede observar en cada uno de los ejercicios que la probabilidad se calcula de forma muy diferente debido a la configuración de elementos (datos y situación), ya que por ejemplo; la distribucion binomial aplica cuando existe solo dos eventos posibles (exito y fracaso) como se muestra en los resultados del ejercicio del arco. El individuo tiene una probabilidad de 77% de conectar tres o menos tiros en 10 lanzamientos de flecha.
La distribucion de Poisson es identificable al tener como dato una valor promedio o media. Por tanto, en el problema de este tema, se observa que la probabilidad de ocurrencia se incrementa al acercarse al valor de la media (94% al esperar 7 exitos con media de 4 ó el problema de los cheques donde la probabilidad de recibir mas de 7 cheques sin fondo es de 25%).
El ejercicio del refrigerador corresponde a una distribucion hipergeométrica, ya que tenemos algunos defrctuosos y al evluar una muestra se desea determinar cuantos de estos aparecerán. Por ejemplo, la probabilidad que máximo 1 tenga fallas es de 26%.
Referente a la distribucion normal, se analizó el peso de varias personas y se obtuvo una media de 70kg y desviación estandar de 3 kg. Dadas las caracteristicas, encontrar una persona del grupo con peso entre 65 y 75 kg es 90% probable. De esta forma se puede obtener la probabilidad de diversos rangos de valores para el peso de las personas usando la distribucion normal. Al comparar con la estandarizada observamos que la probabilidad es la misma ya que solo se usan datos Z pero la distribucion no cambia su comportamiento.
Finalmente, se obtuvieron intervalos de confianza para la media usando la distribucion t student y algunos datos conocidos (obtenieendo rango para la media de 4.18 a 5.81)
Anderson, David R., Dennis J. Sweeney, and Thomas A. Williams. 2008. Estadística Para Administración y Economía. 10th ed. Australia • Brasil • Corea • España • Estados Unidos • Japón • México • Reino Unido • Singapur: Cengage Learning,. “La Distribución Binomial o de Bernoulli.” n.d. https://www.profesor10demates.com/2014/04/la-distribucion-binomial-o-de-bernoulli_3.html. Mendenhall, William, Robert J. Beaver, and Barbara M. Beaver. 2006. Introducción a La Probabilidad y Estadística. 13a Edición. Walpole, Ronald E., Raymond H. Myers, and Sharon L. Myers. 2012. Probabilidad y Estadística Para Ingeniería y Ciencias. Novena Edición. México: Pearson.