El taller comenzará con una breve introducción a la distribución normal. Se explicará que la distribución normal es una distribución de probabilidad continua que se caracteriza por su forma de campana.
La distribución normal se describe mediante dos parámetros: la media y la desviación estándar. La media es el valor central de la distribución y la desviación estándar es una medida de la dispersión de los datos alrededor de la media.
La función de densidad de probabilidad normal es la función que describe la probabilidad de que un valor se encuentre en un determinado intervalo. La función de densidad de probabilidad normal se puede expresar de la siguiente manera:
\[f(x) = \frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{{(x - \mu)}^2}{2\sigma^2}}\]
\[F(q) = \int_{-\infty}^{q}{\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{{(x - \mu)}^2}{2\sigma^2}}}dx\]
donde:
• \(f(x)\) es la función de densidad de probabilidad normal
• \(x\) o \(q\) son los valores que se están evaluando en cada caso
• \(\mu\) es la media de la distribución (mean)
• \(\sigma\) es la desviación estándar de la distribución (sigma)
En R, la función rnorm() se puede utilizar para generar valores aleatorios de una distribución normal. La función dnorm() se puede utilizar para calcular la función de densidad de probabilidad normal en un determinado punto. La función pnorm() se puede utilizar para calcular la probabilidad de que un valor se encuentre en un determinado intervalo.
¿Cuál es la diferencia entre la distribución normal y la distribución binomial?
La distribución normal es una distribución de probabilidad continua, mientras que la distribución binomial es una distribución de probabilidad discreta. La distribución normal se describe mediante dos parámetros: la media y la desviación estándar, mientras que la distribución binomial se describe mediante tres parámetros: el número de ensayos, la probabilidad de éxito y la probabilidad de fracaso.
¿Cómo se puede calcular la probabilidad de que un valor se encuentre en un determinado intervalo en una distribución normal?
La probabilidad de que un valor se encuentre en un determinado intervalo en una distribución normal se puede calcular utilizando la función pnorm() de R. Esta función toma como argumentos la media, la desviación estándar y el valor que se está evaluando.
¿Cómo se puede generar valores aleatorios de una distribución normal en R?
La función rnorm() de R se puede utilizar para generar valores aleatorios de una distribución normal. Esta función toma como argumentos la media y la desviación estándar.
Una prueba estandarizada tiene una media de 500 y una desviación estándar de 100. ¿Cuál es la probabilidad de que un estudiante obtenga una puntuación superior a 600?
En este caso, la media es \(\mu\) = 500 y la desviación estándar es \(\sigma\) = 100. La probabilidad de que un estudiante obtenga una puntuación superior a 600 es:
pnorm(q = 600, mean = 500, sd = 100, lower.tail = FALSE)
## [1] 0.1586553
Por lo tanto, la probabilidad de que un estudiante obtenga una puntuación (\(X:\text{Puntuación del estuciante}\)) superior a 600 (\(P(X{\geq}600)\)) es de aproximadamente el 16%.
library(ggfortify)
## Loading required package: ggplot2
ggdistribution(dnorm, seq(500-3*100, 500+3*100, 0.1), mean = 500, sd = 100, colour = "blue", p = ggdistribution(dnorm, seq(600, 500+3*100, 0.1), mean = 500, sd = 100, colour = "blue", fill = "blue"))
Una empresa tiene un promedio de 100 clientes por día (\(\mu=100\)). La desviación estándar es de 20 (\(\sigma=20\)) clientes. ¿Cuál es la probabilidad de que la empresa tenga más de 120 clientes un día determinado?
En este caso, la media es mu = 100 y la desviación estándar es sigma = 20. La probabilidad de que la empresa tenga más de 120 clientes un día determinado es:
1 - pnorm(q = 120, mean = 100, sd = 20)
## [1] 0.1586553
Por lo tanto, la probabilidad de que la empresa tenga más de 120 clientes ((\(P(X{\geq}120)\))) un día determinado es de aproximadamente el 16%.
library(ggfortify)
ggdistribution(dnorm, seq(100-3*20, 100+3*20, 0.1), mean = 100, sd = 20, colour = "blue", p = ggdistribution(dnorm, seq(120, 100+3*20, 0.1), mean = 100, sd = 20, colour = "blue", fill = "blue"))
El peso de los cachorros recién nacidos de una raza de perro tiene una distribución normal con una media de 1000 gramos y una desviación estándar de 200 gramos. ¿Cuál es la probabilidad de que un cachorro recién nacido pese más de 1200 gramos?
En este caso, la media es mu = 1000 y la desviación estándar es sigma = 200. La probabilidad de que un cachorro recién nacido pese más de 1200 gramos es:
pnorm(q = 1200, mean = 1000, sd = 200, lower.tail = FALSE)
## [1] 0.1586553
Por lo tanto, la probabilidad de que un cachorro recién nacido pese más de 1200 gramos es de aproximadamente el 16%.
library(ggfortify)
ggdistribution(dnorm, seq(1000-3*200, 1000+3*200, 0.1), mean = 1000, sd = 200, colour = "blue", p = ggdistribution(dnorm, seq(1200, 1000+3*200, 0.1), mean = 1000, sd = 200, colour = "blue", fill = "blue"))
El tiempo que tarda en desarrollarse una bacteria en un cultivo tiene una distribución normal con una media de 24 horas y una desviación estándar de 2 horas. ¿Cuál es la probabilidad de que una bacteria se desarrolle en menos de 22 horas?
En este caso, la media es mu = 24 y la desviación estándar es sigma = 2. La probabilidad de que una bacteria se desarrolle en menos de 22 horas es:
pnorm(q = 22, mean = 24, sd = 2)
## [1] 0.1586553
Por lo tanto, la probabilidad de que una bacteria se desarrolle en menos de 22 horas es de aproximadamente el 16%.
library(ggfortify)
ggdistribution(dnorm, seq(24-3*2, 24+3*2, 0.1), mean = 24, sd = 2, colour = "blue", p = ggdistribution(dnorm, seq(24-3*2, 22, 0.1), mean = 24, sd = 2, colour = "blue", fill = "blue"))