library(readxl)
datos <- read_excel("ejercicio5.xlsx")
Las distribuciones de probabilidad continua pueden tomar varias formas pero un gran número de variables aleatorias observadas en la naturaleza poseen una distribución de frencuencia que tiene más o menos la forma de montículo o más bien, como se diría en estadística, es aproximadamente una distribución normal de probabilidad que genera esta distribución es:
La fórmula qué genera esta distribución es: f(x)= ((1/2π)e)(-(x-u)2/(22))
El área debajo de la curva es igual a 1 Para vairables aleatorias continues, área = probabilidad El área a la izquierda media es igual a .5 El área a la derecha de la media es igual a .5
Las gráficas se van aplanando mediante la desviación estandar va aumentado STATDIST
Para hallar la probabilidad de que una variable aleatoria normal y se encuentre en el intervalo de “a” a “b” necesitamos obtener el área bajola curva normal entre los puntos “a” y “b”. No obstante, hay un número infinitamente grande de distribuciiones normales
Beneficio:
Nos permite usar la misam tabla para todas las istribuciones normales Definición La distribución de probabilidad para z se denomina “Distribución Normal Estandarizada”
Un estudio que el uso de gasolina para actos compactos vendidos en EEUU esta distribución normalmente, con una media de 25.5 millas por galón y una desviación estandar de 4.5 mpg ¿Qué porcentaje de autos tiene 30mpg o más? z = 1.00
z = x - m / sigma p= 1.00-.8413= .1587
Si un fabricante desea desarrollar un auto que supere al 95% de los compactos actuales, ¿cuál debe ser el rendimiento?
Xo = M +Zo =
Respuesta: El nuevo auto compacto debe recorrer 32.9 mpg para superar al 95% de los autos actuales
1-pnorm(30,25.5,4.5)
## [1] 0.1586553
qnorm(.95,25.5,4.5)
## [1] 32.90184
Suponga que los diametros de tallos no soportados en la base, de una especia particular de girasol, tienen una distribución normal con un diámetro promedio de 35 mm y una desviación estándar de 3 mm.
40 - 35/3 = 1 - .9515= 0.0485
1-pnorm(40,35,3)
## [1] 0.04779035
R = 4.77%
x <- 40 promedio <- 35 sd <- 3
x <- 40
promedio <- 35
sd <- 3
x_densidad <- seq(promedio-3*sd,promedio+3*sd,length=1000)
y_densidad <- dnorm(x_densidad,promedio,sd)
plot(x_densidad,y_densidad,type="l", lty=1,xlab="x",ylab="f(x)",main="Función de Densidad de Probabilidad(Normal)",col="darkgreen")
x_distribucion <- seq(promedio-3*sd,promedio+3*sd,length=1000)
y_distribucion <- pnorm(x_distribucion,promedio,sd)
plot(x_distribucion,y_distribucion,type="l", lty=1,xlab="x",ylab="f(x)",main="Función de Distribución de Probabilidad(Normal)",col="blue")
0.0485*0.0485=0.00235
R = .23%
Xo = Mo + Zo*Sigma = 35 + 1.96 (3) = 40.88 35 - 1.96 (3) = 29.12
qnorm(.025,35,3)
## [1] 29.12011
qnorm(.975,35,3)
## [1] 40.87989
R = Los límites delos bases es de 29.12 a 40.88 de diametro.
Xo = Mo + Zo*Sigma = 35 + 1.289 (3)= 38.86
qnorm(.90,35,3)
## [1] 38.84465
R = 38.86
## PhantomJS not found. You can install it with webshot::install_phantomjs(). If it is installed, please make sure the phantomjs executable can be found via the PATH variable.
Es un procedimiento basado en evidencia muestral y en la teorpia de la probabilidad que se emplea para determinar si la hipótesis es un eunciado racional y no debe de rechazarse o si es irracional debe ser rechazada.
En un trabajo de investigación se plantean dos hipótesis mutuamente excluyentes. La hipótesis Nula (Ho) y la Hipótesis Alternativa (H3 o Ha) o de investigador.
El análisis estadístico servirá para determinar si se rechaza o no la Ha.
La H0 es la hipótesis quetratamos de refutar, rechazar o anular.
Cuando se rechaza Ho significa que el factor estudiado ha influido significativamente en los resultados y no se rechaza la H1.
Sigma conocida n grande n = 30
Sigma desconocida, n pequeña:
Distribuciónt de Student
Desarrolladaen 1908 por W.S. Gosset, quien trabajó en la fábrica de cerveza Guiness en Irlanda.
t = x¯–μ(s/n√)
α = 0.10 Ej. Estudio o encuesta de mercadotecnia. α = 0.05 Ej. Proyecto de investigación. α = 0.01 Ej. Aseguramiento de calidad.
Nota: (n-1) = gradosde libertad
x¯–μ0(s/n√)
Un nuevo proceso para producit diamantes sintéticos es renable sólo si el peso es de estos en mayor a 0.5 quilates. Para evaluarlo se generaron 6 diamantes con los siguientes pesos:
0.46 0.61 0.52 0.48 0.57 0.54
¿El proceso es rentable?
Ho: μ≥μ0 Ha: μ>μ0
α = 0.05
α = 0.05 gl = 5 2.015
x¯–μ0(s/n√)
promedio <- mean(datos$pesos)
promedio
## [1] 0.53
sd <- sd(datos$pesos)
sd
## [1] 0.05585696
n <- 6
miu_0 <- 0.5
t <- (promedio-miu_0)/(sd/sqrt(n))
t
## [1] 1.315587
No se rechaza H0, los datos no presetan suficiente evidencia para indicar que el peso medio de los diamantes exceda los0.5 quilates
x_densidad <- seq(-4,4,length=1000)
y_densidad <- dt(x_densidad,df=5)
plot(x_densidad,y_densidad,type="l",lty=1,xlab="t",ylab="f(t)",main="Función de Densidad de Probabilidad")
x_distribucion <- seq(-4,4,length=1000)
y_distribucion <- pt(x_distribucion,df=5)
plot(x_distribucion,y_distribucion,type="l",lty=1,xlab="t",ylab="f(t)",main="Función de Distribución de Probabilidad")
Los desechos industriales y residuales descargados en nuestros ríos y arroyos absorben oxígeno disuelto disponible para peces y otras formas de fauna acuática. Una agencia estatal requiere un mínimo de 5 partes por millón de oxígeno disuelto para que el contenido de oxpigeno sea suficinete para sostener vida acuática. Seis especimenes de agua tomados de un rio en un lugar especifico durante la estacion de aguas bajas (julio) dio lecturas 4.9 5.1 4.9 5.0 5.0 y 4.7 de oxígeno disuelto.
¿Los datos dan suficiente evidencia para indicar que el contenido de oxígeno disuelto es menor a 5 pmm? Pruebe usando α = 0.05
Ho: μ≥μ0 Ha: μ<μ0
α = 0.05
gl = 5 grado de significancia = 2.015
x¯–μ0(s/n√)
ppm <- c(4.9,5.1,4.9,5.0,5.0,4.7)
ppm
## [1] 4.9 5.1 4.9 5.0 5.0 4.7
promedio2 <- mean(ppm)
promedio2
## [1] 4.933333
sd2 <- sd(ppm)
sd2
## [1] 0.136626
n2 <- 6
miu_2 <- 5
t2 <- (promedio2-miu_2)/(sd2/sqrt(n))
t2
## [1] -1.195229
Respuesta: No se rechaza H0
Dentro del Winsorizing se cambian los datos de outliers, mientras uqe en el trimming los elimina
Trimming involves removing the outliers from the data set, while winsorizing involves replacing them with the nearest non-outlier values.

ppm_error <- c(4.9,5.1,4.9,5.0,5.0,4.0,47)
boxplot(ppm_error,horizontal=TRUE)
library(DescTools)
ppm_win <- Winsorize(ppm_error,0.10)
ppm_win
## [1] 4.90 5.10 4.90 5.00 5.00 4.00 34.43
ppm_trim <- Trim(ppm_error,1)
ppm_trim
## [1] 4.9 5.1 4.9 5.0 5.0
## attr(,"trim")
## [1] 6 7