Librerias

library(readxl)
datos <- read_excel("ejercicio5.xlsx")

Distribución Normal de Probabilidad

Las distribuciones de probabilidad continua pueden tomar varias formas pero un gran número de variables aleatorias observadas en la naturaleza poseen una distribución de frencuencia que tiene más o menos la forma de montículo o más bien, como se diría en estadística, es aproximadamente una distribución normal de probabilidad que genera esta distribución es:

La fórmula qué genera esta distribución es: f(x)= ((1/2π)e)(-(x-u)2/(22))

El área debajo de la curva es igual a 1 Para vairables aleatorias continues, área = probabilidad El área a la izquierda media es igual a .5 El área a la derecha de la media es igual a .5

Las gráficas se van aplanando mediante la desviación estandar va aumentado STATDIST

Para hallar la probabilidad de que una variable aleatoria normal y se encuentre en el intervalo de “a” a “b” necesitamos obtener el área bajola curva normal entre los puntos “a” y “b”. No obstante, hay un número infinitamente grande de distribuciiones normales

Variable Aleatoria Normal Estandar

Beneficio:

Nos permite usar la misam tabla para todas las istribuciones normales Definición La distribución de probabilidad para z se denomina “Distribución Normal Estandarizada”

Ejercicio 4:

Un estudio que el uso de gasolina para actos compactos vendidos en EEUU esta distribución normalmente, con una media de 25.5 millas por galón y una desviación estandar de 4.5 mpg ¿Qué porcentaje de autos tiene 30mpg o más? z = 1.00

z = x - m / sigma p= 1.00-.8413= .1587

Si un fabricante desea desarrollar un auto que supere al 95% de los compactos actuales, ¿cuál debe ser el rendimiento?

Xo = M +Zo =

Respuesta: El nuevo auto compacto debe recorrer 32.9 mpg para superar al 95% de los autos actuales

1-pnorm(30,25.5,4.5)
## [1] 0.1586553
qnorm(.95,25.5,4.5)
## [1] 32.90184

Ejercicio 4.1:

Suponga que los diametros de tallos no soportados en la base, de una especia particular de girasol, tienen una distribución normal con un diámetro promedio de 35 mm y una desviación estándar de 3 mm.

  1. Cuál es la probabilidad de que una planta de girasol tenga un diámetro de base de más de 40mm? m = 35mm sv = 3mm

40 - 35/3 = 1 - .9515= 0.0485

1-pnorm(40,35,3)
## [1] 0.04779035

R = 4.77%

x <- 40 promedio <- 35 sd <- 3

x <- 40
promedio <- 35
sd <- 3

Función de Densidad de Probabilidad Normal Gráfica

x_densidad <- seq(promedio-3*sd,promedio+3*sd,length=1000)
y_densidad <- dnorm(x_densidad,promedio,sd)


plot(x_densidad,y_densidad,type="l", lty=1,xlab="x",ylab="f(x)",main="Función de Densidad de Probabilidad(Normal)",col="darkgreen")

Función de Distribución de Probabilidad Normal Gráfica

x_distribucion <- seq(promedio-3*sd,promedio+3*sd,length=1000) 


y_distribucion <- pnorm(x_distribucion,promedio,sd)

plot(x_distribucion,y_distribucion,type="l", lty=1,xlab="x",ylab="f(x)",main="Función de Distribución de Probabilidad(Normal)",col="blue")

  1. Si 2 plantas de girasol se seleccionan al azar,¿Cuál es la probabilidad de que ambas plantas tengan un diámtero de base de más de 40 mm?

0.0485*0.0485=0.00235

R = .23%

  1. ¿Dentro de que límites esperaría usted que se encuentren los diámetros de base, con probabilidad de 0.95?

Xo = Mo + Zo*Sigma = 35 + 1.96 (3) = 40.88 35 - 1.96 (3) = 29.12

qnorm(.025,35,3)
## [1] 29.12011
qnorm(.975,35,3)
## [1] 40.87989

R = Los límites delos bases es de 29.12 a 40.88 de diametro.

  1. ¿Qué diametro representa el 90avo percentil deña distribución de diámetros?

Xo = Mo + Zo*Sigma = 35 + 1.289 (3)= 38.86

qnorm(.90,35,3)
## [1] 38.84465

R = 38.86

Shiny App

Escribe tu nombre

## PhantomJS not found. You can install it with webshot::install_phantomjs(). If it is installed, please make sure the phantomjs executable can be found via the PATH variable.
Shiny applications not supported in static R Markdown documents

Graficas de Distribución

Shiny applications not supported in static R Markdown documents

Conceptos Generales:

  • Es un procedimiento basado en evidencia muestral y en la teorpia de la probabilidad que se emplea para determinar si la hipótesis es un eunciado racional y no debe de rechazarse o si es irracional debe ser rechazada.

  • En un trabajo de investigación se plantean dos hipótesis mutuamente excluyentes. La hipótesis Nula (Ho) y la Hipótesis Alternativa (H3 o Ha) o de investigador.

  • El análisis estadístico servirá para determinar si se rechaza o no la Ha.

  • La H0 es la hipótesis quetratamos de refutar, rechazar o anular.

  • Cuando se rechaza Ho significa que el factor estudiado ha influido significativamente en los resultados y no se rechaza la H1.

Clasificación de las Pruebas de Hipótesis

Pruebas de Hipótesis

- Prueba para la Media

Sigma conocida n grande n = 30

- Prueba para la Proporción

Sigma desconocida, n pequeña:

  • Promedio sigma desconocida n pequeña.
  • Dos promedios Sigma1 = Sigma2 desconocidas, n1 y n2 pequeñas
  • Dos promedios
  • Sigma1 ≠ Sigma2 desconocidos, n1 y n2 pequeñas

- Prueba para la vairabilidad

Distribuciónt de Student

Desarrolladaen 1908 por W.S. Gosset, quien trabajó en la fábrica de cerveza Guiness en Irlanda.

t = x¯–μ(s/n√)

Los 5 pasos para Pruebas de Hipótesis

1. Plantear hipótesis.

  1. Ho: μ=μ0 b. Ho: μ≤μ0 c.Ho: μ≥μ0 Ho: μ≠μ0 Ha: μ>μ0 Ha: μ<μ0

2. Nivel de significancia = Rango de Aceptación de Ha = 1 - nivel de confianza

α = 0.10 Ej. Estudio o encuesta de mercadotecnia. α = 0.05 Ej. Proyecto de investigación. α = 0.01 Ej. Aseguramiento de calidad.

3. Zonas de Aceptación/Rechazo

Nota: (n-1) = gradosde libertad

4. Estadística de Prueba

x¯–μ0(s/n√)

5. Conclusiones

Ejercicio 5:

Un nuevo proceso para producit diamantes sintéticos es renable sólo si el peso es de estos en mayor a 0.5 quilates. Para evaluarlo se generaron 6 diamantes con los siguientes pesos:

0.46 0.61 0.52 0.48 0.57 0.54

¿El proceso es rentable?

Solución

  1. Ho: μ≥μ0 Ha: μ>μ0

  2. α = 0.05

α = 0.05 gl = 5 2.015

x¯–μ0(s/n√)

promedio <- mean(datos$pesos)
promedio
## [1] 0.53
sd <- sd(datos$pesos)
sd
## [1] 0.05585696
n <- 6

miu_0 <- 0.5

t <- (promedio-miu_0)/(sd/sqrt(n))
t
## [1] 1.315587

No se rechaza H0, los datos no presetan suficiente evidencia para indicar que el peso medio de los diamantes exceda los0.5 quilates

Función de Densidad de Probabilidad (t de Student)

x_densidad <- seq(-4,4,length=1000)


y_densidad <- dt(x_densidad,df=5)
plot(x_densidad,y_densidad,type="l",lty=1,xlab="t",ylab="f(t)",main="Función de Densidad de Probabilidad")

x_distribucion <- seq(-4,4,length=1000)


y_distribucion <- pt(x_distribucion,df=5)
plot(x_distribucion,y_distribucion,type="l",lty=1,xlab="t",ylab="f(t)",main="Función de Distribución de Probabilidad")

Ejercicio 6.1

Los desechos industriales y residuales descargados en nuestros ríos y arroyos absorben oxígeno disuelto disponible para peces y otras formas de fauna acuática. Una agencia estatal requiere un mínimo de 5 partes por millón de oxígeno disuelto para que el contenido de oxpigeno sea suficinete para sostener vida acuática. Seis especimenes de agua tomados de un rio en un lugar especifico durante la estacion de aguas bajas (julio) dio lecturas 4.9 5.1 4.9 5.0 5.0 y 4.7 de oxígeno disuelto.

¿Los datos dan suficiente evidencia para indicar que el contenido de oxígeno disuelto es menor a 5 pmm? Pruebe usando α = 0.05

  1. Ho: μ≥μ0 Ha: μ<μ0

α = 0.05

gl = 5 grado de significancia = 2.015

x¯–μ0(s/n√)

ppm <- c(4.9,5.1,4.9,5.0,5.0,4.7)
ppm
## [1] 4.9 5.1 4.9 5.0 5.0 4.7
promedio2 <- mean(ppm)
promedio2
## [1] 4.933333
sd2 <- sd(ppm)
sd2
## [1] 0.136626
n2 <- 6

miu_2 <- 5

t2 <- (promedio2-miu_2)/(sd2/sqrt(n))
t2
## [1] -1.195229

Respuesta: No se rechaza H0

Winsorizing vs. Trimming

Dentro del Winsorizing se cambian los datos de outliers, mientras uqe en el trimming los elimina

Trimming involves removing the outliers from the data set, while winsorizing involves replacing them with the nearest non-outlier values.

Ejemplo

ppm_error <- c(4.9,5.1,4.9,5.0,5.0,4.0,47)
boxplot(ppm_error,horizontal=TRUE)
library(DescTools)

ppm_win <- Winsorize(ppm_error,0.10)
ppm_win
## [1]  4.90  5.10  4.90  5.00  5.00  4.00 34.43
ppm_trim <- Trim(ppm_error,1)
ppm_trim
## [1] 4.9 5.1 4.9 5.0 5.0
## attr(,"trim")
## [1] 6 7