image.info
image.info

Distribución de Probabilidad

Las distribuciones de probabilidad continuo pueden tomar varias formas, pero un gran número de variables aleatorias observadas en la naturaleza poseen una distribución de frecuencia que tiene más o menos la forma de montículo o bien, como se diría en estadística, es aproximadamente una distribución normal de probabilidad

La fórmula qué genera esta distribución es: f(x)= ((1/2π)e)(-(x-u)2/(22))

El área bajo la curva es igual a 1. Para variables aleatorias continuas, área=probabilidad. El área a la izquierda de la media es igual a .5 y a la derche 0.5

π=3.14 e=2.72

Para hallar la probabilidad de qué una variable aleatoria normal “x” se encuentre en el intervalo de “a” a “b” necesitamos obtener el área bajo la curva normal entre los puntos “a” y “b”,

Variable Aleatoria Normal Estándar

Beneficio: Nos permite usar la misma tabla para todas las distribuciones normales.

Definición: z=(x-u)/ x= u+2

La distribución de probabilidad para z se denomina “Distribución Normal Estandarizada”

Ejercicio 3.1

Un estudio demostró qué el uso de gasolina para autos compactos vendidos en USA está distribuido normalmente, con una mediad de 25.5 millas por galón y una desviación estándar de 4.5 mpg ¿Qué porcentaje de autos recorre 30 mpg o más?

z=(x-u)/ -> (30-25.5)/4.5 = 1.00

P=1-0.8413=0.1587

R= El 15.9% de autos recorre 30 mpg o más

Ejercicio 3.2

Si un fabricante desea desarrollar un auto qué supere el 95% de los compactos actuales, ¿Cuál debe ser el rendimiento (mpg)?

xo= u+Zo= 25.5+1.645(4.5) = 32.9

R= El nuevo auto compacto debe recorrer 32.9 mpg para superar el 95% de los autos actuales

Porcentaje

1-pnorm(30,25.5,4.5)
## [1] 0.1586553

x

qnorm(0.95,25.5,4.5)
## [1] 32.90184

Ejercicio 4

Suponga que los diámetros de tallos no soportados en la base de una especia particular de girasol, tienen una distribución normal con un diámetro promedio de 35 mm y una desviación estándar de 3mm

a) ¿Cuál es la probabilidad de que una planta de girasol tenga un diámetro de base de más de 40 mm?

R= 1-0.9525= La proibabilidad de que una planta tenga un diámetro de base de más de 40 mm es del 4.75%

z41<-(40-35)/3

p41<-1-pnorm(40,35,3)
z41
## [1] 1.666667
p41
## [1] 0.04779035
x<-40
prom<-35
desvest<-3

Función de Densidad de Probabilidad (Normal)

x_densidad<- seq(prom-3*desvest, prom+3*desvest, length=1000)
y_densidad<- dnorm(x_densidad,prom,desvest)
plot(x_densidad,y_densidad,type="l",lty=1,xlab="x",ylab="f(x)",main="Función de Densidad de Probabilidad (Normal)",col="darkorange2")

Función de Disribución de Probabilidad (Normal)

x_distribucion<- seq(prom-3*desvest, prom+3*desvest, length=1000)
y_distribucion<- pnorm(x_distribucion, prom, desvest)
plot(x_distribucion,y_distribucion,type="l",lty=1,xlab="x",ylab="f(x)",main="Función de Distribución de Probabilidad (Normal)",col="yellow2")

b) Si 2 plantas de girasol se seleccionan al azar,¿Cuál es la probabilidad de que ambas plantas tengan un diámtero de base de más de 40 mm?

R= La probabilidad de que ambas tengan un diámetro mayor a 40 mm es de 0.23%

p42<-(0.04779035)^2
p42
## [1] 0.002283918

c)¿Dentro de que límites esperaría usted que se encuentren los diámetros de base, con probabilidad de 0.95?

** R=35-1.96(3)= Para que los diámetros de una base se encuentre con una probabilidad del 0.95 los l´mites de los diámetros se encontraría entre 29.12mm y 40.88mm**

p43_li<-qnorm(0.025,35,3)
p43_li
## [1] 29.12011
p43_ls<-qnorm(0.975,32,3)
p43_ls
## [1] 37.87989

d) ¿Qué diametro representa el 90avo percentil de la distribución de diámetros?

R=35+1.3(3)= Un diámetro de 38.9mm representaría el 90avo percentil de la distribución de diámetros

qnorm(0.90,35,3)
## [1] 38.84465

Shiny App

Notas

ui= interfaz del usuario, lo que ve el usuario entras y salidas

Servidor = todo lo que no se ve para que la interfaz pueda funcionar

Aplicación para Nombre Completo

## PhantomJS not found. You can install it with webshot::install_phantomjs(). If it is installed, please make sure the phantomjs executable can be found via the PATH variable.
Shiny applications not supported in static R Markdown documents

Aplicación para gráficas de distribución normal

Shiny applications not supported in static R Markdown documents

Conceptos Generales

Es un procedimiento basado en evidencia muestral y en la teoría de la probabilidad que se emplea para determinar si la hipótesis es un enunciado racional y no debe rechazarse o si es irracional y debe ser rechazado

En un trabajo de investigación se plantean dos hipótesis mutuamente exluyentes

*La hipótesis nula** (Ho) y la Hipótesis Alternativa (H1 o Ha) o de investigador

El análisis estadístico de los datos servirá para determinar si se rechaza o no la Ho

La Ho es la hipóteiss que tratamos de refutar, rechazar o anular

Cuando se rechaza la Ho significa que el factor ha influido significativamente en los resultados y no se rechaza la H1 o Ha

Clasificación de las Pruebas de Hipótesis

Prueba para la Media

Sigma conocidad y n grande -> para saber si n es grande el número de datos debe ser mayor a 30

Prueba para la Proporción

Sigma desconocida y n pequeña -> n pequeña es cuando hay 30 o menos en cuestión de número de datos
Promedio, Sigma desconocida, N pequña
Dos Promedios, Sigma 1 = Sigma 2, N1 y N2 pequeñas
Dos Promedios, Sigma 1 desigual a Sigma 2, N1 y N2 pequeñas

Prueba para la Variabilidad

Distribución t de Student

Desarrollada en 1908 por W.S Gosset, quien trabajó en la fábrica decerveza Guinness en Irlanda

t= (x(barra)-u)/(s/(√n))

image.info
image.info

** Los 5 Pasos para Pruebas de Hipótesis**

Plantear Hipótesis

1. Ho: u=uo y Ha: u≠uo
2. Ho: u≤uo y Ha: u>uo
3. Ho: u≥uo y Ha: u<uo

Nivel de Significancia = Rango de Aceptación de HA= 1- nivel de confianza

α = 0.10 Ej. Estudio o encuesta de Mercadotecnia
α = 0.05 Ej. Proyecto de investigación
α = 0.01 Ej. Aseguramiento de calidad

*Zonas de Aceptación/Rechazo

image.info
image.info
NOTA: N-1= Grados de Libertad

Estadístico de Prueba

t= (x(barra)-uo)/(s/√n)

Conclusión

Se rechaza Ho
No se rechaza Ho

Ejericio 5

Un nueco proceso para pdosucir diamentes sintéticos es rentable sólo si el peso de estos es mayor a 0.5 quilates. Para evaluarlo se genraron 6 diamentos con los siguientes pesos
0.46 0.61 0.52 0.48 0.57 y 0.54
¿El proceso es rentable?
Solución¨
Ho: u≤0.5 y Ha: u>0.5
α = 0.05 <- Como no se espicifica, se pone como default el 0.05
image.info
t= (x(barra)-uo)/(s/√n)
(0.53-0.5)/ (0.05585696/√6)
t= 1.315587

Conlusión

No se rechaza Ho, debido a que no se presenta suficiente videncia para indicar que el peso medio de los diamantes exceda los 0.5 Kilates
peso_diamantes<- c(.46,.61,.52,.48,.57,.54)
promedio<- mean(peso_diamantes)
desv_est_muestral<- sqrt(var(peso_diamantes))
promedio
## [1] 0.53
desv_est_muestral
## [1] 0.05585696
n<-6
miu_o<- 0.5
tstudent<-(0.53-miu_o)/(desv_est_muestral/sqrt(n))
tstudent
## [1] 1.315587

Ejercicio 6

Los desechos industriales y residuales descargados en nuestros ríos y arroyos absorben oxígeno y por tanto reducen la cantidad de óxigeno disuelto disponible para peces y otras formas de fauna acuática. Una agencia estatal requiere un mínimo de 5 partes por millón (ppm) de oxígeno disuelto para que el contenido de oxígeno sea suficiente para sotener vida acuática seis espécimenes de agua tomados de una río en un lugar específico durante la estación de agias bajas (julio) dio lecturas de

4.9, 5.1, 4.9, 5.0, 5.0 y 4.7

oxígeno disuelto.¿Los datos dan suficiente evidencia para idnicar que el contenido de oxígeno disuelto es menor a 5 pmm? Pruebe usando α = 0.05

Ho: u≥5 y Ha: u<5

No se rechaza la Ho, debido a que no se presenta suficiente videncia para indicar que el contenido de oxígeno disuelto es menor a 5 pmm

dataoxi<- c(4.9, 5.1, 4.9, 5.0, 5.0, 4.7)
promoxi<- mean(dataoxi)
DESEMO<- sqrt(var(dataoxi))
promoxi
## [1] 4.933333
DESEMO
## [1] 0.136626
nOxi<-6
miu_o<- 5
tstudent<-(promoxi-miu_o)/(DESEMO/sqrt(nOxi))
tstudent
## [1] -1.195229

Función de Densidad de Probabilidad (t de Student)

x_dens<-seq(-4,4, length=1000)
y_dens<-dt(x_dens,df=5)
plot(x_dens,y_dens, type= "l",lty=1, xlab="t", ylab="f(t)", main="Función de Densidad de Probabilidad (t de Student)")

**Función de Distribución de Probabilidad (t de Student)

x_dis<-seq(-4,4, length=1000)
y_dis<- pt(x_dis,df=5)
plot(x_dis,y_dis,type="l",lty=1, xlab="t", ylab="f(t)", main= "Función de Distribución de Probabilidad (t de Student)")

Winsorizing vs Trimming

Winsorizing = agarras cierto margen de datos, lo que está en ese rango se queda y lo demás se sustituye por su cuartil correspondiente,

Trimming = Agarra cierto margen de datos, lo que está dentro del rango se queda y lo que está afuera se eliminan

peso_diamantes_err<- c(.46,.61,.52,.48,.57,54)
boxplot(peso_diamantes_err,horizontal=TRUE)

library (DescTools)
peso_diamentes_winsorizado<-Winsorize(peso_diamantes_err,0.10)
peso_diamentes_winsorizado
## [1]  0.4600  0.6100  0.5200  0.4800  0.5700 40.6525
peso_diamantes_recortado<-Trim(peso_diamantes_err,1)
peso_diamantes_recortado
## [1] 0.61 0.52 0.48 0.57
## attr(,"trim")
## [1] 1 6