image.info
Distribución de Probabilidad
Las distribuciones de probabilidad continuo pueden tomar varias
formas, pero un gran número de variables aleatorias observadas en la
naturaleza poseen una distribución de frecuencia que tiene más o menos
la forma de montículo o bien, como se diría en estadística, es
aproximadamente una distribución normal de probabilidad
La fórmula qué genera esta distribución es: f(x)=
((1/2π)e)(-(x-u)2/(22))
El área bajo la curva es igual a 1. Para variables aleatorias
continuas, área=probabilidad. El área a la izquierda de la media es
igual a .5 y a la derche 0.5
π=3.14 e=2.72
Para hallar la probabilidad de qué una variable aleatoria normal “x”
se encuentre en el intervalo de “a” a “b” necesitamos obtener el área
bajo la curva normal entre los puntos “a” y “b”,
Variable Aleatoria Normal Estándar
Beneficio: Nos permite usar la misma tabla para todas las
distribuciones normales.
Definición: z=(x-u)/ x= u+2
La distribución de probabilidad para z se denomina “Distribución
Normal Estandarizada”
Ejercicio 3.1
Un estudio demostró qué el uso de gasolina para autos compactos
vendidos en USA está distribuido normalmente, con una mediad de 25.5
millas por galón y una desviación estándar de 4.5 mpg ¿Qué porcentaje de
autos recorre 30 mpg o más?
z=(x-u)/ -> (30-25.5)/4.5 = 1.00
P=1-0.8413=0.1587
R= El 15.9% de autos recorre 30 mpg o más
Ejercicio 3.2
Si un fabricante desea desarrollar un auto qué supere el 95% de los
compactos actuales, ¿Cuál debe ser el rendimiento (mpg)?
xo= u+Zo= 25.5+1.645(4.5) = 32.9
R= El nuevo auto compacto debe recorrer 32.9 mpg para
superar el 95% de los autos actuales
Porcentaje
1-pnorm(30,25.5,4.5)
## [1] 0.1586553
x
qnorm(0.95,25.5,4.5)
## [1] 32.90184
Ejercicio 4
Suponga que los diámetros de tallos no soportados en la base de una
especia particular de girasol, tienen una distribución normal con un
diámetro promedio de 35 mm y una desviación estándar de 3mm
a) ¿Cuál es la probabilidad de que una planta de girasol tenga un
diámetro de base de más de 40 mm?
R= 1-0.9525= La proibabilidad de que una planta tenga un
diámetro de base de más de 40 mm es del 4.75%
z41<-(40-35)/3
p41<-1-pnorm(40,35,3)
z41
## [1] 1.666667
p41
## [1] 0.04779035
x<-40
prom<-35
desvest<-3
Función de Densidad de Probabilidad (Normal)
x_densidad<- seq(prom-3*desvest, prom+3*desvest, length=1000)
y_densidad<- dnorm(x_densidad,prom,desvest)
plot(x_densidad,y_densidad,type="l",lty=1,xlab="x",ylab="f(x)",main="Función de Densidad de Probabilidad (Normal)",col="darkorange2")

Función de Disribución de Probabilidad
(Normal)
x_distribucion<- seq(prom-3*desvest, prom+3*desvest, length=1000)
y_distribucion<- pnorm(x_distribucion, prom, desvest)
plot(x_distribucion,y_distribucion,type="l",lty=1,xlab="x",ylab="f(x)",main="Función de Distribución de Probabilidad (Normal)",col="yellow2")

b) Si 2 plantas de girasol se seleccionan al azar,¿Cuál es la
probabilidad de que ambas plantas tengan un diámtero de base de más de
40 mm?
R= La probabilidad de que ambas tengan un diámetro mayor a
40 mm es de 0.23%
p42<-(0.04779035)^2
p42
## [1] 0.002283918
c)¿Dentro de que límites esperaría usted que se encuentren los
diámetros de base, con probabilidad de 0.95?
** R=35-1.96(3)= Para que los diámetros de una base se encuentre con
una probabilidad del 0.95 los l´mites de los diámetros se encontraría
entre 29.12mm y 40.88mm**
p43_li<-qnorm(0.025,35,3)
p43_li
## [1] 29.12011
p43_ls<-qnorm(0.975,32,3)
p43_ls
## [1] 37.87989
d) ¿Qué diametro representa el 90avo percentil de la distribución de
diámetros?
R=35+1.3(3)= Un diámetro de 38.9mm representaría el 90avo
percentil de la distribución de diámetros
qnorm(0.90,35,3)
## [1] 38.84465
Shiny App
Notas
ui= interfaz del usuario, lo que ve el usuario entras y salidas
Servidor = todo lo que no se ve para que la interfaz pueda
funcionar
Aplicación para Nombre Completo
## PhantomJS not found. You can install it with webshot::install_phantomjs(). If it is installed, please make sure the phantomjs executable can be found via the PATH variable.
Shiny applications not supported in static R Markdown documents
Aplicación para gráficas de distribución
normal
Shiny applications not supported in static R Markdown documents
Conceptos Generales
Es un procedimiento basado en evidencia muestral y en la teoría de
la probabilidad que se emplea para determinar si la hipótesis es un
enunciado racional y no debe rechazarse o si es irracional y debe ser
rechazado
En un trabajo de investigación se plantean dos hipótesis mutuamente
exluyentes
*La hipótesis nula** (Ho) y la Hipótesis Alternativa (H1 o Ha) o de
investigador
El análisis estadístico de los datos servirá para determinar si se
rechaza o no la Ho
La Ho es la hipóteiss que tratamos de refutar, rechazar o
anular
Cuando se rechaza la Ho significa que el factor ha influido
significativamente en los resultados y no se rechaza la H1 o Ha
Clasificación de las Pruebas de Hipótesis
Prueba para la Proporción
Sigma desconocida y n pequeña -> n pequeña es cuando hay 30 o
menos en cuestión de número de datos
Promedio, Sigma desconocida, N pequña
Dos Promedios, Sigma 1 = Sigma 2, N1 y N2 pequeñas
Dos Promedios, Sigma 1 desigual a Sigma 2, N1 y N2 pequeñas
Prueba para la Variabilidad
Distribución t de Student
Desarrollada en 1908 por W.S Gosset, quien trabajó en la fábrica
decerveza Guinness en Irlanda
t= (x(barra)-u)/(s/(√n))
image.info
** Los 5 Pasos para Pruebas de Hipótesis**
Plantear Hipótesis
1. Ho: u=uo y Ha: u≠uo
2. Ho: u≤uo y Ha: u>uo
3. Ho: u≥uo y Ha: u<uo
Nivel de Significancia = Rango de Aceptación de HA= 1- nivel de
confianza
α = 0.10 Ej. Estudio o encuesta de Mercadotecnia
α = 0.05 Ej. Proyecto de investigación
α = 0.01 Ej. Aseguramiento de calidad
*Zonas de Aceptación/Rechazo
image.info
NOTA: N-1= Grados de Libertad
Estadístico de Prueba
t= (x(barra)-uo)/(s/√n)
Conclusión
Se rechaza Ho
No se rechaza Ho
Ejericio 5
Un nueco proceso para pdosucir diamentes sintéticos es rentable sólo
si el peso de estos es mayor a 0.5 quilates. Para evaluarlo se genraron
6 diamentos con los siguientes pesos
0.46 0.61 0.52 0.48 0.57 y 0.54
¿El proceso es rentable?
Solución¨
Ho: u≤0.5 y Ha: u>0.5
α = 0.05 <- Como no se espicifica, se pone como default el
0.05
t= (x(barra)-uo)/(s/√n)
(0.53-0.5)/ (0.05585696/√6)
t= 1.315587
Conlusión
No se rechaza Ho, debido a que no se presenta suficiente videncia
para indicar que el peso medio de los diamantes exceda los 0.5
Kilates
peso_diamantes<- c(.46,.61,.52,.48,.57,.54)
promedio<- mean(peso_diamantes)
desv_est_muestral<- sqrt(var(peso_diamantes))
promedio
## [1] 0.53
desv_est_muestral
## [1] 0.05585696
n<-6
miu_o<- 0.5
tstudent<-(0.53-miu_o)/(desv_est_muestral/sqrt(n))
tstudent
## [1] 1.315587
Ejercicio 6
Los desechos industriales y residuales descargados en nuestros ríos
y arroyos absorben oxígeno y por tanto reducen la cantidad de óxigeno
disuelto disponible para peces y otras formas de fauna acuática. Una
agencia estatal requiere un mínimo de 5 partes por millón (ppm) de
oxígeno disuelto para que el contenido de oxígeno sea suficiente para
sotener vida acuática seis espécimenes de agua tomados de una río en un
lugar específico durante la estación de agias bajas (julio) dio lecturas
de
4.9, 5.1, 4.9, 5.0, 5.0 y 4.7
oxígeno disuelto.¿Los datos dan suficiente evidencia para idnicar
que el contenido de oxígeno disuelto es menor a 5 pmm? Pruebe usando α =
0.05
Ho: u≥5 y Ha: u<5
No se rechaza la Ho, debido a que no se presenta suficiente videncia
para indicar que el contenido de oxígeno disuelto es menor a 5 pmm
dataoxi<- c(4.9, 5.1, 4.9, 5.0, 5.0, 4.7)
promoxi<- mean(dataoxi)
DESEMO<- sqrt(var(dataoxi))
promoxi
## [1] 4.933333
DESEMO
## [1] 0.136626
nOxi<-6
miu_o<- 5
tstudent<-(promoxi-miu_o)/(DESEMO/sqrt(nOxi))
tstudent
## [1] -1.195229
Función de Densidad de Probabilidad (t de
Student)
x_dens<-seq(-4,4, length=1000)
y_dens<-dt(x_dens,df=5)
plot(x_dens,y_dens, type= "l",lty=1, xlab="t", ylab="f(t)", main="Función de Densidad de Probabilidad (t de Student)")

**Función de Distribución de Probabilidad (t de Student)
x_dis<-seq(-4,4, length=1000)
y_dis<- pt(x_dis,df=5)
plot(x_dis,y_dis,type="l",lty=1, xlab="t", ylab="f(t)", main= "Función de Distribución de Probabilidad (t de Student)")

Winsorizing vs Trimming
Winsorizing = agarras cierto margen de datos, lo que está en ese
rango se queda y lo demás se sustituye por su cuartil
correspondiente,
Trimming = Agarra cierto margen de datos, lo que está dentro del
rango se queda y lo que está afuera se eliminan
peso_diamantes_err<- c(.46,.61,.52,.48,.57,54)
boxplot(peso_diamantes_err,horizontal=TRUE)

library (DescTools)
peso_diamentes_winsorizado<-Winsorize(peso_diamantes_err,0.10)
peso_diamentes_winsorizado
## [1] 0.4600 0.6100 0.5200 0.4800 0.5700 40.6525
peso_diamantes_recortado<-Trim(peso_diamantes_err,1)
peso_diamantes_recortado
## [1] 0.61 0.52 0.48 0.57
## attr(,"trim")
## [1] 1 6