1. Prueba para contraste de media, con media poblacional y varianza conocida.
a.- Buscar y resolver un ejemplo de uso de la prueba z con una cola.
Ejemplo:
Una embotelladora de refrescos dice que sus latas de refresco tienen una cantidad de refresco de media 330cc con desviacion tipica de 20cc. Se han tomado 36 latas de refresco y se ha calculado que el contenido medio por lata es de 325cc.¿Es cierta la afirmacion del fabricante con un nivel de significancia del 1%? o ¿nos esta dando menos cantidad de producto de la que nos dice?
library("ggplot2")
grafico_densidad = ggplot(data = data.frame(x = c(250, 400)), aes(x)) +
stat_function(fun = dnorm, n = 37, args = list(mean =330, sd = 20)) + ylab("") +
scale_y_continuous(breaks = NULL) + xlab("Volumen (cc)") + ylab("Densidad") + ggtitle("Función de densidad (distribución normal)") + theme_bw() +
geom_vline(xintercept = 325,cex=1.2,colour ="darkred",linetype="longdash") + geom_text(aes(x=325, label="xbar", y=0.0), colour ="darkred",size=5) + geom_vline(xintercept = 330,cex=1.2,colour ="coral3",linetype="longdash") + geom_text(aes(x=330, label="mu", y=0.00001), colour ="coral3",size=5)
grafico_densidad
Hipotesis nula:
Ho:μ0=330 cc.
#Datos
mu=330
sigma = 20
x_bar=325
n=36
#Normalización
z = (x_bar-mu)/(sigma/sqrt(n))
#Confianza
alfa = 0.01
confianza = 1-alfa
z_alfa = qnorm(alfa/2)
cat("Asumiendo que la hipotesis nula es que las latas contienen 330cc, tomaremos como la zona que nos hara rechazar esta hipotesis el intervalo de zα que es [",z_alfa, "," ,z_alfa*-1, "]. Esto implica que z está dentro del intervalo de confianza (z = ",z,"), por lo que tenemos que aceptar la H0. El fabricante nos da la cantidad de producto que nos indica")
## Asumiendo que la hipotesis nula es que las latas contienen 330cc, tomaremos como la zona que nos hara rechazar esta hipotesis el intervalo de za que es [ -2.575829 , 2.575829 ]. Esto implica que z está dentro del intervalo de confianza (z = -1.5 ), por lo que tenemos que aceptar la H0. El fabricante nos da la cantidad de producto que nos indica
## Loading required package: lattice
##
## Attaching package: 'BSDA'
## The following object is masked from 'package:datasets':
##
## Orange
set.seed(10)
#Creación de muestra artificial
datos = rnorm(n,x_bar,sigma)
#Aplicación de test
z = z.test(x=datos,mu=mu,sigma.x=sigma,conf.level = confianza)
print(z)
##
## One-sample z-Test
##
## data: datos
## z = -3.8223, p-value = 0.0001322
## alternative hypothesis: true mean is not equal to 330
## 99 percent confidence interval:
## 308.6728 325.8450
## sample estimates:
## mean of x
## 317.2589
Grafico:
dnorm_limit <- function(x) {
y <- dnorm(x)
y[x < z_alfa | x > -z_alfa] <- NA
return(y)
}
# ggplot() with dummy data
grafico_densidad = ggplot(data.frame(x = c(-3, 3)), aes(x = x)) +
stat_function(fun = dnorm_limit, geom = "area", fill = "blue", alpha = 0.2) + stat_function(fun = dnorm) +
xlab("Volumen (cc)") + ylab("Densidad") + ggtitle("Función de densidad") +
theme_bw() + geom_vline(xintercept = (x_bar-mu)/(sigma/sqrt(n)),cex=1.2,colour ="darkred") +
geom_text(aes(x=(x_bar-mu)/(sigma/sqrt(n))+0.2, label="z", y=0.0), colour ="darkred",size=10)
plot(grafico_densidad)
2. Prueba para contraste de media, con media poblacional conocida y varianza desconocida.
a.- Buscar y resolver un ejemplo de uso de la prueba t con una cola.
Ejemplo:
“Una muestra de 24 sujetos privados de libertad, en una prueba de razonamiento abstracto, se obtuvo una media de 53 puntos con una desviacion tipica de 9 puntos. En los ultimos 5 años, los resultados obtenidos indicaban una media de 48 puntos. ¿De acuerdo a estos resultados se puede concluir que el promedio de la poblacion de infractores ha aumentado en comparacion de los ultimos cinco años? Sea alfa 0.05”
library("ggplot2")
grafico_densidad = ggplot(data = data.frame(x = c(16, 80)), aes(x)) +
stat_function(fun = dt, n = 24, args = list(x =48, df = 9)) + ylab("") +
scale_y_continuous(breaks = NULL) + xlab("Puntaje") + ylab("Densidad") + ggtitle("Función de densidad (Distribución t)") + theme_bw() +
geom_vline(xintercept = 53,cex=1.2,colour ="darkred",linetype="longdash") + geom_text(aes(x=53, label="xbar", y=0.0), colour ="darkred",size=5) + geom_vline(xintercept = 48,cex=1.2,colour ="coral3",linetype="longdash") + geom_text(aes(x=48, label="mu", y=0.001), colour ="coral3",size=5)
grafico_densidad
Hipotesis estadistica:
Ho: μ<=48
H1: μ>48
α: 0.05
#Datos
mu=48
s = 9
x_bar=53
n=24
#Normalización
t = (x_bar-mu)/(s/sqrt(n))
#Confianza
alfa = 0.05
confianza = 1-alfa
t_alfa = qt(alfa/2,df = n-1)
cat("El valor de tα nos entrega un intervalo de [",t_alfa,", ",t_alfa*-1,"], mientras que t tiene un valor de ",t,". Es por esto que tenemos que rechazar la hipotesis debido a que t no se encuentra en el intervalo de confianza.")
## El valor de ta nos entrega un intervalo de [ -2.068658 , 2.068658 ], mientras que t tiene un valor de 2.721655 . Es por esto que tenemos que rechazar la hipotesis debido a que t no se encuentra en el intervalo de confianza.
Prueba simulada
set.seed(10)
#Creación de muestra artificial
datos = rnorm(n,x_bar,s)
#Aplicación de test
t = t.test(x=datos,mu=mu,conf.level = confianza)
print(t)
##
## One Sample t-test
##
## data: datos
## t = 1.4194, df = 23, p-value = 0.1692
## alternative hypothesis: true mean is not equal to 48
## 95 percent confidence interval:
## 46.87706 54.03331
## sample estimates:
## mean of x
## 50.45518
Grafico
dnorm_limit <- function(x) {
y <- dnorm(x)
y[x < t_alfa | x > -t_alfa] <- NA
return(y)
}
# ggplot() with dummy data
grafico_densidad = ggplot(data.frame(x = c(-3, 3)), aes(x = x)) +
stat_function(fun = dnorm_limit, geom = "area", fill = "blue", alpha = 0.2) + stat_function(fun = dnorm) +
xlab("Remuneraciones") + ylab("Densidad") + ggtitle("Función de densidad") +
theme_bw() + geom_vline(xintercept = (x_bar-mu)/(s/sqrt(n)),cex=1.2,colour ="darkred") +
geom_text(aes(x=(x_bar-mu)/(s/sqrt(n))+0.2, label="t", y=0.0), colour ="darkred",size=10)
plot(grafico_densidad)
3. Prueba para contraste de varianza.
a.- Buscar y resolver un ejemplo de uso de la prueba chi para varianza con dos colas.
Ejemplo:
“De 1990 a 1995 la tasa promedio de precios de utilidades de los aproximadamente 1800 valores inscritos en la bolsa de valores de Nueva York fue de 14,35 con una desviación estándar de 9,73. En una muestra de 30 valores seleccionados al azar, la tasa de precios y utilidades promedio en 1986 fue de 11,77 ¿Esta muestra presenta evidencia suficiente para concluir a un nivel de significancia de 0,05 que en 1986 la tasa de precios de utilidades promedio para valores de la bolsa cambio su valor anterior?”
Ho: μ=14.35
Ha: μ≠14.35
sigma2=205.9225
n = 30
s2=94.6729
# Normalización
chi = (n-1)*s2/(sigma2) # Calculo de la prueba
#Confianza
alfa = 0.05 # Nivel de significancia
confianza = 1-alfa
chi_alfa = qchisq(confianza,df = n-1) # Calculo de chi considerando el nivel de significancia
cat("El valor de chiα nos entrega un intervalo de [",chi_alfa*-1,", ",chi_alfa,"], mientras que chi tiene un valor de ",chi,". Es por esto que tenemos que aceptar la hipotesis debido a que chi se encuentra en el intervalo de confianza.")
## El valor de chia nos entrega un intervalo de [ -42.55697 , 42.55697 ], mientras que chi tiene un valor de 13.33275 . Es por esto que tenemos que aceptar la hipotesis debido a que chi se encuentra en el intervalo de confianza.