“El tiempo medio de jugar videojuegos al día que dedican los adolescentes sigue una distribución normal de media 120 minutos y desviación típica poblacional de 30 minutos. Para contrastar esta hipótesis, se toma una muestra aleatoria formada por 100 alumnos, y se observa que el tiempo medio es de 90 minutos ¿ que se puede decir de esta afirmación con un nivel de significación del 10%?”
library("ggplot2")
grafico_densidad = ggplot(data = data.frame(x = c(50, 200)), aes(x)) +
stat_function(fun = dnorm, n = 100, args = list(mean = 120, sd = 30)) + ylab("") +
scale_y_continuous(breaks = NULL) + xlab("Jugar videojuegos") + ylab("Densidad") + ggtitle("Función de densidad (distribución normal)") + theme_bw() +
geom_vline(xintercept = 90,cex=1.2,colour ="darkred",linetype="longdash") + geom_text(aes(x=90, label="xbar", y=0.0), colour ="darkred",size=5) + geom_vline(xintercept = 90,cex=1.2,colour ="coral3",linetype="longdash") + geom_text(aes(x=120, label="mu", y=0.1), colour ="coral3",size=5)
grafico_densidad
La hipotesis nula es cuando la media es de 120 minutos y la hipotesis alternativa es cuando la media es menor a 120
#Datos
mu=120
sigma = 30
x_bar= 90
n=100
#Normalización
z = (x_bar-mu)/(sigma/sqrt(n))
#Confianza
alfa = 0.05
confianza = 1-alfa
z_alfa = qnorm(alfa/2)
z
## [1] -10
z_alfa
## [1] -1.959964
El valor de z es -10, mientras que el intervalo de zα es [-1.959964, 1.959964]. Esto implica que z está fuera del intervalo de confianza, por lo que se rechaza H0 y se acepta ha.
Se dice que el costo promedio de un par de zapatillas es de 150 dólares. Para determinar si esto es verdad, se toma una muestra aleatoria de 30 de ella, resultando en una media muestral de 165 dólares y una desviación estándar muestral de 14. Pruebe la hipótesis de que el precio de las camisetas es diferente a 150 dólares con α=0.05. Suponga una distribución normal.
library("ggplot2")
grafico_densidad = ggplot(data = data.frame(x = c(100, 300)), aes(x)) +
stat_function(fun = dt, n = 30, args = list(x =150, df = 24)) + ylab("") +
scale_y_continuous(breaks = NULL) + xlab("Costo") + ylab("Densidad") + ggtitle("Función de densidad (Distribución t)") + theme_bw() +
geom_vline(xintercept = 14,cex=1.2,colour ="darkred",linetype="longdash") + geom_text(aes(x=200, label="xbar", y=0.0), colour ="darkred",size=5) + geom_vline(xintercept = 150,cex=1.2,colour ="coral3",linetype="longdash") + geom_text(aes(x=165, label="mu", y=0.001), colour ="coral3",size=5)
grafico_densidad
## Warning in (function (x, df, ncp, log = FALSE) : no se han podido alcanzar
## precisión absoluta en 'pnt{final}'
## Warning in (function (x, df, ncp, log = FALSE) : no se han podido alcanzar
## precisión absoluta en 'pnt{final}'
## Warning in (function (x, df, ncp, log = FALSE) : no se han podido alcanzar
## precisión absoluta en 'pnt{final}'
## Warning in (function (x, df, ncp, log = FALSE) : no se han podido alcanzar
## precisión absoluta en 'pnt{final}'
## Warning in (function (x, df, ncp, log = FALSE) : no se han podido alcanzar
## precisión absoluta en 'pnt{final}'
## Warning in (function (x, df, ncp, log = FALSE) : no se han podido alcanzar
## precisión absoluta en 'pnt{final}'
La hipotesis nula es cuando la media es de 150 dolares y la hipotesis
alternativa es cuando la media es menor a 150
#Datos
mu=150
s = 14
x_bar=165
n=30
#Normalización
t = (x_bar-mu)/(s/sqrt(n))
#Confianza
alfa = 0.05
confianza = 1-alfa
t_alfa = qt(alfa/2,df = n-1)
t
## [1] 5.868456
t_alfa
## [1] -2.04523
El valor de t es 5.868456, mientras que el intervalo de tα es [-2.04523, 2.04523]. Esto implica que t está dentro del intervalo de confianza, por lo que NO podemos rechazar H_0.
Un laboratorio desea determinar si el lote de uno de sus farmacos tiene o no una varianza poblacional mayor a 25 en su grado de efectividad. Se realiza un muestreo de 50 elementos y se obtiene una varianza muestral de 27.9. Realizar la prueba de hipótesis con alfa = 0.05
library("ggplot2")
grafico_densidad = ggplot(data = data.frame(x = c(0, 30)), aes(x)) +
stat_function(fun = dchisq, n = 101, args = list(x =25, df = 19)) + ylab("") +
scale_y_continuous(breaks = NULL) + xlab("Farmacos") + ylab("Densidad") + ggtitle("Función de densidad") + theme_bw() +
geom_vline(xintercept = 27.9,cex=1.2,colour ="darkred") + geom_text(aes(x=21, label="S^2", y=0.0), colour ="darkred",size=5)
grafico_densidad
Nuestra hipótesis nula, basándose en los datos señalados en el enunciado
puede ser especificada como:
\[ H_0 σ^2 <= 25 \] Si aplicamos la normalización para calcular chi bajo una prueba de una cola, nos queda que:
#Datos
sigma2=25
n = 50
s2=27.9
#Normalización
chi = (n-1)*s2/(sigma2)
#Confianza
alfa = 0.05
confianza = 1-alfa
chi_alfa = qchisq(alfa,df = n-1,lower.tail = F) #Lower.tail se relaciona con <= de la hipótesis nula.
chi
## [1] 54.684
chi_alfa
## [1] 66.33865
El valor de chi es 54.684 , mientras chiα es [66.33865]. Esto implica que chi está dentro del intervalo de confianza, por lo que NO podemos rechazar H0
Suponiendo una distribución de tipos de flores en la naturaleza posee una proporción de 3:2:1, tenemos a nuestra disposición el dataset “iris”, el cual contempla muchos ejemplares, de ellos se van a utilizar, 16 son rosas, 60 son margaritas y 32 son hortensias .¿Existe diferencia entre las proporciones?”
data("iris")
flores = c(16, 60, 32)
sol = chisq.test(flores, p = c(1/6, 1/2, 1/3))
sol
##
## Chi-squared test for given probabilities
##
## data: flores
## X-squared = 1.3333, df = 2, p-value = 0.5134
El año pasado el jugador keznit tuvo 412 de 480 kills mediante headshot en torneo. Este año, lleva 357 (headshot) de 400 kills. ¿Existe una diferencia significativa entre ambas proporciones?
headshots = c(412, 357)
kills_totales= c(480, 400)
respuesta = prop.test(headshots, kills_totales, correct = FALSE, conf.level = 0.95)
respuesta
##
## 2-sample test for equality of proportions without continuity
## correction
##
## data: headshots out of kills_totales
## X-squared = 2.3107, df = 1, p-value = 0.1285
## alternative hypothesis: two.sided
## 95 percent confidence interval:
## -0.077693179 0.009359845
## sample estimates:
## prop 1 prop 2
## 0.8583333 0.8925000
El p-value es mayor a 0.05, por lo que aceptamos la hipotesis nula
Una pasteleria a sacado una nueva torta al mercado, la cual esperan que sea igual de famosa que su torta estrella, para esto, se invitó a un grupo de personas a probar ambas tortas para ver que tan popular puede llegar a ser. En esta prueba 7 de los participantes afirman preferir la nueva torta, mientras que el resto prefiere la otra ¿Son los dos productos igualmente populares?. Se debe considerar que la cantidad de participantes fue de 25
res = binom.test(7, 25, conf.level = 0.95)
res
##
## Exact binomial test
##
## data: 7 and 25
## number of successes = 7, number of trials = 25, p-value = 0.04329
## alternative hypothesis: true probability of success is not equal to 0.5
## 95 percent confidence interval:
## 0.1207167 0.4938768
## sample estimates:
## probability of success
## 0.28
A final de año se suele tener la valoracion de 5 videojuegos de genero shooter, de ellos, se desea saber si la media de valoracion de estos 5 videojuegos difiere de 2,5 estrellas (considerar de 0 a 5)
datos = data.frame(id = c(1:5), valoracion = round(rnorm(1, 5, 1), 1))
wilcoxon = wilcox.test(datos$valoracion, mu = 2.5)
## Warning in wilcox.test.default(datos$valoracion, mu = 2.5): cannot compute exact
## p-value with ties
wilcoxon
##
## Wilcoxon signed rank test with continuity correction
##
## data: datos$valoracion
## V = 15, p-value = 0.03689
## alternative hypothesis: true location is not equal to 2.5
Con un p-value de 0.03 podemos decir que es menor a 0.05 por lo que rechazamos la hipotesis nula y se acepta la hipotesis alternativa.