Ejercicio 6 Estadistica Computacional

Prueba para contraste de media, con media poblacional y varianza conocida

“El tiempo medio de jugar videojuegos al día que dedican los adolescentes sigue una distribución normal de media 120 minutos y desviación típica poblacional de 30 minutos. Para contrastar esta hipótesis, se toma una muestra aleatoria formada por 100 alumnos, y se observa que el tiempo medio es de 90 minutos ¿ que se puede decir de esta afirmación con un nivel de significación del 10%?”

Grafico de la funcion densidad

library("ggplot2")
grafico_densidad = ggplot(data = data.frame(x = c(50, 200)), aes(x)) +
  stat_function(fun = dnorm, n = 100, args = list(mean = 120, sd = 30)) + ylab("") +
  scale_y_continuous(breaks = NULL) + xlab("Jugar videojuegos") + ylab("Densidad") + ggtitle("Función de densidad (distribución normal)") + theme_bw() +
  geom_vline(xintercept = 90,cex=1.2,colour ="darkred",linetype="longdash") + geom_text(aes(x=90, label="xbar", y=0.0), colour ="darkred",size=5) + geom_vline(xintercept = 90,cex=1.2,colour ="coral3",linetype="longdash") + geom_text(aes(x=120, label="mu", y=0.1), colour ="coral3",size=5)  
grafico_densidad

La hipotesis nula es cuando la media es de 120 minutos y la hipotesis alternativa es cuando la media es menor a 120

#Datos
mu=120
sigma = 30
x_bar= 90
n=100

#Normalización
z = (x_bar-mu)/(sigma/sqrt(n))

#Confianza
alfa = 0.05
confianza = 1-alfa

z_alfa = qnorm(alfa/2)
z

## [1] -10

z_alfa

## [1] -1.959964

Analisis de los resultados

El valor de z es -10, mientras que el intervalo de zα es [-1.959964, 1.959964]. Esto implica que z está fuera del intervalo de confianza, por lo que se rechaza H0 y se acepta ha.

2. Prueba para contraste de media, con media poblacional conocida y varianza desconocida.

Se dice que el costo promedio de un par de zapatillas es de 150 dólares. Para determinar si esto es verdad, se toma una muestra aleatoria de 30 de ella, resultando en una media muestral de 165 dólares y una desviación estándar muestral de 14. Pruebe la hipótesis de que el precio de las camisetas es diferente a 150 dólares con α=0.05. Suponga una distribución normal.

library("ggplot2")

grafico_densidad = ggplot(data = data.frame(x = c(100, 300)), aes(x)) +
  stat_function(fun = dt, n = 30, args = list(x =150, df = 24)) + ylab("") +
  scale_y_continuous(breaks = NULL) + xlab("Costo") + ylab("Densidad") + ggtitle("Función de densidad (Distribución t)") + theme_bw() +
  geom_vline(xintercept = 14,cex=1.2,colour ="darkred",linetype="longdash") + geom_text(aes(x=200, label="xbar", y=0.0), colour ="darkred",size=5) + geom_vline(xintercept = 150,cex=1.2,colour ="coral3",linetype="longdash") + geom_text(aes(x=165, label="mu", y=0.001), colour ="coral3",size=5)  

grafico_densidad

## Warning in (function (x, df, ncp, log = FALSE) : no se han podido alcanzar
## precisión absoluta en 'pnt{final}'

## Warning in (function (x, df, ncp, log = FALSE) : no se han podido alcanzar
## precisión absoluta en 'pnt{final}'

## Warning in (function (x, df, ncp, log = FALSE) : no se han podido alcanzar
## precisión absoluta en 'pnt{final}'

## Warning in (function (x, df, ncp, log = FALSE) : no se han podido alcanzar
## precisión absoluta en 'pnt{final}'

## Warning in (function (x, df, ncp, log = FALSE) : no se han podido alcanzar
## precisión absoluta en 'pnt{final}'

## Warning in (function (x, df, ncp, log = FALSE) : no se han podido alcanzar
## precisión absoluta en 'pnt{final}'

La hipotesis nula es cuando la media es de 150 dolares y la hipotesis alternativa es cuando la media es menor a 150

#Datos
mu=150
s = 14
x_bar=165
n=30

#Normalización
t = (x_bar-mu)/(s/sqrt(n))

#Confianza
alfa = 0.05
confianza = 1-alfa

t_alfa = qt(alfa/2,df = n-1)
t

## [1] 5.868456

t_alfa

## [1] -2.04523

El valor de t es 5.868456, mientras que el intervalo de tα es [-2.04523, 2.04523]. Esto implica que t está dentro del intervalo de confianza, por lo que NO podemos rechazar H_0.

Prueba para contraste de varianza

Un laboratorio desea determinar si el lote de uno de sus farmacos tiene o no una varianza poblacional mayor a 25 en su grado de efectividad. Se realiza un muestreo de 50 elementos y se obtiene una varianza muestral de 27.9. Realizar la prueba de hipótesis con alfa = 0.05

library("ggplot2")

grafico_densidad = ggplot(data = data.frame(x = c(0, 30)), aes(x)) +
  stat_function(fun = dchisq, n = 101, args = list(x =25, df = 19)) + ylab("") +
  scale_y_continuous(breaks = NULL) + xlab("Farmacos") + ylab("Densidad") + ggtitle("Función de densidad") + theme_bw() +
  geom_vline(xintercept = 27.9,cex=1.2,colour ="darkred") + geom_text(aes(x=21, label="S^2", y=0.0), colour ="darkred",size=5) 

grafico_densidad

Nuestra hipótesis nula, basándose en los datos señalados en el enunciado puede ser especificada como:

\[ H_0 σ^2 <= 25 \] Si aplicamos la normalización para calcular chi bajo una prueba de una cola, nos queda que:

#Datos
sigma2=25
n = 50
s2=27.9


#Normalización
chi = (n-1)*s2/(sigma2)

#Confianza
alfa = 0.05
confianza = 1-alfa

chi_alfa = qchisq(alfa,df = n-1,lower.tail = F) #Lower.tail se relaciona con <= de la hipótesis nula.

chi

## [1] 54.684

chi_alfa

## [1] 66.33865

El valor de chi es 54.684 , mientras chiα es [66.33865]. Esto implica que chi está dentro del intervalo de confianza, por lo que NO podemos rechazar H0

Actividad 4: Buscar/crear y resolver un ejemplo de bondad de ajuste Chi cuadrado, utilice el conjunto de datos Iris disponible en R data(“iris”).

Suponiendo una distribución de tipos de flores en la naturaleza posee una proporción de 3:2:1, tenemos a nuestra disposición el dataset “iris”, el cual contempla muchos ejemplares, de ellos se van a utilizar, 16 son rosas, 60 son margaritas y 32 son hortensias .¿Existe diferencia entre las proporciones?”

data("iris")

flores = c(16, 60, 32)
sol = chisq.test(flores, p = c(1/6, 1/2, 1/3))
sol

## 
##  Chi-squared test for given probabilities
## 
## data:  flores
## X-squared = 1.3333, df = 2, p-value = 0.5134

5. Buscar/crear y resolver un ejemplo de prueba de hipótesis en una proporción binomial, de una o dos colas.

El año pasado el jugador keznit tuvo 412 de 480 kills mediante headshot en torneo. Este año, lleva 357 (headshot) de 400 kills. ¿Existe una diferencia significativa entre ambas proporciones?

headshots = c(412, 357)
kills_totales= c(480, 400)

respuesta = prop.test(headshots, kills_totales, correct = FALSE, conf.level = 0.95)
respuesta

## 
##  2-sample test for equality of proportions without continuity
##  correction
## 
## data:  headshots out of kills_totales
## X-squared = 2.3107, df = 1, p-value = 0.1285
## alternative hypothesis: two.sided
## 95 percent confidence interval:
##  -0.077693179  0.009359845
## sample estimates:
##    prop 1    prop 2 
## 0.8583333 0.8925000

El p-value es mayor a 0.05, por lo que aceptamos la hipotesis nula

6.Buscar/crear y resolver un ejemplo de prueba de hipótesis en el que aplique la prueba del signo.

Una pasteleria a sacado una nueva torta al mercado, la cual esperan que sea igual de famosa que su torta estrella, para esto, se invitó a un grupo de personas a probar ambas tortas para ver que tan popular puede llegar a ser. En esta prueba 7 de los participantes afirman preferir la nueva torta, mientras que el resto prefiere la otra ¿Son los dos productos igualmente populares?. Se debe considerar que la cantidad de participantes fue de 25

res = binom.test(7, 25, conf.level = 0.95)
res

## 
##  Exact binomial test
## 
## data:  7 and 25
## number of successes = 7, number of trials = 25, p-value = 0.04329
## alternative hypothesis: true probability of success is not equal to 0.5
## 95 percent confidence interval:
##  0.1207167 0.4938768
## sample estimates:
## probability of success 
##                   0.28

7. Buscar/crear y resolver un ejemplo de prueba de hipótesis en el que aplique la prueba de Wilcoxon para una muestra.

A final de año se suele tener la valoracion de 5 videojuegos de genero shooter, de ellos, se desea saber si la media de valoracion de estos 5 videojuegos difiere de 2,5 estrellas (considerar de 0 a 5)

datos = data.frame(id = c(1:5), valoracion = round(rnorm(1, 5, 1), 1))

wilcoxon = wilcox.test(datos$valoracion, mu = 2.5)

## Warning in wilcox.test.default(datos$valoracion, mu = 2.5): cannot compute exact
## p-value with ties

wilcoxon

## 
##  Wilcoxon signed rank test with continuity correction
## 
## data:  datos$valoracion
## V = 15, p-value = 0.03689
## alternative hypothesis: true location is not equal to 2.5

Con un p-value de 0.03 podemos decir que es menor a 0.05 por lo que rechazamos la hipotesis nula y se acepta la hipotesis alternativa.