\[H_0: \mu \ ≤ 800.000\] \[H_a: \mu > 800.000\] R/: en este caso la hipótesis nula es lo que se cree desde un principio, es la afirmación inicial que se basa en análisis previos, en este caso la información que ya se tenia de la cantidad media que gastan los turistas en un fin de semana, esta es la hipótesis que quiere demostrar el investigador, la que fue postulada por el secretario. Por otro lado, la hipótesis alternativa es un valor diferente diferente al hipótetico, en este caso la alternativa es el cambio que ocurrió durante los últimos 3 meses.
R/: cuando esta hipótesis no se puede rechazar, es por que el el valor p es mayor al nivel de significancia. En ese sentido, si no se pudiese rechazar la hipótesis nula sería porque la probabilidad de obtener una media muestral en la que se gasten 800.000 o menos es muy alta.
R/: esto se podría concluir cuando el valor p sea manor al nivel de significancia. En ese sentido, la probabilidad de obtener una media muestral en la que se gasten más de 800.000 es mas alta.
\[H_0: \mu \ ≥ 8'000.000\] \[H_a: \mu < 8'000.000\] b. En esta situación, ¿cuál es el error tipo I? ¿Qué consecuencia tiene cometer este error?
R/: este se da cuando la hipótesis nula es verdadera y a consecuencia se debe rechazar por lo postulado en la investigación. esto sucedería si se comprueba que a pesar de subir los incentivos de venta en la empresa, las ventas siguen siendo en promedio de 8 millones.
R/: Sucede cuando la hipótesis nula en falsa y a consecuencia de esto se debe aceptar. esto sucedería si se demuestra que al aumentar los incentivos de ventas por parte de la empresa, el promedio de ventas es más de 8 millones
x_barra <- 231
n <- 100
s <- 80
ee <- s/sqrt(n)
ee
## [1] 8
H_0 <- 238
t <- (x_barra - H_0)/ee
t
## [1] -0.875
valor_p <- pt(t, df = n-1)
valor_p
## [1] 0.1918459
no se puede rechazar la hipótesis nula porque el valor p es mayor al nivel de significancia.
n <- 100
alpha <- 0.01
h_0 <- 238
v_critico <- abs(qt(alpha, df =n-1))
v_critico
## [1] 2.364606
x_barra <- 231
s <- 80
ee <- s/sqrt(n)
t <- abs(x_barra - h_0)/ee
t
## [1] 0.875
R/: se puede rechazar la hipótesis nula ya que en este caso el estadístico de prueba es menor al valor crítico
x_barra <- 875000
n <- 40
s <- 8200
ee <- s/sqrt(n)
ee
## [1] 1296.534
H_0 <- 850000
t <- (x_barra - H_0)/ee
t
## [1] 19.28218
valor_p <- pt(t, df = n-1)
valor_p
## [1] 1
con nivel de significancia 0.05, no se rechaza la hipótesis nula ya que el valor p es mayor al nivel de significancia.
n <- 40
alpha <- 0.05
h_0 <- 850000
# Estimación del valor crítico
v_critico <- qt(alpha, df = n-1)
v_critico
## [1] -1.684875
R/: en este caso la prueba de hipótesis no se rechaza en tanto el valor t no es menor al valor crítico, el estadístico de pueba permite evidenciar que la media muestral no está muy alejada de la hipótesis nula. En ese sentido se puede concluir que esta es verdadera.
si quisiera favorrecer la hipótesis alternativa donde la cantidad de espectadores en los 40 días de 2020 es mayor a 850.000 el director de noticias debería aumentar la muestra de 40 días porque, según los resultados, la hipótesis nula no se puede rechazar.
x_barra <- 43000
n <- 64
s <- 12000
ee <- s/sqrt(n)
ee
## [1] 1500
H_0 <- 37000
t <- (x_barra - H_0)/ee
t
## [1] 4
valor_p <- pt(t, df = n-1)
valor_p
## [1] 0.9999155
n <- 64
alpha <- 0.01
h_0 <- 37000
# Estimación del valor crítico
v_critico <- qt(alpha, df = n-1)
v_critico
## [1] -2.387008
Formule las hipótesis que puedan ser usadas para determinar si la membresía de los sindicatos ha aumentado en 2006. \[H_0: \mu \ ≤ 0.125\] \[H_a: \mu > 0.125\]
Si los resultados muestrales indican que 52 de los trabajadores pertenecen a los sindicatos, ¿cuál es el valor-p de esta prueba de hipótesis?
p_barra <- (52*100)/400
p_barra
## [1] 13
n <- 400
p_barra <- 0.13
h_0 <- 0.125
ee <- sqrt((h_0*(1-h_0))/n)
z <- (p_barra - h_0)/ee
abs (z)
## [1] 0.3023716
valor_p <- pnorm(abs(z), lower.tail =FALSE)*2
valor_p
## [1] 0.7623688
\[H_0: \mu \ = 0.7\] \[H_a: \mu ≠ 0.7\] b. Con α = 0, 01, cuál es la conclusión en los departamentos siguientes:
• Cundinamarca: 252 de 350 adultos no hacen ejercicio con regularidad.
alpha <- 0.01
h_0 <- 0.7
n <- 350
p_barra <- 252/n
p_barra
## [1] 0.72
ee <- sqrt((h_0*(1-h_0))/n)
ee
## [1] 0.0244949
z <- (p_barra - h_0)/ee
z
## [1] 0.8164966
valor_p <- pnorm(abs(z), lower.tail =FALSE)*2
valor_p
## [1] 0.4142162
• Valle del Cauca: 189 de 300 adultos no hacen ejercicio con regularidad.
n <- 300
p_barra <- 189/n
p_barra
## [1] 0.63
ee <- sqrt((h_0*(1-h_0))/n)
ee
## [1] 0.02645751
z <- (p_barra - h_0)/ee
z
## [1] -2.645751
valor_p <- pnorm(abs(z), lower.tail =FALSE)*2
valor_p
## [1] 0.008150972
qnorm(0.05/2, lower.tail = FALSE)
## [1] 1.959964
R/: el valor crítico es mayor al estadístico de prueba por tanto no se puede rechazar la hipótesis nula. Con base en la informacion de esta muestra, la proporcion de adultos que no se ejercita regularmente en Cundinamarca y el Valle del Cauca es no parecida a la proporción del 70% postulada por el investigador.
\[H_0: \mu \ ≤ 0.51\] \[H_a: \mu > 0.51\] b. En una muestra de 500 trabajadores de turnos nocturnos. se identificó a quienes admitían conducir somnolientos ¿Cuál es la proporción muestral? ¿Cuál es el valor-p? c. Con α = 0, 01, ¿cuál es la conclusión?
alpha <- 0.01
h_0 <- 0.51
n <- 500
p_barra <- 255
ee <- sqrt((h_0*(1-h_0))/n)
ee
## [1] 0.02235621
z <- (p_barra - h_0)/ee
z
## [1] 11383.42
valor_p <- pnorm(abs(z), lower.tail = FALSE)
valor_p
## [1] 0
R/: en este caso se puede rechazar la hipótesis nula porque elvalor p (0)es menor al nivel de significancia (0.01).
qnorm(0.05, lower.tail = FALSE)
## [1] 1.644854
R/: en este caso se puede rechazar la hipótesis nula ya que el valor del estadístico de proeba z es mayor al valor crítico.
Diferencia de las medias Bucaramanga y Barranquilla
x_barra1 <- 36
x_barra2 <- 29.76
d_barra <- x_barra1 - x_barra2
d_barra
## [1] 6.24
Bucaramanga1 y barranquilla2
s1 <- 13.44
x_barra1 <- 36
n1 <- 50
s2 <- 11.84
x_barra2 <- 29.76
n2 <- 40
alpha <- 0.05
gl <- function(s1, n1,s2, n2){
((s1^2/n1 + s2^2/n2)^2)/
((1/(n1-1))*(s1^2/n1)^2+ (1/(n2-1))*(s2^2/n2)^2)
}
grados <- gl(s1 = s1, n1 = n1, s2= s2, n2=n2)
ee <- sqrt((s1^2/n1) + (s2^2/n2))
alpha <- 0.05
t <- qt(alpha/2, df = grados, lower.tail = FALSE)
me <- t*ee
me
## [1] 5.302475
lb <- d_barra - me
la <- d_barra + me
intervalo <- c(lb, la)
intervalo
## [1] 0.9375245 11.5424755
R/: con un nivel de confianza del 95%, la diferencia en la media poblacional de estos dos grupos se va a encontrar entre 0.9375245 y 11.5424755.
\[H_0: \mu \ = 0\] \[H_a: \mu ≠ 0\]
h_0 <- 0
t <- (d_barra - h_0)/ee
t
## [1] 2.33898
valor_p <- pt(t, df = grados, lower.tail = FALSE)* 2
valor_p
## [1] 0.02162427
en este caso el valor p es menor al nivel de significancia por tanto rechazo la hipótesis nula de que la diferencia entre las dos medias es cero.
con nivel de confianza del 99%
s1 <- 13.44
x_barra1 <- 36
n1 <- 50
s2 <- 11.84
x_barra2 <- 29.76
n2 <- 40
alpha <- 0.01
ee <- sqrt((s1^2/n1) + (s2^2/n2))
alpha <- 0.01
t <- qt(alpha/2, df = grados, lower.tail = FALSE)
me <- t*ee
me
## [1] 7.025541
h_0 <- 0
t <- (d_barra - h_0)/ee
valor p:
alpha <- 0.01
valor_p <- pt(t, df = grados, lower.tail =FALSE)* 2
valor_p
## [1] 0.02162427
lb <- d_barra - me
la <- d_barra + me
intervalo <- c(lb, la)
intervalo
## [1] -0.7855405 13.2655405
R/: con el presente valor p la hipótesis nula no se puede rechazar porque este valor p es mayor a alpha 0.01.
x_barra1 <- 39.3
x_barra2 <- 35.4
d_barra <- x_barra1 - x_barra2
d_barra
## [1] 3.9
s1 <- 16.8
x_barra1 <- 39.3
n1 <- 150
s2 <- 15.2
x_barra2 <- 35.4
n2 <- 175
alpha <- 0.05
\[H_0: \mu \ = 0\] \[H_a: \mu ≠ 0\] b. ¿Cuál es el valor del estadístico de prueba?
gl <- function(s1, n1,s2, n2){
((s1^2/n1 + s2^2/n2)^2)/
((1/(n1-1))*(s1^2/n1)^2+ (1/(n2-1))*(s2^2/n2)^2)
}
grados <- gl(s1 = s1, n1 = n1, s2= s2, n2=n2)
ee <- sqrt((s1^2/n1) + (s2^2/n2))
alpha <- 0.05
t <- qt(alpha/2, df = grados, lower.tail = FALSE)
me <- t*ee
me
## [1] 3.521133
alpha <- 0.05
valor_p <- pt(t, df = grados, lower.tail =FALSE)* 2
valor_p
## [1] 0.05
¿A qué conclusión llega? el valor p es igual al valor del nivel de significancia
Para α = 0, 01 y usando el método del valor crítico, ¿a qué conclusión llega?
alpha <- 0.01
valor_p <- pt(t, df = grados, lower.tail =FALSE)* 2
valor_p
## [1] 0.05
h_0 <- 0
t <- (d_barra - h_0)/ee
t
## [1] 2.179544
valor_critico <- qt(alpha/2, df = grados, lower.tail = FALSE)
valor_critico
## [1] 2.592125
R/: el valor del estadístico de prueba es mayor al valor crítico. En ese sentido, puedo rechazar la hipótesis nula.
pregrado <- c (485, 487, 534, 533, 650, 526, 554, 410, 550, 515 ,572 ,578, 497, 448, 592,469)
bachillerato <- c(442, 492, 580, 478, 479, 425, 486, 485, 528, 390, 524, 535)
mean(pregrado)
## [1] 525
mean(bachillerato)
## [1] 487
estimación puntual de la diferencia de las medias
x_barra1 <- 525
x_barra2 <- 487
d_barra <- x_barra1 -x_barra2
d_barra
## [1] 38
sd(pregrado)
## [1] 59.42054
sd(bachillerato)
## [1] 51.74764
s1 <- 59.42
x_barra1 <- 525
n1 <- 16
s2 <- 51.74
x_barra2 <- 487
n2 <- 12
alpha <- 0.05
gl <- function(s1, n1,s2, n2){
((s1^2/n1 + s2^2/n2)^2)/
((1/(n1-1))*(s1^2/n1)^2+ (1/(n2-1))*(s2^2/n2)^2)
}
grados <- gl(s1 = s1, n1 = n1, s2= s2, n2=n2)
ee <- sqrt((s1^2/n1) + (s2^2/n2))
alpha <- 0.05
t <- qt(alpha/2, df = grados, lower.tail = FALSE)
me <- t*ee
me
## [1] 43.35566
alpha <- 0.05
valor_p <- pt(t, df = grados, lower.tail =FALSE)
valor_p
## [1] 0.025
alpha <- 0.01
valor_p <- pt(t, df = grados, lower.tail =FALSE)
valor_p
## [1] 0.025
h_0 <- 507
t <- abs(d_barra - h_0)/ee
t
## [1] 22.26386
valor_critico <- qt(alpha, df = grados, lower.tail = FALSE)
valor_critico
## [1] 2.482835
R/: no se puede rechazar la hipótesis nula ya que el valor del estadistico de prueba es menor al valor crítico.
alpha <- 0.05
h_0 <- 0.83
n <- 924
p_barra <- 742/n
p_barra
## [1] 0.8030303
ee <- sqrt((h_0*(1-h_0))/n)
ee
## [1] 0.01235741
z <- abs(p_barra - h_0)/ee
z
## [1] 2.182471
valor_p <- pnorm(abs(z), lower.tail = FALSE)
valor_p
## [1] 0.01453738
alpha <- 0.05
h_0 <- 0.847
n <- 847
p_barra <- 714/n
p_barra
## [1] 0.8429752
ee <- sqrt((h_0*(1-h_0))/n)
ee
## [1] 0.01236932
z <- abs(p_barra - h_0)/ee
z
## [1] 0.3253853
valor_p <- pnorm(abs(z), lower.tail = FALSE)
valor_p
## [1] 0.3724448
tendria que hacer algo con las 2 p o sumarlas???’? d. Si α = 0, 05, ¿cuál es su conclusión? e. Usando el método del valor crítico y α = 0, 01, ¿cuál es su conclusión?
solteros
alpha <- 0.05
h_0 <- 0.19
n <- 400
p_barra1 <- 76/n
p_barra1
## [1] 0.19
ee <- sqrt((h_0*(1-h_0))/n)
ee
## [1] 0.01961505
z <- abs(p_barra1 - h_0)/ee
z
## [1] 0
valor_p1 <- pnorm(abs(z), lower.tail = FALSE)
valor_p1
## [1] 0.5
casados
alpha <- 0.05
h_0 <- 0.10
n <- 900
p_barra2 <- 90/n
p_barra2
## [1] 0.1
ee <- sqrt((h_0*(1-h_0))/n)
ee
## [1] 0.01
z <- abs(p_barra2 - h_0)/ee
z
## [1] 0
valor_p2 <- pnorm(abs(z), lower.tail = FALSE)
valor_p2
## [1] 0.5
d_barra <- p_barra1- p_barra2
d_barra
## [1] 0.09
h_0 <- 0
t <- (d_barra - h_0)/ee
t
## [1] 9
me <- t*ee
me
## [1] 0.09
lb <- d_barra - me
la <- d_barra + me
intervalo <- c(lb, la)
intervalo
## [1] 0.00 0.18
alpha <- 0.02
h_0 <- 0.0633
n <- 142
p_barra1 <- 9/n
p_barra1
## [1] 0.06338028
ee <- sqrt((h_0*(1-h_0))/n)
ee
## [1] 0.02043421
z <- abs(p_barra2 - h_0)/ee
z
## [1] 1.796007
valor_p1 <- pnorm(abs(z), lower.tail = FALSE)
valor_p1
## [1] 0.03624667
n <- 268
p_barra2 <- 5/n
p_barra2
## [1] 0.01865672
ee <- sqrt((h_0*(1-h_0))/n)
ee
## [1] 0.01487424
z <- abs(p_barra2 - h_0)/ee
z
## [1] 3.001383
valor_p2 <- pnorm(abs(z), lower.tail = FALSE)
valor_p2
## [1] 0.001343782
diferencia de las proporciones
d_barra <- valor_p1 - valor_p2
d_barra
## [1] 0.03490289
no hay diferencia entre las proporciones de las personas que son resistentes a los medicamentos.