Realizar pruebas de hipótesis de una y dos colas para estimaciones de medias.
Se cargan algunos ejercicios del contexto de literatura consultada.
Se describe prueba de hipótesis de dos colas.
Se describe prueba de hipótesis de una cola por la izquierda.
Se describe prueba de hipótesis de una cola por la derecha.
Aspectos generales del caso.
library(visualize)
library(knitr)
source("https://raw.githubusercontent.com/rpizarrog/Probabilidad-y-EstadIstica-VIRTUAL-DISTANCIA/main/funciones/funciones.para.distribuciones.r")
Se debe determinar un valor de prueba (z.test o t.test) dependiendo de la distribución si es normal estandarizada z o t student.
¿De qué depénde utilizar z o t?
Si SI se conoce la desviación estándar de la población \(\sigma\) utilizar z
Si NO se conoce la desviación estándar de la población \(\sigma\) entonces utilizar t.
¿Cómo obtener el valor de prueba z o t?
El valor de prueba de z
\[ z = \frac{\bar{x}-\mu} {\sigma / \sqrt{n}} \therefore \\ z \text{: es el valor de z a contrastar} \\ \bar{x} \text{: la media de la muestra} \\ \mu \text{: la media de la población} \\ \sigma \text{: la desviación estandar de la población} \\ n \text{: el tamaño de la muestra} \\ \sigma/\sqrt{n} \text{: el el error estándar SE} \]
Valor de prueba de t
\[ t = \frac{\bar{x}-\mu} {s / \sqrt{n}} \therefore \\ t \text{: es el valor de t a contrastar} \\ \bar{x} \text{: la media de la muestra} \\ \mu \text{: la media de la población} \\ s \text{: la desviación estandar de la muestra} \\ n \text{: el tamaño de la muestra} \\ s/\sqrt{n} \text{: el el error estándar SE} \]
Se necesitan los valores de z.critico y t.critico respectivamente y dependiendo de la distribución normal estandarizada o t student .
Se utilizaría la función qnorm() para z y qt() para t student.
Se requiere el nivel de confianza, es decir el valor de alfa.
\[ \alpha = (1 - confianza) / 2 \text{; dos colas} \\ \alpha = (1 - confianza) \text{; una cola} \]
confianza = c(0.90, 0.95, 0.99)
# Dos colas
alfa <- (1 - confianza) / 2
z.critico <- qnorm(p = alfa)
z.critico <- abs(z.critico)
z.critico
## [1] 1.644854 1.959964 2.575829
# Una cola izquierda
alfa <- (1 - confianza)
z.critico.izq <- qnorm(p = alfa)
z.critico.izq
## [1] -1.281552 -1.644854 -2.326348
# Una cola derecha
alfa <- (1 - confianza)
z.critico.der <- qnorm(p = alfa, lower.tail= FALSE)
z.critico.der
## [1] 1.281552 1.644854 2.326348
tabla.z <- data.frame(confianza = confianza, alfa = alfa, "z dos colas" = z.critico, "z izquierda" = z.critico.izq, "z derecha" = z.critico.der)
kable(tabla.z, caption = "Valores de z.critico a 90%, 95% y 99%")
confianza | alfa | z.dos.colas | z.izquierda | z.derecha |
---|---|---|---|---|
0.90 | 0.10 | 1.644854 | -1.281552 | 1.281552 |
0.95 | 0.05 | 1.959964 | -1.644854 | 1.644854 |
0.99 | 0.01 | 2.575829 | -2.326348 | 2.326348 |
Se requiere el nivel de confianza, es decir el valor de alfa.
\[ \alpha = (1 - confianza) / 2 \text{; dos colas} \\ \alpha = (1 - confianza) \text{; una cola} \]
confianza = c(0.90, 0.95, 0.99)
n <- 30
# Dos colas
alfa <- (1 - confianza) / 2
t.critico <- qt(p = alfa, df = n-1)
t.critico <- abs(t.critico)
t.critico
## [1] 1.699127 2.045230 2.756386
# Una cola izquierda
alfa <- (1 - confianza)
t.critico.izq <- qt(p = alfa, df = n-1)
t.critico.izq
## [1] -1.311434 -1.699127 -2.462021
# Una cola derecha
alfa <- (1 - confianza)
t.critico.der <- qt(p = alfa, lower.tail= FALSE, df = n-1)
t.critico.der
## [1] 1.311434 1.699127 2.462021
tabla.t <- data.frame(confianza = confianza, alfa = alfa, "t dos colas" = t.critico, "t izquierda" = t.critico.izq, "t derecha" = t.critico.der, "grados libertad"= n-1)
kable(tabla.t, caption = "Valores de t.critico a 90% 95% y 99%")
confianza | alfa | t.dos.colas | t.izquierda | t.derecha | grados.libertad |
---|---|---|---|---|---|
0.90 | 0.10 | 1.699127 | -1.311434 | 1.311434 | 29 |
0.95 | 0.05 | 2.045230 | -1.699127 | 1.699127 | 29 |
0.99 | 0.01 | 2.756386 | -2.462021 | 2.462021 | 29 |
Se debe declarar hipótesis nula y alternativa
Normalamente se tiene una pregunta de investigación que hay que comprobar o contrastar contra una hipótesis nula.
La pregunta de investigación será la hipótesis alternativa
La negación de esta hipótesis alternativa será la hipótesis nula.
La hipótesis nula se asocia con la igualdad
Dos colas | Una cola izquierda | Una cola derecha |
---|---|---|
\[ H_0: \mu = \mu_0 \] | \[ H_0: \mu \ge \mu_0 \] | \[ H_0: \mu \le \mu_0 \] |
\[ H_a: \mu \neq \mu_0 \] | \[ H_a: \mu < \mu_0 \] | \[ H_a: \mu > \mu_0 \] |
Ejemplo: Dos colas: Le media de población es 50, la pregunta de investigación es que la media es diferente de 50.
\[ H_0: \mu = 50 \] |
\[ H_a: \mu \neq 50 \] |
Ejemplo: una cola izquierda: Le media de población es mayor o igual a 50, la pregunta de investigación es que la media es menor de 50.
\[ H_0: \mu \ge 50 \] |
---|
\[ H_a: \mu < 50 \] |
Ejemplo: una cola derecha: Le media de población es menor o igual a 50, la pregunta de investigación es que la media es menor de 50.
\[ H_0: \mu \le 50 \] |
---|
\[ H_a: \mu > 50 \] |
Sembrar una semilla
set.seed(2021)
Los datos de la población están entre una media de 35 y desviación de 3
N <- 500 # Población
poblacion <- rnorm(n = N, mean = 35, sd = 3)
poblacion
## [1] 34.63262 36.65737 36.04595 36.07890 37.69416 29.23229 35.78523 37.74670
## [9] 35.04132 40.18989 31.75339 34.18152 35.54599 39.52563 39.81341 29.47557
## [17] 39.86993 35.39417 39.44337 39.53995 32.17267 34.44294 31.69663 38.62435
## [25] 30.12518 35.31614 30.63367 33.93795 34.71890 38.30201 29.10852 30.65617
## [33] 38.05833 30.73575 33.18640 30.24958 31.14220 30.63595 34.73879 36.51421
## [41] 35.34917 40.28064 33.96465 41.36000 34.89687 32.62354 39.42655 32.82333
## [49] 35.93714 37.07589 33.49913 28.23239 35.13122 33.89355 32.11933 35.31130
## [57] 36.28187 34.48856 30.35258 30.48320 35.04813 34.44391 36.17580 32.72987
## [65] 35.69425 32.04916 36.69524 39.85026 34.24411 31.83236 33.95530 34.87103
## [73] 30.80734 39.47065 31.88184 34.28916 32.00258 30.82237 37.94602 36.08282
## [81] 33.98747 33.06984 28.49934 36.89987 34.56526 31.27992 36.60188 30.23521
## [89] 32.02711 36.44978 37.43186 34.11901 34.83963 37.20555 35.04495 34.63399
## [97] 33.05968 32.39643 33.47390 28.76725 34.21899 36.35102 34.57136 33.53984
## [105] 31.41268 35.14082 34.62040 26.89785 33.28756 36.77479 36.46093 34.61960
## [113] 31.22240 35.60388 29.24929 40.01822 36.41237 39.24234 35.25290 29.59309
## [121] 37.26123 34.06417 29.80232 28.58431 42.09740 36.45427 38.27971 35.90873
## [129] 38.04590 42.36078 34.26314 36.62456 35.59063 28.78651 36.53775 33.78271
## [137] 36.06859 34.00529 35.24177 34.21540 32.36765 37.22393 26.95111 32.15156
## [145] 36.33879 31.13351 34.52658 36.04345 34.82113 39.43019 33.03751 34.22956
## [153] 31.23789 37.31313 32.26594 32.92008 33.14699 37.28637 31.73852 33.80060
## [161] 37.48339 36.06626 35.47742 37.86619 33.98107 32.81786 29.90658 40.86242
## [169] 43.00021 41.19014 37.45635 34.76105 33.53165 37.54316 32.12287 37.78606
## [177] 36.14290 39.48381 33.59689 35.78347 32.02217 31.80986 35.82285 37.83603
## [185] 37.17857 34.23646 39.45554 35.69086 35.83401 35.44112 31.41113 35.27041
## [193] 38.65781 33.31552 36.01065 30.38960 34.27961 36.54460 34.28343 36.74546
## [201] 35.81059 30.97025 32.45333 33.77718 33.00155 34.69029 32.22785 36.31580
## [209] 34.96370 33.06227 39.03244 36.00380 35.00868 38.29086 38.48981 35.30236
## [217] 33.82474 33.76679 32.25926 33.37882 35.36409 40.18321 34.86743 36.63453
## [225] 40.75206 34.29029 39.71487 36.44255 35.12779 36.31947 29.35831 29.82779
## [233] 40.64950 34.90614 37.99713 35.90096 34.98442 34.27909 29.68705 34.53140
## [241] 40.74610 38.33036 29.04287 37.44310 38.29475 30.67792 38.64571 32.65134
## [249] 28.79874 36.00306 35.78281 33.69697 29.38098 32.59087 35.99697 35.03634
## [257] 37.55032 30.40740 34.90533 39.28292 32.21891 38.01683 34.74213 37.81407
## [265] 33.44511 32.19645 38.69476 34.28122 35.81957 39.29248 31.57695 37.68802
## [273] 35.24851 36.05022 31.22513 37.51906 31.22474 35.45934 33.54890 41.63256
## [281] 35.24247 37.14832 38.16337 35.82851 33.73921 42.56751 35.00605 30.31327
## [289] 29.03665 30.52384 35.76572 32.55651 37.50161 31.54250 34.57865 38.52823
## [297] 35.56084 32.91568 33.62167 33.57498 38.61817 37.98233 39.61747 35.87554
## [305] 36.53164 33.37726 32.97826 37.04045 35.56014 30.84341 31.82812 36.12272
## [313] 31.99245 34.87201 34.98277 31.87522 34.02431 33.17431 39.55180 35.88940
## [321] 36.19909 37.24550 34.73578 31.74323 34.74414 36.39651 34.99991 36.84894
## [329] 33.04385 36.34172 34.45225 32.58068 29.57135 32.66164 29.03502 37.99171
## [337] 31.87364 35.61429 35.84692 35.47995 30.24114 36.63598 30.90039 31.65186
## [345] 35.48742 39.53495 33.95276 29.08927 32.45780 29.68897 38.26901 30.79270
## [353] 37.80569 34.96402 35.78026 38.45268 38.50266 31.43504 35.66164 38.40291
## [361] 36.53291 30.50854 31.64733 32.72644 32.67070 34.20921 31.40348 30.94289
## [369] 36.03585 32.25679 36.14508 33.34425 35.10411 33.40190 37.86035 37.08792
## [377] 32.98324 38.96898 33.95771 33.40750 37.20207 35.46356 36.97589 32.19205
## [385] 29.17465 35.10106 33.66411 38.53233 34.76853 36.65344 33.64407 30.87468
## [393] 35.01473 37.70588 32.20239 36.68255 35.93427 39.17609 42.31953 34.44658
## [401] 32.97633 35.71438 36.63526 33.65345 37.91374 30.35851 35.59099 37.51622
## [409] 36.48772 35.23827 31.82853 32.87660 30.90936 36.87678 33.26882 40.16087
## [417] 39.90980 34.40192 36.58915 32.04656 38.73413 36.34659 35.62375 30.25598
## [425] 37.58668 38.92791 37.66529 38.61490 41.32528 40.45742 40.69004 37.86476
## [433] 31.81065 40.47276 33.86659 39.45904 33.75252 34.01249 34.85277 41.35206
## [441] 35.46134 38.21541 31.67163 35.21407 35.63376 36.64119 36.20814 37.09559
## [449] 35.54969 40.92374 38.57834 32.33186 33.79959 34.87098 34.94543 32.31969
## [457] 31.85107 36.08618 37.62970 41.69546 39.76663 36.74730 32.73886 35.53332
## [465] 31.69825 34.84496 39.35015 37.31693 37.17964 39.64168 35.37573 35.33096
## [473] 40.47972 34.37473 34.33040 29.07994 36.21333 32.67347 34.29255 40.72214
## [481] 35.64327 32.54718 31.09225 33.77875 44.06481 35.42594 32.73979 38.49548
## [489] 36.74826 31.84529 33.44654 31.76744 37.97708 34.95803 29.74502 37.58980
## [497] 37.55075 40.18217 39.35947 35.36975
Se determina los parámetros de población
media.p <- mean(poblacion)
desv.p <- sd(poblacion)
media.p; desv.p
## [1] 35.01289
## [1] 3.081931
Se obtienen 30 elementos como muestra a partir de la población generada.
n <- 30
muestra <- sample(x = poblacion, size = 30, replace = TRUE)
muestra
## [1] 33.77875 44.06481 38.64571 38.04590 35.14082 33.62167 36.01065 30.97025
## [9] 36.14508 33.62167 33.05968 35.90873 33.93795 30.73575 34.02431 34.06417
## [17] 36.89987 34.61960 33.64407 34.27961 40.45742 33.66411 33.93795 32.97633
## [25] 36.87678 30.94289 39.85026 33.54890 30.40740 31.69663
Se determina los estadísticos de la muestra
media.m <- mean(muestra)
desv.m <- sd(muestra)
media.m; desv.m
## [1] 34.85259
## [1] 3.075041
El ejercicio se simula que la muestra provienen de una población normal y en cuyo caso SI SE CONOCE LA desviación estándar de la población por lo que se usará la distribución z o normal estandarizada.
La media es diferente de 35
\[ H_0: \mu = 35 \] |
---|
\[ H_a: \mu \neq 35 \] |
media.a.comparar <- 35
z <- f.devolver.z.prueba(media.m = media.m, media.p = media.a.comparar, desv.p = desv.p, n = n)
z
## [1] -0.2619785
Se definen un nivel de confianza del 95%
confianza = 0.95
# Dos colas
alfa <- (1 - confianza) / 2
z.critico <- qnorm(p = alfa)
z.critico <- abs(z.critico)
z.critico
## [1] 1.959964
visualize.norm(stat = c(-z.critico, z.critico), section = "tails") +
text(0, 0.2, paste(confianza * 100, "%", "\n",
"alfa=", (1 - confianza), "\n", "alfa / 2 = ",
(1 - confianza) / 2, "\n", "Acepta Ho", sep = ""), col = "black") +
abline(v = z, col='red', lwd = 1, lty= 4)
## integer(0)
# Se contrasta por la izq y dercha
conclusion <- "Acepta Ho"
if (z < -z.critico & z < z.critico)
conclusion = "Se rechaza Ho"
conclusion
## [1] "Acepta Ho"
La pregunta de investigación es: la media es menor que 33.5
Se declara una hipótesis de una cola por la izquerida
\[ H_0: \mu \ge 33.5 \] |
---|
\[ H_a: \mu < 33.5 \] |
media.a.comparar <- 33.5
z <- f.devolver.z.prueba(media.m = media.m, media.p = media.a.comparar, desv.p = desv.p, n = n)
z
## [1] 2.40383
Se definen un nivel de confianza del 95%
confianza = 0.95
# Una cola izquierda
alfa <- (1 - confianza)
z.critico.izq <- qnorm(p = alfa)
z.critico.izq
## [1] -1.644854
visualize.norm(stat = c(z.critico.izq), section = "lower") +
text(0, 0.2, paste(confianza * 100, "%", "\n",
"alfa=", (1 - confianza), "\n", "Acepta Ho", sep = ""), col = "black") +
abline(v = z, col='red', lwd = 1, lty= 4)
## integer(0)
# Se contrasta por la izquierda
conclusion <- "Acepta Ho"
if (z < z.critico.izq)
conclusion = "Se rechaza Ho"
conclusion
## [1] "Acepta Ho"
La pregunta de investigación es: la media es mayor que 33
Se declara una hipótesis de una cola por la derecha
\[ H_0: \mu \le 33 \] |
---|
\[ H_a: \mu > 33 \] |
media.a.comparar <- 33
z <- f.devolver.z.prueba(media.m = media.m, media.p = media.a.comparar, desv.p = desv.p, n = n)
z
## [1] 3.292433
Se define un nivel de confianza del 95%
confianza = 0.95
# Una cola derecha
alfa <- (1 - confianza)
z.critico.der <- qnorm(p = alfa, lower.tail = FALSE)
z.critico.der
## [1] 1.644854
visualize.norm(stat = c(z.critico.der), section = "upper") +
text(0, 0.2, paste(confianza * 100, "%", "\n",
"alfa=", (1 - confianza), "\n", "Acepta Ho", sep = ""), col = "black") +
abline(v = z, col='red', lwd = 1, lty= 4)
## integer(0)
# Se contrasta por derecha
conclusion <- "Acepta Ho"
if (z > z.critico.der) {
conclusion = "Se rechaza Ho"
}
conclusion
## [1] "Se rechaza Ho"
Efectivamente la media poblacional debe tener un valor por encima de 33
Se evaluarán las mismas hipótesis del caso previo pero usando la asumpción que nbo se conoce la desviación estandar poblacional para usar el valor de t en lugar de z.
Primeramente calculamos el valor de t de prueba para la muestra obtenida (se asume que se desconoce la desv. estandar de la población).
t<- (media.m-33)/(desv.m/sqrt(n))
t
## [1] 3.299811
Ahora calculamos los valores para t crítica con dos colas:
alfa <- (1 - confianza) / 2
t.critico <- qt(p = alfa, df = n-1)
t.critico <- abs(t.critico)
t.critico
## [1] 2.04523
Finalmente comparamos los valores de t mediante un gráfico:
visualize.norm(stat = c(-t.critico, t.critico), section = "tails") +
text(0, 0.2, paste(confianza * 100, "%", "\n",
"alfa=", (1 - confianza), "\n", "alfa / 2 = ",
(1 - confianza) / 2, "\n", "Acepta Ho", sep = ""), col = "black") +
abline(v = t, col='red', lwd = 1, lty= 4)
## integer(0)
Dado que el valor de t se encuentra en la zona de rechazo de la hipotesis nula, se rechaza esta hipótesis y se considera que la media es diferente de 33.
Primeramente calculamos el valor de t para el valor de interés.
t<- (media.m-33)/(desv.m/sqrt(n))
t
## [1] 3.299811
Ahora se procede a calcular t critica para la cola de la izquierda
alfa <- (1 - confianza)
t.critico.izq <- qt(p = alfa, df = n-1)
t.critico.izq
## [1] -1.699127
Revisamos graficamente la localización de t:
visualize.norm(stat = c(t.critico.izq), section = "lower") +
text(0, 0.2, paste(confianza * 100, "%", "\n",
"alfa=", (1 - confianza), "\n", "alfa / 2 = ",
(1 - confianza) / 2, "\n", "Acepta Ho", sep = ""), col = "black") +
abline(v = t, col='red', lwd = 1, lty= 4)
## integer(0)
En este caso se acepta la hipotesis nula y se considera que la media si es mayor a 33.
Se procede al análisis para t por la cola de la derecha. Calculamos t por la derecha:
alfa <- (1 - confianza)
t.critico.der <- qt(p = alfa, lower.tail= FALSE, df = n-1)
t.critico.der
## [1] 1.699127
Ahora procedemos a revisar la localización de t para este caso:
visualize.norm(stat = c(t.critico.der), section = "upper") +
text(0, 0.2, paste(confianza * 100, "%", "\n",
"alfa=", (1 - confianza), "\n", "Acepta Ho", sep = ""), col = "black") +
abline(v = t, col='red', lwd = 1, lty= 4)
## integer(0)
El valor de t obtenido se encuentra en la zona de rechazo, por tanto rechazamos la hipotesis nula (media menor a 33) y se considera que en efecto, la media poblacional es mayor a 33.
A partir de la información analizada por parte de la prueba de hipótesis, tanto la prueba con desviación estandar conocida (z) como la desconocida (t), se ha determinado que la media para el comportamiento de la muestra es siempre diferente de 33. De hecho es mayor a 33 en los casos que se ha revisado usando una prueba de una sola cola.
Lo anterior nos permite identificar la relevancia que tiene la prueba de hipotesis para los parámetros ya que facilita identificar el comportamiento que podriamos esperar si revisamos la media poblacional, que de hecho, al calcularla para la población del caso obtenemos un valor de 35.01, lo cual, si es mayor a 33 y concuerda con nuestros análisis de prueba de hipótesis.
Anderson, David R., Dennis J. Sweeney, and Thomas A. Williams. 2008. Estadística Para Administración y Economía. 10th ed. Australia Brasil Corea España Estados Unidos Japón México Reino Unido Singapur: Cengage Learning,. Lind, Douglas, William Marchal, and Samuel Wathen. 2015. Estadística Aplicada a Los Negocios y La Economía. Decimo Sexta. México, D.F.: McGraw-Hill. Mendenhall, William, Robert J. Beaver, and Barbara M. Beaver. 2010. Introducción a La Probabilidad y Estadística. 13th ed. Cengage Learning Editores, S.A. de C.V.,.