Esta guía hace parte del material de apoyo a los espacios académicos de Estadística y Métodos estadísticos de la Universidad de La Salle, Colombia.
En esta encontraremos ejercicios de diferentes textos de las referencias bibliográficas que se encuentran en los Syllabus del espacio académico.
Se presenta el paso a paso de la construcción de un intervalo de confianza como el procedmiento para pruebas de hipótesis, adicionalmente, se encuentra la instrucción en R que facilita el procedimiento (en los casos que es posible).
Cualquier duda o pregrunta por favor realizarla en el foro de los espacios virtuales o en las sesiones de clase de los programas presenciales.
Medical researchers have developed a new artificial heart constructed primarily of titanium and plastic. The heart will last and operate almost indefinitely once it is implanted in the patient’s body, but the battery pack needs to be recharge about every 4 hours. A random sample of 50 battery packs is selected and subjected to a life test. The average life of these batteries is 4.05 hours. Assume that battery life is normally distributed with standard deviation \(\sigma=0.2\) hours
Is there evidence to support the claim that mean battery life exceeds 4 hour?
Para la construcción de este intervalo de confianza utilizaremos la siguiente estrctura:
\[IC((1-\alpha)\%,\mu)=[\bar{x} \mp Z\frac{\sigma}{\sqrt{n}}]\]
Utilizamos el valor crítico de la normal, debido a que se conoce el valor de la desviación estándar poblacional.
Calculamos los valores necesarios para construcción del intervalo de confianza:
n=50 # Cantidad de baterías que fueron seleccionadas
estimador=4.05 #Cantidad de horas promedio de vida de las baerías de la muestra
sigma=0.2 #Desviación estándar poblacional
Z=qnorm(0.05,lower.tail = F) #Valor crítico de la distribución normal para 95% de confianza
Z
## [1] 1.644854
En este caso queremos verificar que la vida media supera el valor 4 horas, por tanto solo calcularemos el extremo inferior del intervalo de confianza.
LI=estimador-Z*sigma/sqrt(n)
LI
## [1] 4.003477
Con un \(95\%\) de confianza el valor de la vida útil media de las baterías es de al menos 4.0034765. Valor que es mayor a 4.0 horas. Por tanto, se puede concluir que la vida media de las baterías excede las 4 horas.
Dado que los valores de los extremos del intervalo de confianza, no son ambos mayores a 4, no se puede concluir que el tiempo medio de vida útil de las baterías supere las 4 horas.
Medical researchers have developed a new artificial heart constructed primarily of titanium and plastic. The heart will last and operate almost indefinitely once it is implanted in the patient’s body, but the battery pack needs to be recharge about every 4 hours. A random sample of 50 battery packs is selected and subjected to a life test. The average life of these batteries is 4.05 hours. Assume that battery life is normally distributed with standard deviation \(\sigma=0.2\) hours
Is there evidence to support the claim that mean battery life exceeds 4 hour?
Ahora, resolvamos el mismo ejercicio desde el procedimiento de prueba de hipótesis.
Afirmación: the mean battery life exceeds 4 hour –> \(\mu>4\) –> se representa en una hipótesis alterna.
\[Ho:\mu \le 4.0\] \[Ha: \mu > 4.0\]
En este caso utilizaremos una prueba Z para una media, unilateral derecha, debido a que se conoce el valor de la desviación estándar poblacional. Utilizaremos \(\alpha=0.05\)
El valor de prueba se obtiene con:
\[Z_p=\frac{\bar{x}-\mu_0}{\frac{\sigma}{\sqrt{n}}}\]
Calculamos el valor de prueba, aprovechamos que ya en el ejercicio anterior se declararon los vaores:
Zp=(estimador-4)/(sigma/sqrt(n))
Zp
## [1] 1.767767
Ahora, como la prueba es unilateral derecha el \(Valor\_P\) se obtiene:
\[Valor\_P=Pr(Z>Z_p)\]
Valor_P=pnorm(Zp,lower.tail = F)
Valor_P
## [1] 0.03854994
Como \(Valor\_P\) 0.0385499 es menor al nivel de significancia \(\alpha=0.05\), se rechaza Ho.
Es posible afirmar que la vida media útil de las baterías excede las 4 horas.
Here’s a new idea for treating advanced melanoma, the most serious kind of skin cancer. Genetically engineer white lood cells to better recognize and destroy cancer cells, then infuse these cells into patients. The subjects in a small initial study were 11 patients whose melanoma had not responded to existing treatments. One question was how rapidly the new ells would multiply after infusion, as measured by the doubling time in days. Here are the doubling times:
1.4 1.0 1.3 1.0 1.3 2.0 0.6 0.8 0.7 0.9 1.9
Give a 90% confidence interval for the mean doubling time. Are you willing to use this interval to make an inference about the mean doubling time in a population of similar patients?
Debemos calcular el intervalo de confianza para el parámetro media, utilizando:
\[IC((1-\alpha)\%,\mu)=[\bar{x} \mp tS_\bar{x}]\] Para ello, primero calculamos, el promedio (\(\bar{x}\)), la desviación estándar (\(S\)) de los datos y establecemos el valor de \(t\) con \(v=n-1\) grados de libertad.
#Ingreso de datos
tiempo=c(1.4, 1.0, 1.3, 1.0, 1.3, 2.0, 0.6, 0.8, 0.7, 0.9, 1.9)
#Tamaño de muestra
n=length(tiempo)
n
## [1] 11
#Calcular el promedio o media muestral
estimador=mean(tiempo)
estimador
## [1] 1.172727
#Calcular la desviación estándar de los datos
desviacion=sd(tiempo)
desviacion
## [1] 0.460632
#Calcular el error estándar
ee=desviacion/sqrt(n)
ee
## [1] 0.1388858
#Establecer el valor de t
confianza=0.90
v=n-1
t_critico=qt((1-confianza)/2,v,lower.tail = T)
t_critico
## [1] -1.812461
Reemplazamos en fórmula:
LI=estimador-t_critico*ee #Límite inferior del intervalo
LS=estimador+t_critico*ee #Límite superior del intervalo
LI;LS
## [1] 1.424452
## [1] 0.9210022
En el \(90\%\) de las muestras de tamaño \(n=\) 11 el valor de la media se encuetra entre 1.4244523 y 0.9210022.
Observación: El procedimiento se puede llevar de manera más rápida mediante la instrucción:
intervalo=t.test(tiempo,conf.level = confianza)
intervalo$conf.int
## [1] 0.9210022 1.4244523
## attr(,"conf.level")
## [1] 0.9
Starting in 2008 an increasing number of people found themselves facing mortgages that were worth more than the value of their homes. A fund manager who had invested in debt obligations involving grouped mortgages was interested in determining the group most likely to default on their mortgage. He speculates that older people are less likely to default on their mortgage and thinks the average age of those who do is 55 years. To test this, a random sample of 30 who had defaulted was selected; the following sample data reflect the ages of the sampled individuals:
40 55 78 27 55 33 51 76 54 67 40 31 60 61 50 42 78 80 25 38 74 46 48 57 30 65 80 26 46 49
edad=c(40, 55, 78, 27, 55, 33, 51, 76, 54, 67,
40, 31, 60, 61, 50, 42, 78, 80, 25, 38,
74, 46, 48, 57, 30, 65, 80, 26, 46, 49)
Afirmación He speculates that older people are less likely to default on their mortgage and thinks the average age of those who do is 55 years
\(\mu = 55\) –> Esta representación en símbolos corresponde a la hipótesis nula, por lo cual, la hipótesis estadística se establece como:
\[Ho: \mu = 55\] \[Ha: \mu \ne 55\] 2. Tipo de hipótesis y nivel de significancia
En este caso se trata de una prubea bilateral o de dos colas, con un nivel de significancia de \(0.01\)
En este caso como se desconoce la varianza poblacional se realiza una prueba t, cuyo valor de prueba se calcula como:
\[t_p=\frac{\bar{x}-\mu_0}{\frac{S}{\sqrt{n}}}\] Calculamos los valores requeridos para calcular \(t_p\)
estimador=mean(edad) #Valor promedio de los datos de edad
estimador
## [1] 52.06667
mu_0=55
mu_0
## [1] 55
desviacion=sd(edad) #Valor de la desviación estándar de los datos de edad
desviacion
## [1] 17.18848
n=length(edad) #Cantidad de datos
n
## [1] 30
tp=(estimador-mu_0)/(desviacion/sqrt(n)) #calculo del valor de prueba
tp
## [1] -0.9347268
y su \(Valor\_P\), dado que la prueba se realiza a dos colas, se calcula como:
\[Valor\_P=2*P(t>|t_p|)\]
Valor_P=2*pt(abs(tp),n-1,lower.tail = F)
Valor_P
## [1] 0.3576477
El proceso anterior (odebece al proceso manual), puede realizarse de manera más eficiente con la instrucción:
hipotesis=t.test(edad,mu=mu_0,alternative = "two.sided")
tp=hipotesis$statistic
tp
## t
## -0.9347268
Valor_P=hipotesis$p.value
Valor_P
## [1] 0.3576477
Como el \(Valor\_P\) de 0.3576477 es mayor al nivel de significancia \(\alpha=0.01\), no se encuentra evidencia estadística para rechazar \(Ho\)
En el caso de requerir comparar el comportamiento de dos grupos mediante el parámetro media, es necesario identificar si los dos grupos se encuentran relacionados o si son independientes.
Relacionados: Casos de mediciones pre-post, casos donde se tome una pareja de individuos tipo esposos o hermanos gemelos y cada uno de ellos se asigne a un grupo, artículos cuyo valor se compara en dos tiendas. De alguna manera existe una relación por pares.
Independientes: De cada población que se va a comparar se toma una muestra, el interés no es una comparación entre pares, sino resultados generales entre grupos.
An article in The American Statistician (M. L. R.Ernst, et al., “Scatterplots for Unordered Pairs,” 50 (1996), pp. 260–265) Reports on the difference in the measurements by two evaluators of the cardiac output of 23 patients using Doppler echocardiography. Both observers took measurements from the same patients. The measured outcomes were as follows:
| Patient | Evaluator 1 | Evaluator 2 |
|---|---|---|
| 1 | 4.8 | 5.8 |
| 2 | 5.6 | 6.1 |
| 3 | 6.0 | 7.7 |
| 4 | 6.4 | 7.8 |
| 5 | 6.5 | 7.6 |
| 6 | 6.6 | 8.1 |
| 7 | 6.8 | 8.0 |
| 8 | 7.0 | 8.21 |
| 9 | 7.0 | 6.6 |
| 10 | 7.2 | 8.1 |
| 11 | 7.4 | 9.5 |
| 12 | 7.6 | 9.6 |
| 13 | 7.7 | 8.5 |
| 14 | 7.7 | 9.5 |
| 15 | 8.2 | 9.1 |
| 16 | 8.2 | 10.0 |
| 17 | 8.3 | 9.1 |
| 18 | 8.5 | 10.8 |
| 19 | 9.3 | 11.5 |
| 20 | 10.2 | 11.5 |
| 21 | 10.4 | 11.2 |
| 22 | 10.6 | 11.5 |
| 23 | 11.4 | 12.0 |
Este caso se considera de muestras relacionadas, debido a que son los mismos 23 pacientes evaluados por dos especialistas en cardiología.
En este caso el intervalo de confianza a construir es:
\[IC((1-\alpha\%);\mu_d)=[\bar{d} \mp t*\frac{S_d}{\sqrt{n}}]\]
Donde \(\bar{d}\) representa el promedio de las diferencias de valores por pares y \(S_d\) representa la desviación estándar de las diferencias por parejas.
Ingrasamos los datos y calculamos los valores de las diferencias entre el evaluador 1 y el evaluador 2
evaluador_1=c(4.8, 5.6, 6.0, 6.4, 6.5, 6.6, 6.8, 7.0, 7.0, 7.2, 7.4, 7.6, 7.7, 7.7, 8.2, 8.2, 8.3, 8.5, 9.3, 10.2, 10.4, 10.6, 11.4) #datos del evaluador 1
evaluador_2=c(5.8, 6.1, 7.7, 7.8, 7.6, 8.1, 8.0, 8.21, 6.6, 8.1, 9.5, 9.6, 8.5, 9.5, 9.1, 10.0, 9.1, 10.8, 11.5, 11.5, 11.2, 11.5, 12.0) #datos del evaluador 2
di=evaluador_1-evaluador_2 #diferencias entre el evaluador 1 y el evaluador 2
di
## [1] -1.00 -0.50 -1.70 -1.40 -1.10 -1.50 -1.20 -1.21 0.40 -0.90 -2.10 -2.00
## [13] -0.80 -1.80 -0.90 -1.80 -0.80 -2.30 -2.20 -1.30 -0.80 -0.90 -0.60
Calculamos los valores necesario para construir el intervalo de confianza:
estimador=mean(di) #Promedio de las diferencias
estimador
## [1] -1.235217
desviacion=sd(di) # desviación estándar de las diferencias
desviacion
## [1] 0.6378791
n=length(di) #Cantidad de parejas
n
## [1] 23
tc=qt(0.02,n-1,lower.tail = F) #Valor crítico de la distribución t para n-1 grados de libertad y 98% de confianza
tc
## [1] 2.182893
Construimos el intervalo de confianza
LI=estimador-tc*desviacion/sqrt(n)
LS=estimador+tc*desviacion/sqrt(n)
LI;LS
## [1] -1.525557
## [1] -0.9448774
Realizamos la lectura del resultado: Con un 98% de confianza la diferencia entre las lecturas del evaluador 1 conrespecto al evaluador 2 se encuentra entre -1.5255574 y -0.9448774.
Como podemos observar ambos límites son menores a cero, lo que indica que al realizar las restas el valor del sustraendo es mayor que el valor del minuendo. En este caso, los valores que asigno el evaluador dos son menores a los valores asignados por el evaluador 1.
Observación Este procedimiento se puede llevar a cabo de una manera más eficiente con la instrucción:
intervalo=t.test(evaluador_1,evaluador_2,paired = T,conf.level = 0.98)
intervalo$conf.int
## [1] -1.5688421 -0.9015927
## attr(,"conf.level")
## [1] 0.98
Conduct a hypothesis test to determine if the average cardiac outputs measured by the two evaluators differ. Use a significance level of 0.02.
Afirmación: the average cardiac outputs measured by the two evaluators differ –> \(\mu_1 \ne \mu_2\) –> Esta representa una hipótesis alterna.
\[Ho: \mu_1-\mu_2 = 0\] \[Ha: \mu_1-\mu_2 \ne 0\] 2. Tipo de hipótesis y nivel de significancia:
En este caso utilizaremos una prueba t de muestras emparejadas con un nivel de significancia de 0.02.
El valor de prueba se calcula como: \[t_p=\frac{\bar{d}-\mu_0}{\frac{S_d}{\sqrt{n}}}\]
tp=(estimador-0)/(desviacion/sqrt(n))
tp
## [1] -9.286861
Como la prueba es a dos colas (bilateral) calculamos el \(Valor\_P\) con:
\[Valor\_P=2*P(t>|t_p|)\]
Valor_P=2*pt(abs(tp),n-1,lower.tail = F)
Valor_P
## [1] 4.557754e-09
En este caso el \(Valor\_P\) de 4.5577538^{-9} es menor que el valor de significancia \(\alpha=0.02\), por lo tanto, hay evidencia estadística para rechazar Ho.
Observación Este procedimiento se puede llevar a cabo de una manera más eficiente con la instrucción:
hipotesis=t.test(evaluador_1,evaluador_2,mu=0, alternative = "two.sided",paired = T)
tp=hipotesis$statistic
tp
## t
## -9.286861
Valor_P=hipotesis$p.value
Valor_P
## [1] 4.557754e-09
Two machines are used for filling plastic bottles with a net volume of 16.0 ounces. The fill volume can be assumed normal, with standard deviation \(\sigma_1=0.020\) and \(\sigma_2=0.025\) ounces. A member of the quality engineering staff suspects that both machines fill to the same mean net volume, whether or not this volume is 16.0 ounces. A random sample of 10 bottles is taken from the output of each machine.
| Machine_1 | Machine 2 |
|---|---|
| 16.03 | 16.02 |
| 16.01 | 16.03 |
| 16.04 | 15.97 |
| 15.96 | 16.04 |
| 16.05 | 15.96 |
| 15.98 | 16.02 |
| 16.05 | 16.01 |
| 16.02 | 16.01 |
| 16.02 | 15.99 |
| 15.99 | 16.00 |
Do you think the engineer is correct?
En este caso para construir el intervalo de confianza se utiliza la estructura:
\[IC((1-\alpha)\%;\mu_1-\mu_2)=[(\bar{x}_1-\bar{x}_2) \mp Z*\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}]\]
Ingreso de datos
machine_1=c(16.03,16.01,16.04,15.96,16.05,15.98,16.05,16.02,16.02,15.99)
machine_2=c(16.02,16.03,15.97,16.04,15.96,16.02,16.01,16.01,15.99,16.00)
Cálculo de los valores para el intervalo de confianza
promedio_1=mean(machine_1) #promedio de los datos de la máquina 1
promedio_2=mean(machine_2) #Promedio de los datos de la máquina 2
estimador=promedio_1-promedio_2
estimador
## [1] 0.01
zc=qnorm(0.025,lower.tail = F) #Valor crítico de la distribución normal, para un 95% de confianza
zc
## [1] 1.959964
Construcción del intervalo de confianza
LI=estimador-zc*sqrt(0.020^2/10+0.025^2/10)
LS=estimador+zc*sqrt(0.020^2/10+0.025^2/10)
LI;LS
## [1] -0.009843123
## [1] 0.02984312
Con un \(95\%\) de confianza el valor real de la diferencia de medias entre la máquina 1 y la máquina 2 se encuentra entre -0.0098431 y 0.0298431
Como el valor \(0\) se encuentra contenido en el intervalo de confianza, la afirmación del ingeniero puede considerarse correcta, es decir, las dos máquinas tiene el mismo volumen de llenado promedio.
Two machines are used for filling plastic bottles with a net volume of 16.0 ounces. The fill volume can be assumed normal, with standard deviation \(\sigma_1=0.020\) and \(\sigma_2=0.025\) ounces. A member of the quality engineering staff suspects that both machines fill to the same mean net volume, whether or not this volume is 16.0 ounces. A random sample of 10 bottles is taken from the output of each machine.
| Machine_1 | Machine 2 |
|---|---|
| 16.03 | 16.02 |
| 16.01 | 16.03 |
| 16.04 | 15.97 |
| 15.96 | 16.04 |
| 16.05 | 15.96 |
| 15.98 | 16.02 |
| 16.05 | 16.01 |
| 16.02 | 16.01 |
| 16.02 | 15.99 |
| 15.99 | 16.00 |
Do you think the engineer is correct?
Resolveremos el mismo ejercicio anterior pero ahora desde la implementación de una prueba de hipótesis.
Afirmación: both machines fill to the same mean net volume –> \(\mu_1-\mu_2=0\) –> representa una hipótesis nula.
\[Ho:\mu_1-\mu_2=0\] \[Ha:\mu_1-\mu_2 \ne 0\]
En este caso se lleva a cabo una prueba Z, bilateral, de diferencia de medias a un nivel de significancia de 0.05
El valor de prueba se calcula como: \[Z_P=\frac{(\bar{x}_1-\bar{x}_2)-(\mu_1-\mu_2)_0}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}\]
Zp=(estimador)/(sqrt(0.020^2/10+0.025^2/10))
Zp
## [1] 0.9877296
Para el cálculo del \(Valor\_P\) se tiene en cuenta que la prueba es bilateral y se utiliza:
\[Valor\_P=2Pr(Z>|Z_p|)\] En este caso,
Valor_P=2*pnorm(Zp,lower.tail = F)
Valor_P
## [1] 0.3232851
Como el \(Valor\_P\) es 0.3232851 mayor que el nivel de significancia \(\alpha=0.05\), no hay evidencia estadística para rechazar \(Ho\)
Farmers know that driving heavy equipment on wet soil compresses the soil and injures future crops. Here are data on the “penetrability” of the same type of soil at two levels of compression. Penetrability is a measure of how much resistance plant roots will meet when they try to grow through the soil.
| Compressed Soil | Intermediate Soil |
|---|---|
| 2.86 2.68 2.92 2.82 2.76 2.81 2.78 3.08 2.94 2.86 | 3.14 3.38 3.10 3.40 3.38 3.14 3.18 3.26 2.96 3.02 |
| 3.08 2.82 2.78 2.98 3.00 2.78 2.96 2.90 3.18 3.16 | 3.54 3.36 3.18 3.12 3.86 2.92 3.46 3.44 3.62 4.26 |
We suspect that the penetrability of compressed soil is less than that of intermediate soil. Do the data (with the outlier removed) support this suspicion?
Antes de construir el intervalo de confianza, observemos que en la pregunta se aclara que debe ser removido un dato atípico. Esto indica que primero debemos descubrir cuál es.
Compressed=c(2.86, 2.68, 2.92, 2.82, 2.76, 2.81, 2.78, 3.08, 2.94, 2.86,
3.08, 2.82, 2.78, 2.98, 3.00, 2.78, 2.96, 2.90, 3.18, 3.16)
Intermediate=c(3.14, 3.38, 3.10, 3.40, 3.38, 3.14, 3.18, 3.26, 2.96, 3.02,
3.54, 3.36, 3.18, 3.12, 3.86, 2.92, 3.46, 3.44, 3.62, 4.26)
boxplot(Compressed,Intermediate,col=c("orange","green"),main="Penetrabilidad de los suelos", names=c("Comprimido","Intermedio"))
Según el gráfico, el dato atípico se encuentra en el grupo “Intermedio” y corresponde al valor 4.26. Construimos un nuevo vector de valores del grupo Intermediate eliminado el de la posición 20 (lugar en el cual se encuentra el valor 4.26)
Intermediate_Mod=Intermediate[-20]
Intermediate_Mod
## [1] 3.14 3.38 3.10 3.40 3.38 3.14 3.18 3.26 2.96 3.02 3.54 3.36 3.18 3.12 3.86
## [16] 2.92 3.46 3.44 3.62
Ahora si, comenzaremos la construcción del intervalo de confianza para la diferencia de medias, en este caso con solo información de la muestra, por lo cual vamos a utilizar la siguiente estructura, asumiendo que las varianza poblacionales son iguales (más adelante mostraremos como comprobar este supuesto):
\[IC((1-\alpha)\%;\mu_1-\mu_2)=[(\bar{x}_1-\bar{x}_2) \mp t \sqrt{S_P^2(\frac{1}{n_1}+\frac{1}{n_2})}]\] Donde \(S_p^2\) se obtiene mediante:
\[S_p^2=\frac{(n_1-1)S^2_1+(n_2-1)S^2_2}{n_1+n_2-2}\] Así, calculamos los valores necesarios para construir el intervalo de confianza:
promedio_Comprimido=mean(Compressed) #Promedio de los datos de Compressed
promedio_Comprimido
## [1] 2.9075
promedio_Intermediate=mean(Intermediate_Mod) #Promedio de los datos de Intermrediate sin valor atípico
promedio_Intermediate
## [1] 3.287368
n1=length(Compressed) #Tamaño de muestra para Compressed
n1
## [1] 20
n2=length(Intermediate_Mod) #Tamaño de muestra para Intermediate sin dato atípico
n2
## [1] 19
desviacion_compressed=sd(Compressed) #Desviación estándar de Compressed
desviacion_compressed
## [1] 0.1389765
desviacion_Intermediate=sd(Intermediate_Mod) #Desviación estándar de Intermediate sin dato atípico
desviacion_Intermediate
## [1] 0.2397416
s2p=((n1-1)*desviacion_compressed^2+(n2-1)*desviacion_Intermediate^2)/(n1+n2-2)
s2p
## [1] 0.03787955
Con estos elementos podemos comenzar a construir el intervalo de confianza
estimador=promedio_Comprimido-promedio_Intermediate #Estimador
estimador
## [1] -0.3798684
tc=qt(0.025,n1+n2-2,lower.tail = F) #Valor crítico t con v=n1+n2-2 grados de libertad y 95% de confianza
tc
## [1] 2.026192
error_Estandar=sqrt(s2p*(1/n1+1/n2))
error_Estandar
## [1] 0.06235093
Así el intervalo de \(95\%\) de confianza finalmente queda:
LI=estimador-tc*error_Estandar
LS=estimador+tc*error_Estandar
LI;LS
## [1] -0.5062034
## [1] -0.2535334
Con un \(95\%\) de confianza la diferencia de medias real se encuentra entre los valores -0.5062034 y -0.2535334.
En este caso ambos extremos de los intervalos son negativos, lo cual implica que el valor de la media de la penetrabilidad en suelo intermedio es mayor que la media de penetrabilidad en suelo comprimido. Así que, la sospecha parace ser cierta.
Observación Este proceso puede reducirse mediante la instrucción:
intervalo=t.test(Compressed,Intermediate_Mod,conf.level = 0.95,var.equal = T)
intervalo$conf.int
## [1] -0.5062034 -0.2535334
## attr(,"conf.level")
## [1] 0.95
Realizaremos el mismo ejercicio anterior, ahora desde la perspectiva de una prueba de hipótesis
Afirmación: the penetrability of compressed soil is less than that of intermediate soil –> \(\mu_{com}<\mu_{int}\) –> se traduce a una hipótesis alterna.
\[Ho: \mu_{com}-\mu_{int} \ge 0\] \[Ha: \mu_{com}-\mu_{int} < 0 \] 2. Tipo de prueba de hipótesis y nivel de significancia
En este caso la prueba se considera una unilaterar izquierda, relizaremos la prueba t para comparación de medias con varianzas iguales (en algunos libros se le denomina prueba t con varianza ponderada).
El valor de prueba se calcula como:
\[t_p=\frac{(\bar{x}_1-\bar{x}_2)-(\mu_1-\mu_2)_0}{\sqrt{S_p^2(\frac{1}{n_1}+\frac{1}{n_2})}}\]
Utilizaremos los valores que se obtuvieron en el Ejemplo 9
tp=(estimador-0)/error_Estandar
tp
## [1] -6.092426
En este caso, como la prueba corresponde a una unilateral izquierda, el \(Valor\_P\) se obtiene:
\[Valor\_P=Pr(t<t_p)\]
Valor_P=pt(tp,n1+n2-2,lower.tail = T)
Valor_P
## [1] 2.353577e-07
Como el \(Valor\_P\) de 2.3535768^{-7} es menor que el nivel de significancia \(\alpha=0.05\), se rechaza Ho.
Al rechazar Ho, podemos suponer que hay evidencia estadística para suponer que la media de penetración en el suelo comprimido es menor que la media de penetración en el suelo intermedio.
Observación Se puede realizar de manera más corta el ejercicio utilizando la instrucción:
hipotesis=t.test(Compressed,Intermediate_Mod,mu=0,alternative = "less",var.equal = T)
tp=hipotesis$statistic
tp
## t
## -6.092426
Valor_P=hipotesis$p.value
Valor_P
## [1] 2.353577e-07
How does Brett Favre, quarterback for the Green Bay Packers, compare to Peyton Manning, quarterback for the Indianapolis Colts? The table below shows the number of completed passes for each athlete during the 2006 NFL football season:
| Brett Favre | Peyton Manning |
|---|---|
| 15 17 22 | 25 32 25 |
| 31 28 20 | 26 30 29 |
| 25 24 26 | 14 27 21 |
| 22 5 21 | 21 20 22 |
| 22 22 19 | 20 14 25 |
| 24 | 21 |
Does the data indicate that there is a difference in the average number of completed passes for the two quarterback?
En este caso para construir el intervalo de confianza seguimos la estructura:
\[IC((1-\alpha)\%;\mu_1-\mu_2)=[(\bar{x}_1-\bar{x}_2) \mp t*\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}]\] Donde \(t\) corresponde al valor crítico de la distribución t con \(v\) grado de libertad:
\[v=\frac{(\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2})^2}{\frac{(\frac{s_1^2}{n_1})^2}{n_1-1}+\frac{(\frac{s_2^2}{n_2})^2}{n_2-2}}\]
Vamos a calcular los elementos necesarios para la construcción del intervalo de confianza
Brett=c(15, 17, 22, 31, 28, 20, 25, 24, 26, 22, 5, 21, 22, 22, 19, 24)
Peyton=c(25, 32, 25, 26, 30, 29, 14, 27, 21, 21, 20, 22, 20, 14, 25, 21)
n_B=length(Brett)
n_B #Cantidad de datos en la muestra de Brett
## [1] 16
n_P=length(Peyton)
n_P #Cantidad de datos en la muestra de Peyton
## [1] 16
x_B=mean(Brett) #Media para los datos de Brett
x_B
## [1] 21.4375
x_P=mean(Peyton) #Media para los datos de Peyton
x_P
## [1] 23.25
s_B=sd(Brett) #Desviación estándar de los datos de Brett
s_B
## [1] 5.898799
s_P=sd(Peyton) #Desviación estándar de los datos de Peyton
s_P
## [1] 5.131601
Grados de libertad y valor crítico
A=s_B^2/n_B
A
## [1] 2.17474
B=s_P^2/n_P
B
## [1] 1.645833
v=(A+B)^2/(A^2/(n_B-1)+B^2/(n_P-1)) #Grados de libertad
v
## [1] 29.43587
tc=qt(0.025,v,lower.tail = F) #valor crítico de t con v grados de libertad y 95% de confianza
tc
## [1] 2.043915
Construcción del intervalo de confianza
estimador=x_B-x_P
estimador
## [1] -1.8125
error_estandar=sqrt(s_B^2/n_B+s_P^2/n_P)
error_estandar
## [1] 1.954629
LI=estimador-tc*error_estandar
LS=estimador+tc*error_estandar
LI;LS
## [1] -5.807595
## [1] 2.182595
Con un \(95\%\) de confianza la diferencia entre la cantidad media de pases de Brett y la cantidad media de pases de Peyton se encuentra entre -5.8075946 y 2.1825946.
Como el valor cero se encuentra en el intervalo, se considera que ambos hacen la misma cantidad media de pases.
Observación: Este procedimiento se puede acortar con la instrucción:
intervalo=t.test(Brett,Peyton,conf.level = 0.95, var.equal = F)
intervalo$conf.int
## [1] -5.807595 2.182595
## attr(,"conf.level")
## [1] 0.95
Utilizaremos los datos del Ejemplo 11 para llevar a cabo un procedimiento de prueba de hipótesis.
Afirmación: the data indicate that there is a difference in the average number of completed passes for the two quarterback –> \[\mu_B \ne \mu_P\] –> Representa una hipótesis alterna
\[Ho:\mu_B - \mu_P = 0\] \[Ha: \mu_B - \mu_P \ne 0\] 2. Tipo de prueba de hipótesis y nivel de significancia
En este caso es una prueba bilateral de comparación de medias, en este caso dado que no se pueden suponer iguales se utiliza la t de Welch con un nivel de significancia de \(\alpha=0.05\)
El valor de prueba se obtiene a partir de:
\[t_p=\frac{(\bar{x}_1-\bar{x}_2)-(\mu_1-\mu_2)_0}{\sqrt{\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}}}\]
tp=(x_B-x_P)/sqrt((s_B^2/n_B)+(s_P^2/n_P))
tp
## [1] -0.9272861
En este caso por ser una pruba bilateral, el \(Valor\_P\) se calcula mediante:
\[Valor\_P=2*Pr(t>|t_p|)\]
Valor_P=2*pt(abs(tp),v,lower.tail = F)
Valor_P
## [1] 0.3613193
Como \(Valor\_P\) de 0.3613193 es mayor al nivel de significancia \(\alpha=0.05\), no se rechaza Ho.
Observación: Este procedimiento se puede simplicar mediante el uso de la instrucción:
hipotesis=t.test(Brett,Peyton,mu=0, alternative = "two.sided",var.equal = F)
tp=hipotesis$statistic
tp
## t
## -0.9272861
Valor_P=hipotesis$p.value
Valor_P
## [1] 0.3613193
A manufacturer of electronic calculators is interested in estimating the fraction of defective units produced. A random sample of 800 calculators contains 10 defectives. Determine if the fraction defective exceeds 0.01
\[IC((1-\alpha)\%;\pi)=[p \pm Z*\sqrt{\frac{p(1-p)}{n}}]\]
Declaramos los valores y calculamos los necesarios para construir el intervalo de confianza:
n=800 #Cantidad de calculadoras
x=10 #Cantidad de calcualdoras defectuosas
p=x/n #Proporción estimada de calculadoras defectuosas
p
## [1] 0.0125
Zp=qnorm(0.05,lower.tail = F) #Cálculo del valor crítico de la distribución normal
Zp
## [1] 1.644854
Observación: En este caso el valor crítico corresponde a una probabilidad de \(0.05\), debido a que sólo calcularemos el valor mínimo de proporción de calculadoras defectuosas.
Cálculo del extremo inferior del intervalo de confianza:
LI=p-Zp*sqrt(p*(1-p)/n)
LI
## [1] 0.00603891
Con un \(95\%\) de confianza no se puede suponer que la proporción de calculadoras defectuosas es mayor a 0.01.
A manufacturer of electronic calculators is interested in estimating the fraction of defective units produced. A random sample of 800 calculators contains 10 defectives. Determine if the fraction defective exceeds 0.01
Resolvamos el ejemplo anterior con un procedimiento de prueba de hipótesis.
Afirmación: the fraction defective exceeds 0.01 –> \(\pi>0.01\) –> representa una hipótesis alterna.
\[Ho: \pi \le 0.01\] \[Ha: \pi > 0.01 \] 2. Tipo de prueba de hipótesis y nivel de significancia
En este caso utilizamos un prueba Z para proporción, unilateral derecha, con un nivel de significancia de \(\alpha=0.05\)
El valor de prueba para este caso se obtiene mediante:
\[Z_p=\frac{p-\pi_0}{\sqrt{\frac{\pi_0(1-\pi_0)}{n}}}\]
Dado que en el ejercicio anterior declaramos los valores, calcularemos el valor crítico haciendo uso de ellos:
Zp=(p-0.01)/sqrt(0.01*0.99/n)
Zp
## [1] 0.7106691
Dado que es una prueba unilateral derecha, para el \(Valor\_P\) utilizamos la siguiente fórmula,
\[Valor\_P=Pr(Z > Zp)\]
Valor_P=pnorm(Zp,lower.tail = F)
Valor_P
## [1] 0.2386447
Como \(Valor\_P\) de 0.2386447 es mayor al nivel de significancia \(\alpha=0.05\), no hay evidencia estadística para rechazar Ho.
No se puede afirmar que la proporción de calculadoras defectuosas exceda a \(0.01\)
Observación: R cuenta con una instrucción para construcción de intervalo de confianza e implementación de prueba de hipótesis sobre el parámetro proporción de manera más rápida. Sin emabargo, esta construida bajo la distribución chi-cuacrdado, por lo cual se pueden presentar algunas diferencias en los valores de resultado, pero no en las conclusiones finales.
Para la construcción del intervalo de confianza:
proporcion=prop.test(x,n,0.01,conf.level = 0.95,alternative = "greater")
proporcion$conf.int
## [1] 0.007019735 1.000000000
## attr(,"conf.level")
## [1] 0.95
proporcion$p.value
## [1] 0.2970162
Two different types of injection-molding machines are used to form plastic parts. A part is considered defective if it has excessive shrinkage or is discolored. Two random samples, each of size 300, are selected, and 15 defective parts are found in the sample from machine 1 whereas 8 defective parts are found in the sample from machine 2. Is it reasonable to conclude that both machines produce the same fraction of defective parts?
\[IC((1-\alpha)\%;\pi_1-\pi_2)=[(p_1-p_2) \pm Z*\sqrt{\frac{p_1(1-p_1)}{n_1}+\frac{p_2(1-p_2)}{n_2}}]\]
Declaración de valores:
n1=300 #Cantidad de moldes seleccionados de la máquina I
x1=15 #Cantidad de moldes defectuosos en la muestra de la máquina I
n2=300 #cantidad de moldes seleccionados de la máquina II
x2=8 #Cantidad de moldes defectuosos en la muestra de la máquina II
p1=x1/n1 #Proporción estimada de defectuosos de la máquina I
p1
## [1] 0.05
p2=x2/n2 #Proporción estimada de defectuosos de la máquina II
p2
## [1] 0.02666667
Zc=qnorm(0.025,lower.tail = T) #Valor crítico de distribución normal para IC de 95% de confianza
Zc
## [1] -1.959964
Construcción del intervalo de confianza
estimador=p1-p2
estimador
## [1] 0.02333333
error_estandar=sqrt((p1*(1-p1))/n1+(p2*(1-p2))/n2)
error_estandar
## [1] 0.01564774
LI=estimador-Z*error_estandar
LS=estimador+Z*error_estandar
LI;LS
## [1] -0.002404913
## [1] 0.04907158
Con un \(95\%\) de confianza se puede concluir que la diferencia entre las proporciones de moldes defectuosos de la máquina I y máquina II está entre -0.0024049 y 0.0490716.
Como el cero se encuentra dentro del intervalo de confianza, se puede suponer que ambas máquinas producen la misma proporción de moldes defectuosos.
Two different types of injection-molding machines are used to form plastic parts. A part is considered defective if it has excessive shrinkage or is discolored. Two random samples, each of size 300, are selected, and 15 defective parts are found in the sample from machine 1 whereas 8 defective parts are found in the sample from machine 2. Is it reasonable to conclude that both machines produce the same fraction of defective parts?
Ahora, desarrollaremos el ejercicio anterior desde la realización de una prueba de hipótesis.
Afirmación: both machines produce the same fraction of defective parts. –> \(\pi_I=\pi_{II}\) –> lo que se representa en una hipótesis nula.
\[Ho: \pi_I-\pi_{II}=0\] \[Ho: \pi_I-\pi_{II} \ne 0\]
En este caso se utiliza una prueba Z para diferencia de proporciones, bilateral, a un nivel de significancia \(\alpha=0.05\)
En este caso el valor de prueba se obtiene mediante:
\[Z_p=\frac{(p_1-p_2)-(\pi_1-\pi_2)_0}{\sqrt{\bar{p}(1-\bar{p})(1/n_1+1/n_2)}}\]
p_ponderada=(x1+x2)/(n1+n2) #Como en la Ho se asumen iguales, se cálcula una proporción general.
p_ponderada
## [1] 0.03833333
Z_p=estimador/sqrt(p_ponderada*(1-p_ponderada)*(1/n1+1/n2))
Z_p
## [1] 1.488407
Para el cálculo del \(Valor\_P\) utilizamos:
\[Valor\_P=2*Pr(Z > |Z_p|)\]
Valor_P=2*pnorm(abs(Z_p),lower.tail = F)
Valor_P
## [1] 0.1366435
Como \(Valor\_P\) de 0.1366435 es mayor al nivel de significancia \(\alpha=0.05\), no se rechaza Ho.
La proporción de defectuosos es la misma para ambas máquinas.
A rivet is to be inserted into a hole. If the standard deviation of hole diameter exceeds 0.02 mm, there is an unacceptably high probability that the rivet will not fit. A random sample of \(n = 15\) parts is selected, and the hole diameter is measured. The sample standard deviation of the hole diameter measurements is \(s = 0.016\) mm.
Is there strong evidence to indicate that the standard deviation of hole diameter exceeds 0.02 mm?
\[IC((1-\alpha)\%;\sigma^2)=[\frac{(n-1)S^2}{\chi^2_{\alpha/2,v}};\frac{(n-1)S^2}{\chi^2_{1-\alpha/2,v}}]\]
Declaramos los valores y calculamos lo necesario para el cálculo del extremo inferior del intervalo de confianza (esto porque se quiere mirar si la desviación estándar excede a 0.02).
n=15
s=0.016
chi_B=qchisq(0.05,v,lower.tail = F) #Valor crítico para calcular el extremo inferior del intervalo
chi_B
## [1] 43.08745
LI=v*s^2/chi_B
LI
## [1] 0.0001748904
sqrt(LI)
## [1] 0.01322462
Con un \(95\%\) de confianza el valor de la desviación estándar no es menor a 0.013. Por cual, no hay razón para creer que excede a 0.02.
A rivet is to be inserted into a hole. If the standard deviation of hole diameter exceeds 0.02 mm, there is an unacceptably high probability that the rivet will not fit. A random sample of \(n = 15\) parts is selected, and the hole diameter is measured. The sample standard deviation of the hole diameter measurements is \(s = 0.016\) mm.
Resolveremos el ejercicio anterior con procedimiento de prueba de hipótesis.
Afirmación: the standard deviation of hole diameter exceeds 0.02 mm –> \(\sigma > 0.02\) –> Se relaciona e una hipótesis alterna.
\[Ho: \sigma \le 0.02\] \[Ha: \sigma > 0.02\]
En este caso se realiza una prueba chi_cuadrado para una varianza, unilateral derecha, con un nivel de signficancia (\(\alpha=0.05\))
El valor de prueba se calcula con:
\[\chi^2_p=\frac{(n-1)S^2}{\sigma^2_0}\]
X2_p=v*s^2/0.02^2
X2_p
## [1] 18.83896
Como es una prueba unilateral derecha, para el cálculo del \(Valor\_P\) utilizamos
\[Valor\_P=Pr(\chi^2>\chi^2_p)\]
Valor_P=pchisq(X2_p,v,lower.tail = F)
Valor_P
## [1] 0.9336789
Como \(Valor\_P\) de 0.9336789 es mayor al nivel de significancia \(\alpha=0.05\), no se rechaza Ho.
No es posible afirmar que la desviación estándar no excede a 0.02 mm
Eleven resilient modulus observations of a ceramic mixture of type A are measured and found to have a sample average of 18.42 psi and sample standard deviation of 2.77 psi. Ten resilient modulus observations of a ceramic mixture of type B are measured and found to have a sample average of 19.28 psi and sample standard deviation of 2.41 psi. Is there sufficient evidence to support the investigator’s claim that type A ceramic has larger variability than type B?
En este caso nuestro parámetro de interés es el cociente entre varianzas, en este caso el criterio de comparación es el valor 1, dado que es el valor del módulo de la división.
Así si en el IC se encuentra el valor 1, se considera que las varianzas poblacionales son iguales. Si los valores de los extremos del IC son ambos inferiores al valor 1, se considera que la población cuya varianza ubicamos en el numerador (dividiendo) tiene menor varianza que aquella que ubicamos en el denominador (divisor). Si los extremos del IC son ambos mayores a 1, entonces la población cuya varianza colocamos en el numerador es mayor que la de la población cuya varianza colocamos en el denominador.
El intervalo de confianza se construye con:
\[IC((1-\alpha)\%; \sigma^2_1/\sigma^2_2)=[(S_1^2/S_2^2)\frac{1}{f_{\alpha/2,v_1,v_2}};(S_1^2/S_2^2)\frac{1}{f_{1-\alpha/2,v_1,v_2}}]\]
Declaramos los valores y calulamos lo necesario para construir el intervalo de confianza
n1=11
s1=2.77
n2=10
s2=2.41
fA=qf(0.025,n1-1,n2-2,lower.tail = F) #Valor crítico para el extremo inferior para una confianza de 95%
fA
## [1] 4.295127
fB=qf(0.025,n1-1,n2-2,lower.tail = T) #Valor crítico para el extremo superior para una confianza de 95%
fB
## [1] 0.2594107
Construimos el intervalo de confianza
LI=s1^2/s2^2*(1/fA)
LS=s1^2/s2^2*(1/fB)
LI;LS
## [1] 0.3075739
## [1] 5.092576
Con un \(95\%\) de confianza el valor del cociente entre las varianzas poblacionales se encuentra entre 0.3075739 y 5.0925763.
Como el uno se encuentra dentro del intervalo se puede considerar que ambas poblaciones tienen la misma varianza.
Eleven resilient modulus observations of a ceramic mixture of type A are measured and found to have a sample average of 18.42 psi and sample standard deviation of 2.77 psi. Ten resilient modulus observations of a ceramic mixture of type B are measured and found to have a sample average of 19.28 psi and sample standard deviation of 2.41 psi. Is there sufficient evidence to support the investigator’s claim that type A ceramic has larger variability than type B?
Ahora, resolveremos el ejercicio desde la prueba de hipótesis
Afirmación: There is sufficient evidence to support the investigator’s claim that type A ceramic has larger variability than type B –> \(\sigma_A>\sigma_B\) –> se representa en una hipótesis alterna
\[Ho: \frac{\sigma^2_A}{\sigma^2_B} \le 1\] \[Ha: \frac{\sigma^2_A}{\sigma^2_B} > 1\]
En este caso llevaremos a cabo una prueba F de comparación de varianzas, unilateral derecha, con un nivel de significancia de \(\alpha=0.05\)
El valor de prueba se obtiene como:
\[F_p=\frac{S^2_A}{S^2_B}\]
F_p=s1^2/s2^2
F_p
## [1] 1.321069
En este caso, como la prueba es unilateral derecha, el \[Valor\_P\] se calcula con:
\[Valor\_P=Pr(F>F_p)\]
Así,
Valor_P=pf(F_p,n1-1,n2-1,lower.tail = F)
Valor_P
## [1] 0.3430381
En este caso el \(Valor\_P\) de 0.3430381 es mayor al nivel de significancia \(\alpha=0.05\), por lo tanto no se rechaza Ho.
No es posible asumir que la mezcla de ceramica de tipo A tiene mayor variabilicas que la de tipo B.
Tomado de: Montgomery, D. C., Runger, G. C., & Hubele, N. F. (2009). Engineering statistics. John Wiley & Sons.↩︎
Tomado de: Montgomery, D. C., Runger, G. C., & Hubele, N. F. (2009). Engineering statistics. John Wiley & Sons.↩︎
Tomado de: Moore, D. S., & Kirkland, S. (2010). The basic practice of statistics (Vol. 5). New York: WH Freeman↩︎
Tomado de: Groebner, D. F., Shannon, P. W., & Fry, P. C. (2018). Business statistics: A decision-making approach. Pearson.↩︎
Tomado de: Groebner, D. F., Shannon, P. W., & Fry, P. C. (2018). Business statistics: A decision-making approach. Pearson.↩︎
Tomado de: Groebner, D. F., Shannon, P. W., & Fry, P. C. (2018). Business statistics: A decision-making approach. Pearson.↩︎
Tomado de: Montgomery, D. C., Runger, G. C., & Hubele, N. F. (2009). Engineering statistics. John Wiley & Sons.↩︎
Tomado de: Moore, D. S., & Kirkland, S. (2010). The basic practice of statistics (Vol. 5). New York: WH Freeman↩︎
Tomado de: Moore, D. S., & Kirkland, S. (2010). The basic practice of statistics (Vol. 5). New York: WH Freeman↩︎
Tomado de: Mendenhall, W., Beaver, R. J., & Beaver, B. M. (2012). Introduction to probability and statistics. Cengage Learning.↩︎
Tomado de: Mendenhall, W., Beaver, R. J., & Beaver, B. M. (2012). Introduction to probability and statistics. Cengage Learning.↩︎
Tomado de: Montgomery, D. C., Runger, G. C., & Hubele, N. F. (2009). Engineering statistics. John Wiley & Sons.↩︎
Tomado de: Montgomery, D. C., Runger, G. C., & Hubele, N. F. (2009). Engineering statistics. John Wiley & Sons.↩︎
Tomado de: Montgomery, D. C., Runger, G. C., & Hubele, N. F. (2009). Engineering statistics. John Wiley & Sons.↩︎
Tomado de: Montgomery, D. C., Runger, G. C., & Hubele, N. F. (2009). Engineering statistics. John Wiley & Sons.↩︎
Tomado de: Montgomery, D. C., Runger, G. C., & Hubele, N. F. (2009). Engineering statistics. John Wiley & Sons.↩︎
Tomado de: Montgomery, D. C., Runger, G. C., & Hubele, N. F. (2009). Engineering statistics. John Wiley & Sons.↩︎
Tomado de: Montgomery, D. C., Runger, G. C., & Hubele, N. F. (2009). Engineering statistics. John Wiley & Sons.↩︎