Situación inicial
La fuerza de la tensión de adhesión del mortero de cemento portland es una característica importante del producto. Un ingeniero está interesado en comparar la fuerza de una formulación modificada en la que se han agregado emulsiones de látex de polímeros durante el mezclado, con la fuerza del mortero sin modificar. El experimentador ha reunido 10 observaciones de la fuerza de la formulación modificada y otras 10 observaciones de la formulación sin modificar. Como se observa en la siguiente tabla:
Corrida | Mortero_modificado | Mortero_ sin_modificar |
---|---|---|
1 | 16.85 | 17.50 |
2 | 16.40 | 17.63 |
3 | 17.21 | 18.25 |
4 | 16.35 | 18.00 |
5 | 16.52 | 17.86 |
6 | 17.04 | 17.75 |
7 | 16.96 | 18.22 |
8 | 17.15 | 17.90 |
9 | 16.59 | 17.96 |
10 | 16.57 | 18.15 |
La primera noción para establecer si existen diferencias entre el mortero modificado y el mortero sin modificar es recurrir a los promedios, esto es, la tensión de adhesión promedio del mortero que contiene emulsiones de latex de polímeros y la tensión de adhesión promedio del mortero sin modificar.
Para poder calcular los promedios recordemos que la media poblacional se calcula de la siguiente manera:
\[\mu=\int_{-\infty}^{\infty}y~f(y)~dy~\]
En el caso de \(y\) continua.
\[\mu=\sum_{para~todo~y}y~p(y)\]
En el caso de \(y\) discreta.
Para el cálculo de la media muestral se usa:
\[\bar{y}=\frac{\sum_{1}^{n}y_i}{n}\]
Es posible que también nos interese el cálculo de la varianza poblacional, la cual se calcula de la siguiente manera:
\[\sigma^2=\int_{-\infty}^{\infty}(y-\mu)^2~f(y)~dy\]
En el caso de \(y\) continua.
\[\sigma^2=\sum_{para~todo~y}(y-\mu)^2~p(y)\]
En el caso de \(y\) discreta.
Para el cálculo de la varianza muestral se usa:
\[S^2=\frac{\sum_{i=1}^{n}(y_i-\bar{y})^2}{n-1}\]
Si calculamos las fuerzas de tensión promedio resultan en \(\bar{y_1}=16,76~kgf/cm^2\) y \(\bar{y_2}=17,92kgf/cm^2\), obteniendo la impresión de que la fuerza del mortero sin modificar es mayor que la fuerza del mortero modificado.
Las fuerzas de la tensión de adhesión promedio de estas dos muestras difieren en lo que parece ser una cantidad no trivial. Sin embargo, no es evidente que esta diferencia sea de la magnitud suficiente para implicar que las dos formulaciones son en realidad diferentes. Quizás esta diferencia observada en las fuerzas promedio sea el resultado de fluctuaciones del muestreo y las dos formulaciones sean idénticas en realidad. Posiblemente otras dos muestras produzcan el resultado contrario, con la fuerza del mortero modificado excediendo la de la formulación sin modificar.
Identificación de elementos del experimento
Para el experimento de comparaciones simples de mortero modificado y sin modificar se tiene lo siguiente:
- Factor: formulación del mortero.
- Niveles del factor: 1: mortero modificado. 2 Mortero sin modificar.
- Variable respuesta: \(y_{ij}\)
- Con \(i: nivel\) y \(j: observación\), \(y_{ij}\) representa la fuerza de tensión de adhesión.
Cuando necesitamos comparar 2 muestras de poblaciones, una de ellas bajo un tratamiento, y la otra con ausencia de ellas, inicialmente tenemos dos opciones:
1. Opción 1: Las dos poblaciones tienen igual varianza, esto
es \(\sigma_1^2 =
\sigma^2_2\)
2. Opción 2: Las dos poblaciones tienen diferente varianza, esto
es \(\sigma_1^2 \neq
\sigma^2_2\)
Para realizar una comparación puede usarse una técnica de inferencia estadística llamada prueba de hipótesis, el procedimiento a seguir se ilustra a continuación:
Prueba para igualdad de las varianzas
Las varianzas de las poblaciones son iguales (\(\sigma_1^2=\sigma_2^2\)) o diferentes (\(\sigma_1^2\neq\sigma_2^2\)), se verifica de manera estadística mediante el siguiente procedimiento:
1. Planteamiento de hipótesis
Para la prueba de hipótesis sobre la igualdad de las varianzas de las poblaciones se realiza el siguiente planteamiento:
\[\begin{gather*} H_o: \sigma_1^2 = \sigma_2^2 \\ H_1: \sigma_1^2 \neq \sigma_2^2 \end{gather*}\]
Se puede reescribir como:
\[\begin{gather*} H_o: \frac{\sigma_1^2}{\sigma_2^2}=1 \\ H_1: \frac{\sigma_1^2}{\sigma_2^2}\neq1 \end{gather*}\]
Donde:
\(\sigma_1^2:~varianza~población~1\)
\(\sigma_2^2:~varianza~población~2\)
2. Estadístico de prueba para la prueba de igualdad de varianzas.
El estadístico de prueba sería:
\[F_o=\frac{S_1^2}{S_2^2}\]
Donde:
\(S_1^2:~varianza~muestra~1\)
\(S_2^2:~varianza~muestra~2\)
3. Distibución de referencia para \(F_0=\frac{S_1^2}{S_2^2}\)
La distribución de referencia, teórica, para \(F_o\) es la distribución F de Fisher con \(n_1-1\) grados de libertad en el numerador (\(n_1\) representa el tamaño de la muestra 1) y \(n_2-1\) grados de libertad en el de denominador (\(n_2\) representa el tamaño de la muestra 2)y \(\alpha\) nivel de significancia de la prueba.
Recordemos en este punto que: \(\alpha\) es llamado comúnmente nivel de significación de la prueba y representa el siguiente error:
\(\alpha=P(Error~tipo~I)=P(Rechazar~H_o\mid H_o~es~verdadera)\)
También existe error Tipo II
\(\beta=P(Error~tipo~II)=P(Aceptar~H_o\mid H_o~es~vfalsa)\)
El nivel de significación de la prueba lo determina el experimentador, generalmente toma valores de \(5\%\) o \(0.05\)
Se rechaza \(H_o\) si:
\[F_o<F_{1-\frac{\alpha}{2},~n_1-1,~n_2-1}\]
o si
\[F_o>F_{\frac{\alpha}{2},n_1-1,n_2-1}\]
Un intervalo de confianza al \(100(1-\alpha)~por~ciento\) sería:
\[\frac{S_1^2}{S_2^2}F_{\frac{\alpha}{2},n_2-1,n_1-1}\leq \frac{\sigma_1^2}{\sigma_2^2}\leq\frac{S_1^2}{S_2^2}F_{1-\frac{\alpha}{2},n_2-1,n_1-1}\]
Posterior a definir la igualdad o desigualdad de varianzas, podemos proceder a estudiar, desde el punto de vista estadístico, las dos muestras de individuos.
Solución de la situación inicial en R
# Importamos datos y lo asignamos a un dataframe
library(readxl)
cemento <- read_excel("cemento_R.xlsx")
# Definimos el factor de interés y lo asignamos a un objeto
cemento$Tratamiento <- as.factor(cemento$Tratamiento)
# Realizamos prueba de igualdad de varianza
var.test(cemento$Fuerza~cemento$Tratamiento)
##
## F test to compare two variances
##
## data: cemento$Fuerza by cemento$Tratamiento
## F = 1.6293, num df = 9, denom df = 9, p-value = 0.4785
## alternative hypothesis: true ratio of variances is not equal to 1
## 95 percent confidence interval:
## 0.4046845 6.5593806
## sample estimates:
## ratio of variances
## 1.629257
# Hallamos el cuantil para el estadístico teórico y nivel de significancia =0.05, la distribución teórica es Fisher
qf(1-(0.05/2),9,9,lower.tail = F)
## [1] 0.2483859
qf(0.05/2,9,9,lower.tail = F)
## [1] 4.025994
De los anteriores resultados obtenemos:
\(F_0= 1.629257\)
\(F_{1-\frac{\alpha}{2},~n_1-1,~n_2-1}=F_{0.975,~9,~9}=0.2483859\)
\(F_{\frac{\alpha}{2},~n_1-1,~n_2-1}=F_{0.025,~9,~9}=4.025994\)
Por lo que:
\[F_0 \nless F_{0.975,~9,~9} = 1.629257 \nless 0.2483859 \\ \land \\ F_0 \ngtr F_{0.075,~9,~9} = 1.629257 \ngtr 4.025994 \]
Por lo que no existe evidencia estadística para rechazar \(H_0\) por lo que las varianzas \(\sigma_1^2\) y \(\sigma_2^2\) son iguales