#Prueba de igualdad de varianza
grupo = c(rep("Con Nitrogeno", 10), rep("Sin Nitrogeno", 10))
peso = c(0.28,0.43,0.48,0.48,0.52,0.74,0.76,0.86,0.62,0.43,
0.31,0.54,0.27,0.39,0.45,0.43,0.39,0.42,0.37,0.39)DISEÑO DE COMPARACIONES SIMPLE
1 Introducción
El estudio de las interacciones simbióticas entre árboles y hongos micorrícicos es fundamental para comprender el crecimiento vegetal y la absorción de nutrientes. En este contexto, en el presente informe busca evaluar el impacto del nitrógeno en el desarrollo de robles rojos en asociación con el hongo Pisolithus tinctorus.
El objetivo del análisis es determinar si la adición de nitrógeno influye significativamente en el peso de los tallos de los árboles. Para ello, se aplicarán herramientas estadísticas que permitan establecer si existen diferencias significativas entre los árboles que recibieron nitrógeno y aquellos que no. Los resultados contribuirán a una mejor comprensión del papel del nitrógeno en el crecimiento de los robles en condiciones de simbiosis con Pisolithus tinctorus.
2 Problema
En un estudio que se lleva a cabo en Virginia Tech sobre el desarrollo de micorriza, una relación simbiótica entre las raíces de árboles y un hongo, en la cual se transfieren minerales del hongo a los árboles y azúcares de los árboles a los hongos, se cultivaron en un invernadero 20 robles rojos que fueron expuestos al hongo Pisolithus Tinctorus. Todos los árboles se plantaron en el mismo tipo de suelo y recibieron la misma cantidad de luz solar y agua. La mitad no recibió nitrógeno en el momento de plantarlos y sirvió como control, y la otra mitad recibió 368 ppm de nitrógeno en forma de NaNO3 . Después de 140 días se registraron los siguientes pesos de los tallos, en gramos:
| Con nitrógeno | Sin nitrógeno |
|---|---|
| 0.28 | 0.31 |
| 0.43 | 0.54 |
| 0.48 | 0.27 |
| 0.48 | 0.39 |
| 0.52 | 0.45 |
| 0.74 | 0.43 |
| 0.76 | 0.39 |
| 0.86 | 0.42 |
| 0.62 | 0.37 |
| 0.43 | 0.39 |
Tabla de pesos de los tallos.
Los investigadores se preguntan si existe suficiente evidencia estadística que permita establecer el efecto del nitrógeno en el crecimiento de robles rojos cultivados con el hongo Pisolithus tinctorus. Específicamente, se busca entender si la adición de nitrógeno, afecta el peso de los tallos de los robles rojos en comparación con aquellos que no recibieron nitrógeno.
3 Desarrollo y datos generales
Se realizaron dos pruebas estadísticas:
Prueba de igualdad de varianzas (Prueba F).
Prueba de diferencia de medias (t-test de Student).
Se utilizó un nivel de significancia de \(\alpha = 0.05\)
3.1 Factor de interés
En el caso de estudio el factor de interés es el Efecto del nitrogeno en el crecimiento de robles rojos cultivados con el hongo Pisolithus tinctorus.
3.2 Variable respuesta
En el caso de estudio la variable respuesta es el peso de los tallos de los robles rojos y los pesos se registran en gramos.
3.3 Niveles del factor
En el caso de estudio se presentan los siguientes niveles del factor:
Nivel 1: Con nitrogeno.
Nivel 2: Sin nitrogeno.
3.4 Muestra
- Muestra 1: \(\\ n_1 = 10\\\)
- Muestra 2: \(\\ n_2 = 10\\\)
4 Prueba de igualdad de varianzas
Las varianzas de las muestras pueden llegar a ser iguales ( \(\sigma _{1}^{2} = \sigma _{2}^{2}\) ) o diferentes (\(\sigma _{1}^{2} \neq \sigma _{2}^{2}\)) y esto se rectifica mediante los siguientes procesos estadisticos dependiendo sin son iguales o no las varianzas.
Caso 1 \(\Rightarrow \ \sigma _{1}^{2} = \sigma _{2}^{2}\)
Esto significa que la variabilidad en los pesos de los tallos es similar entre los árboles con y sin nitrógeno.
Caso 2 \(\Rightarrow \ \sigma _{1}^{2} \neq \sigma _{2}^{2}\)
Esto indicaría que el tratamiento con nitrógeno afecta la variabilidad de los pesos de los tallos.
4.1 Planteamiento de hipótesis
El planteamiento de hipotesis sobre la prueba de igualdad se puede plantear de la siguiente manera.
\[\left\{\begin{matrix} H_0:\sigma _{1}^{2} = \sigma _{2}^{2} \\ H_1:\sigma _{1}^{2} \neq \sigma _{2}^{2} \end{matrix}\right.\]
Donde:
\(\sigma _{1}^{2}\) : La varianza poblacional 1
\(\sigma _{2}^{2}\) : La varianza poblacional 2
4.2 Estadistico de prueba \(F_0\)
El estadístico de prueba para la prueba F se calcula como:
\[F_{0} = \frac{S_1^2}{S_2^2}\]
Donde
- \(S_1^2\) : Varianza muestra 1 (con nitrogeno)
- \(S_2^2\) : Varianza muestra 2 (sin nitrogeno)
Para calcular las varianzas muestrales se debe implementar la siguiente formula de forma general:
\[S^2 = \frac{\sum (y_i - \bar{y})^2}{n - 1}\]
siendo
\(S^2\): Varianza muestral.
\(y_i\): Valor de la \(i\)-ésima observación en la muestra.
\(\bar{y}\): Media muestral.
\(n\): Tamaño de la muestra.
La varianza muestral permite evaluar qué tan dispersos están los datos en relación con la media de la muestra. Al determinar las varianzas de ambos grupos, se obtiene una estimación de la variabilidad en los pesos de los tallos de robles rojos bajo los dos tratamientos.
Al calcular manualmente el estadístico de prueba utilizando la varianza muestral, se obtienen lo siguiente sdatos:
\(\bar{Y}_1 = 0.56\); media muestral de árboles con nitrógeno
\(\bar{Y}_2 = 0.396\); media muestral de árboles sin nitrógeno
\(n = 10\); tamaño de la muestra
\(S_1^2 = 0.03251111\); varianza muestral de árboles con nitrógeno
\(S_2^2 = 0.005493333\); varianza muestral de árboles sin nitrógeno
Realizando el cálculo de manera manual, el estadístico de prueba es:
\(F_{0} = \frac{S_1^2}{S_2^2}\)
\(F_{0} = \frac{0.03251111}{0.005493333}\)
\(F_{0} = 5.918285\)
No obstante, en RStudio, el estadístico de prueba se calcula empleando el siguiente código:
varianza_con_nitrogeno <- var(peso[grupo == "Con Nitrogeno"])
varianza_con_nitrogeno[1] 0.03251111
varianza_sin_nitrogeno <- var(peso[grupo == "Sin Nitrogeno"])
varianza_sin_nitrogeno [1] 0.005493333
grupo <- as.factor(grupo)
tes = var.test(peso~grupo)
tes
F test to compare two variances
data: peso by grupo
F = 5.9183, num df = 9, denom df = 9, p-value = 0.01419
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
1.470018 23.826980
sample estimates:
ratio of variances
5.918285
tes$statistic # valor F F
5.918285
En comparación con el cálculo manual, el resultado del estadístico de prueba obtenido a través del software RStudio es:
\(F_0 = 5.918285\)
El estadístico de prueba \(F_0\) se obtiene al dividir las varianzas muestrales de ambos grupos. En este caso, \(F_0 = 5.9182\), lo que significa que la varianza del grupo con nitrógeno es aproximadamente 5.9182 veces mayor que la del grupo sin nitrógeno.
4.3 3. Distribución de referencia para \(F_0 = \frac{S_1^2}{S_2^2}\)
La distribución teórica de referencia para \(F_0\) sigue la distribución \(F\) de Fisher, con \(n_1 - 1\) grados de libertad en el numerador (\(n_1\) corresponde al tamaño de la primera muestra) y \(n_2 - 1\) grados de libertad en el denominador (\(n_2\) representa el tamaño de la segunda muestra). Además, el nivel de significancia de la prueba está representado por \(\alpha\).
Es importante recordar que el nivel de significación \(\alpha\) se define como:
\[ \alpha = P(\text{Error tipo I}) = P(\text{Rechazar } H_0 \mid H_0 \text{ es verdadera}) \]
Asimismo, existe el error de tipo II, representado por \(\beta\):
\[ \beta = P(\text{Error tipo II}) = P(\text{Aceptar } H_0 \mid H_0 \text{ es falsa}) \]
El valor de \(\alpha\) es determinado por el experimentador y generalmente se establece en 5% o 0.05.
La hipótesis nula (\(H_0\)) se rechaza si:
\[ F_0 < F_{1 - \alpha/2, n_1 - 1, n_2 - 1} \]
o si
\[ F_0 > F_{\alpha/2, n_1 - 1, n_2 - 1} \]
Un intervalo de confianza con un nivel del \(100(1 - \alpha)\)% se define como:
\[ \frac{S_1^2}{S_2^2} F_{\alpha/2, n_2 - 1, n_1 - 1} \leq \frac{\sigma_1^2}{\sigma_2^2} \leq \frac{S_1^2}{S_2^2} F_{1 - \alpha/2, n_2 - 1, n_1 - 1} \]
Una vez establecida la igualdad o desigualdad entre las varianzas, se puede proceder al análisis estadístico de ambas muestras de individuos.
# Hallamos el cuantil para el estadístico teórico y nivel de significancia =0.05, la distribución teórica es Fisher
qf(1-(0.05/2),9,9,lower.tail = F) #Cuantil de cola derecha[1] 0.2483859
##[1] 0.2483859
5.9183 < 0.2483859[1] FALSE
##[1] FALSE
qf(0.05/2,9,9,lower.tail = F) # Cuantil de cola izquierda[1] 4.025994
##[1] 4.025994
5.9183 > 4.025994 [1] TRUE
##[1] TRUEDe los anteriores resultados obtenemos:
\[ F_0 = 5.9183\]
\[ F_{1-\alpha/2, n_1-1, n_2-1} = F_{0.975, 9, 9} = 0.2483859 \]
\[ F_{\alpha/2, n_1-1, n_2-1} = F_{0.025, 9, 9} = 4.025994 \] comparamos \(F_0\) con los valores críticos de la distribución F.
\(F_0 < \ F_{1-\alpha/2, \ n_1-1, \ n_2-1}\)
\(F_0 < \ F_{0.975, \ 9, 9}\)
\(5.9183 \ < \ 0.2484\)
\(5.9183\not< \ 0.2484\)
Esto indica que \(F_0\) no es inferior al valor crítico más bajo, por lo que no se cuenta con suficiente evidencia para rechazar la hipótesis nula a partir de esta comparación.,.
\(F_0 > \ F_{\alpha/2, \ n_1-1, \ n_2-1}\)
\(F_0 > \ F_{0.025, \ 9, 9}\)
\(5.9183 \ > \ 4.0259\)
No obstante, al analizar el límite superior, se observa que \(F_0\) supera el valor crítico superior. Por consiguiente, existe evidencia suficiente para rechazar la hipótesis nula de igualdad de varianzas. ..
En conclusión, la evidencia muestra que la variabilidad en el peso de los tallos es significativamente diferente entre los robles que recibieron nitrógeno y los que no lo recibieron. Esto quiere decir que agregar nitrógeno si afecta el crecimiento de los robles.
4.3.1 Prueba de hipótesis
Dado que hemos descartado la hipótesis nula de igualdad de varianzas, llevamos a cabo la prueba de diferencia de medias para analizar el impacto del nitrógeno en el peso de los tallos. En otras palabras, buscamos determinar si existe una diferencia significativa entre las medias de los pesos de los robles que recibieron nitrógeno y los que no.
Planteamos las siguientes hipótesis:
Donde:
\(\mu_1\): Media del peso de los tallos con nitrógeno.
\(\mu_2\): Media del peso de los tallos sin nitrógeno.
La hipótesis nula \(( H_0 )\) plantea que la media del peso de los tallos en el grupo que recibió nitrógeno es el mismo que en el grupo que no lo recibió. Por otro lado, la hipótesis alternativa \(( H_1 )\) indica que existe una diferencia significativa entre las medias de los pesos de los tallos en ambos grupos.
4.3.2 Estadístico de prueba to
Para llevar a cabo esta prueba, aplicamos una prueba t para dos muestras con varianzas desiguales, conocida como la prueba t de Welch, ya que se identificaron diferencias en las varianzas. La expresión utilizada para calcular el estadístico de prueba t es la siguiente:
Donde:
\(\bar{y}_1\) y \(\bar{y}_2\) son las medias muestrales de los pesos de los tallos en los grupos con y sin nitrógeno, respectivamente.
\(S_1^2\) y \(S_2^2\) son las varianzas muestrales de los pesos de los tallos en los grupos con y sin nitrógeno, respectivamente.
\(n_1\) y \(n_2\) son los tamaños de las muestras en los grupos con y sin nitrógeno, respectivamente.
Teniendo en cuenta el cálculo de la prueba de igualdad de varianzas, la varianza muestral junto con algunos datos adicionales se presentan a continuación.:
\(\bar{Y}_1 = 0.560\); media muestral de árboles con nitrógeno
\(\bar{Y}_2 = 0.396\); media muestral de árboles sin nitrógeno
\(n_1 = 10\); tamaño de la muestra de árboles con nitrógeno
\(n_2 = 10\); tamaño de la muestra de árboles sin nitrógeno
\(S_1^2 = 0.03251\); varianza muestral de árboles con nitrógeno
\(S_2^2 = 0.005493\); varianza muestral de árboles sin nitrógeno
Hagamos el cálculo manual con la formula del estadístico de prueba
\(t_0 = \frac{0.560 - 0.396}{\sqrt{\frac{0.03251}{10} + \frac{0.005493}{10}}}\)
Sin embargo en RStudio, el cálculo del estadístico de prueba se realiza de una forma distinta con el siguiente código:
testt=t.test(peso~grupo, var.equal = FALSE)
# medias 0.560 0.396
testt$statistic # valor t0 t
2.660276
##2.660276 Al contrastar con el cálculo manual, el valor del estadístico de prueba obtenido a través del software RStudio es el siguiente:
\(t_0 = 2.660276\)
El estadístico t obtenido, \(t_0 = 2.6207\), se contrasta con los valores críticos de la distribución t de Student para evaluar si se debe rechazar la hipótesis nula.
5 Distribución de referencia Para la prueba t de Welch:
se utiliza cuando las varianzas son desiguales, los grados de libertad (df) se calculan con la siguiente fórmula:
\(df = \frac{\left(\frac{S_1^2}{n_1} + \frac{S_2^2}{n_2}\right)^2}{\frac{\left(\frac{S_1^2}{n_1}\right)^2}{n_1 - 1} + \frac{\left(\frac{S_2^2}{n_2}\right)^2}{n_2 - 1}}\)
Donde:
\(S_1^2\) y \(S_2^2\) son las varianzas muestrales de los pesos de los tallos en los grupos con y sin nitrógeno, respectivamente.
\(n_1\) y \(n_2\) son los tamaños de las muestras en los grupos con y sin nitrógeno, respectivamente.
6 Paso 2: Calcular el numerador
\(\left( \frac{0.0316}{10} + \frac{0.0051}{10} \right)^2\)
\[ \left( 0.00316 + 0.00051 \right)^2 = (0.00367)^2 = 1.34889 \times 10^{-5} \]
7 Paso 3: Calcular el denominador
\[ \frac{\left( \frac{0.0316}{10} \right)^2}{9} + \frac{\left( \frac{0.0051}{10} \right)^2}{9} \]
\[ \frac{(0.00316)^2}{9} + \frac{(0.00051)^2}{9} \]
\[ \frac{9.9856 \times 10^{-6}}{9} + \frac{2.601 \times 10^{-7}}{9} \]
\[ 1.1095 \times 10^{-6} + 2.89 \times 10^{-8} = 1.1384 \times 10^{-6} \]
8 Paso 4: Calcular los grados de libertad
\[ df = \frac{1.34889 \times 10^{-5}}{1.1384 \times 10^{-6}} \]
\[ df = 11.85 \]
9 Resultado Final
Los grados de libertad de Welch son aproximadamente 11.85, que normalmente se trunca o se usa el valor más cercano en una tabla t de Student. Ahora comparamos el estadístico de prueba \(t_0 \\\) con el valor crítico de la distribución t. Este valor crítico se obtiene a partir de la distribución t para determinar si el estadístico calculado es suficientemente extremo para rechazar la hipótesis nula:
\(t_{\alpha/2, \ \ v}\)
Donde:
\(\alpha\) es el nivel de significancia.
\(v\) son los grados de libertad.\(t_{\alpha/2, \ \ v}\)
qt(0.05/2,11.957,lower.tail = FALSE) #Cuantil teorico [1] 2.179682
qtfunction (p, df, ncp, lower.tail = TRUE, log.p = FALSE)
{
if (missing(ncp))
.Call(C_qt, p, df, lower.tail, log.p)
else .Call(C_qnt, p, df, ncp, lower.tail, log.p)
}
<bytecode: 0x0000018893c7b068>
<environment: namespace:stats>
##[1] 2.1796829.0.1 Comparación de la distribución de probabilidad de referencia
Para evaluar si la diferencia en los pesos de los tallos entre ambos grupos es estadísticamente significativa, se compara el estadístico de prueba ( t_0 ) con el valor crítico de la distribución t. En este análisis, si el valor absoluto del estadístico de prueba supera el valor teórico, se rechaza la hipótesis nula. Por lo tanto:\(|t_0| > \ t_{ \ \alpha/2, \ v}\)
\(|t_0| > \ t_{ \ 0.025, \ 12}\)
\(2.6207 \ > \ 2.1788\)
Como \(|t_0|\) supera el valor crítico, se rechaza la hipótesis nula. Esto indica que hay evidencia suficiente para afirmar que existe una diferencia significativa en el peso de los tallos entre los robles que fueron tratados con nitrógeno y aquellos que no lo fueron.
10 Resultados
Se determina que la incorporación de nitrógeno influye de manera significativa en el crecimiento de los robles rojos cultivados con el hongo Pisolithus tinctorus. Los árboles que fueron tratados con nitrógeno presentaron un incremento notable en el peso de sus tallos en comparación con aquellos que no lo recibieron. En consecuencia, se acepta la hipótesis alternativa.