Jóvenes Biometrístias 2023

Caracterización química del grano de colza y su relación con variables ambientales

Magdalena Damiani Quiroz DNI: 39912057 Mail:

Valentín Rozenblit DNI: 40539609 Mail:

Introducción

La colza (Brassica napus) es una planta angiosperma oleaginosa de la familia de las brasicáceas. Se trata de un cultivo anual o bienal, con raíz axonomorfa y tallo de hasta 1.5 m. Sus hojas pueden llegar a medir hasta 40 cm, y son glaucas y glabras. Además, sus flores son amarillas con pedicelos de hasta 18 mm, sepalos de 5-10 mm y pétalos de 8-18 mm. Los racimos tienen entre 20 y 60 de esta flores. Sus semillas (de donde se extrae el aceite de colza) están contenidos en un fruto que suele tener entre 12 y 18 de estas semillas por lóculo. Las semillas tienen entre 1,2-1,8 mm de diámetro, esféricas, de un color pardo oscuro. link link

Si bien esta planta es nativa de Turquía, muchos países han adoptado su plantación por los diversos usos que tienen sus aceites. Hoy en día, los productores más grandes del aceite de colza son Canadá, China y la India link.

El aceite de colza es uno de los aceites comestibles más antiguos, pero su consumo nunca ha sido a gran escala por la alta concentración de ácido erúcico que posee. El aceite de colza puede contener hasta un 54% de ácido erúcico link. Es por este motivo que, para consumo culinario, se ha usado más frecuentemente un derivado del aceite de colza llamado aceite de canola con restricciones de poseer hasta un 2% de ácido erúcico. Este derivado de aceite fue considerado como “seguro” según la Administración de Alimentos y Drogas de los Estados Unidos link.

Adicionalmente, el procesamiento del aceite de colza genera un subproducto que puede utilizarse como alimento animal debido al gran contenido proteico que posee. Principalmente, se utiliza para alimentar ganado. Sin embargo, su uso no es extensivo por las altas concentraciones de ácido erúcico que produce daños en los tejidos cardíacos (link1, link2, link3).

También, el aceite de colza ha sido utilizado como biodiesel. El biodiesel puede ser producido a partir del aceite puro, o mezclado con destilados de pétroleo. Se trata de un combustible muy popular sobretodo en Europa donde el 80% de los biodiesel son de este cultivo. Esto se debe parcialmente a la gran productividad aceite por unidad de área que tiene la colza y además por tener un punto de gelificación menor que otros aceites vegetales. Sin embargo, debido a cambios climáticos, el aceite de colza puede dejar de ser un biodiesel redituable en los proximos años (link).

Recientemente, el interés nacional por este aceite ha ido en aumento, sobretodo debido a la posiblidad de sintetizar aceites para cocción. Para que ésto sea posible, es necesario que el aceite cumpla con ciertas normas composición química entre las cuales destacan eliminar el exceso de ácidos perjudiciales como el erúcico y los saturados, y lograr una composición óptima de ácidos saludables como los insaturados y poliinsaturados (linolénico, araquidónico, etc.). Estas concentraciones están determinados por un compromiso entre dos factores: el genético (variedad, cultivar, subespecie, selección artificial) y el ambiental (temperatura, precipitaciones, balance hídrico).

Objetivos e Hipótesis

El objetivo de este trabajo es dilucidar la relación que existe entre la composición del aceite de colza en cuanto a distintos tipos de ácidos y las caracteristicas genéticas y ambientales. Para ello se propone la siguiente hipótesis:

Los contenidos de distintos tipos de ácidos grasos en el aceite de colza se ven afectados tanto por condiciones genéticas como por condiciones ambientales en interacción

Para poner a prueba la hipótesis se cuenta con las siguientes preguntas orientativas:

  1. ¿Cuáles cultivares de colza presentan mayor contenido de ácido linolénico y menor contenido de ácidos grasos saturados?
  2. ¿Cómo agruparía los cultivares con base en la similitud del perfil de ácidos grasos, tocoferoles e índice de estabilidad?
  3. ¿El contenido de ácido linolénico se ve afectado por la temperatura durante el periodo entre el inicio de floración y la madurez fisiológica (IF-MF)?
  4. ¿Cuál de los factores (cultivar o ambiente) aporta mayor variación al contenido de ácidos grasos del grano? ¿Existe interacción genotipo-ambiente? ¿Qué cultivar/es recomendaría en sentido amplio o sitio específico?

Materiales y Métodos

Para llevar a cabo esta investigación, se realizó un estudio comparativo en múltiples entornos, en el cual se analizaron 13 cultivares de colza en cuatro localidades distintas de Argentina. En cada una de estas localidades y para cada cultivar, se extrajeron muestras de grano de dos parcelas experimentales (repeticiones) y se procedió a determinar la composición de ácidos grasos. Se recopilaron datos sobre varios aspectos, incluyendo el contenido total de aceite (expresado en gramos por cada 100 gramos de grano en base seca), el porcentaje de ácidos grasos saturados e insaturados más relevantes en relación al total de aceite, el contenido de tocoferoles (medido en microgramos por gramo de aceite de colza) y la estabilidad del índice oxidativo (OSI). Además de estos análisis, durante el curso de la investigación se registraron datos relativos a las condiciones ambientales, tales como la temperatura máxima (Tmx), temperatura media (Tmed), temperatura mínima (Tmin), precipitación (pp) y evapotranspiración (etp), durante el período que abarcó desde el inicio de la floración hasta la madurez fisiológica (IF-MF).

La base de datos cuenta con 104 registros (13 Cultivares * 4 Localidades * 2 Repeticiones = 104 datos) para cada una de las variables ya descritas. Cabe destacar que las repeticiones están anidadas en los cultivares por lo que existe una falta de independencia en los datos que hay que tener en cuenta. Para poder responder las preguntas se realizaron una serie de modelos lineales y no-lineales.

Resultados

Los resultados se muestran en función de cada una de las preguntas orientativas.

Pregunta 1: ¿Cuáles cultivares de colza presentan mayor contenido de ácido linolénico y menor contenido de ácidos grasos saturados?

A modo de descripción de la base para detectar patrones generales, se realizó un gráfico de barras en donde se muestran las concentraciones de estos tipos de ácidos. Ésto puede verse en la Figura 1.

Figura 1. Gráfico de barras de las concentraciones de ácidos linolénico y saturados en función de los cultivares

En la Figura 1 puede observarse que la concentración del acido linolénico es mayor que la de los saturados. Ésto es algo favorable pues el objetivo de lograr una concentración mayor de acidos poliinsaturados fue claramente conseguido. Sin embargo, hilando más fino, puede observarse que los cultivares con mayor acido linolénico son los 2, 5 y 4 (en orden), sin embargo, todos los cultivares parecerían ser bastante homogéneos en este aspecto.Por otro lado, en cuanto a la concentración de ácidos saturados, se puede ver que los cultivares 8 y 12 son los de menor cantidad de acido saturado aunque, nuevamente, las diferencias son leves. En resumidas cuentas, la descriptiva no anticipa diferencias significativas en cuanto a estos ácidos entre los cultivares.

En este punto se procedió a realizar un modelo estadístico para responder concretamente la pregunta planteada. Debido a que las parcelas están anidadas en los cultivares, esta falta de independencia debe declararse en el modelo. El modelo que se ajustó es el siguiente:

\[ Ácido_{ijk} = \mu + \alpha_{i} + B_{j(k)} + \epsilon_{ijk} \]

donde \(\alpha_i\) es la localidad (i = 1 a 4), y donde \(B_{j(k)}\) son los Cultivares que poseen las parcelas (j = 1 al 13, k = 1 al 2). La multiplicación de los índices \(i*j*k = 104\) es igual a la cantidad de datos lo cual indica que el modelo está bien planteado.

El modelo para el ácido linolénico supera la prueba de supuestos como puede observarse en la Figura 2 y 3.

## 
##  Shapiro-Wilk normality test
## 
## data:  resid(m1, type = "pearson")
## W = 0.8729, p-value = 5.821e-08

Figura 2: Prueba de supuestos para la parte fija del modelo de ácido linolénico. Izq: Residuos vs. predichos. Der: QQ-plot.

Si bien el p-valor de normalidad es significativo, el QQ-plot de la Figura 2 muestra un ajuste bueno además de un buen gráfico de residuos vs predichos los cuales reprseentan un buen indicio de normalidad y homocedasticidad en los datos.

## [1] 2 1
## 
##  Shapiro-Wilk normality test
## 
## data:  ref$Cultivar$`(Intercept)`
## W = 0.93232, p-value = 0.3653

Figura 3: QQ-plot para la parte aleatoria para el modelo de ácido linolénico.

Por otro lado, el p-valor de la parte aleatoria da no significativo que se refleja en el QQ-plot de la Figura 3. Ésto indica que los supuestos de la parte aleatoria tambien fueron superados.

Habiendo discutido los supuestos del modelo, se procede a observar los resultados. Estos pueden verse en la Figura 4.

## Type III Analysis of Variance Table with Satterthwaite's method
##           Sum Sq Mean Sq NumDF DenDF F value    Pr(>F)    
## Localidad 48.896  16.299     3    88  97.796 < 2.2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## ANOVA-like table for random-effects: Single term deletions
## 
## Model:
## Linolenic.Acid ~ Localidad + (1 | Cultivar)
##                npar  logLik    AIC   LRT Df Pr(>Chisq)
## <none>            6 -62.704 137.41                    
## (1 | Cultivar)    5 -64.005 138.01 2.601  1     0.1068
  Linolenic.Acid
Predictors Estimates CI p
(Intercept) 7.50 7.32 – 7.68 <0.001
Localidad [Loc 2] 1.92 1.70 – 2.15 <0.001
Localidad [Loc 3] 1.04 0.81 – 1.26 <0.001
Localidad [Loc 4] 0.78 0.55 – 1.00 <0.001
Random Effects
σ2 0.17
τ00 Cultivar 0.02
ICC 0.10
N Cultivar 13
Observations 104
Marginal R2 / Conditional R2 0.719 / 0.748

Figura 4: Arriba: Concentraciones de ácido linolénico predichas por el modelo según localidad. Abajo: Resultado del modelo de interceptos aleatorios para los Cultivares.

En la Figura 4 pueden observarse dos efectos relevantes. En primer lugar, el efecto de la localidad resulta significativo teniendo a la localidad 2 como la de mayor producción de ácido linolénico, y en cuanto a los interceptos aleatorios, puede observarse que los Cultivares con mayor concentración de ácido linolénico son los 2, 4 y 5 tal y como lo anticipaba la estadística descriptiva. Sin embargo, cabe aclarar que el efecto aleatorio resultó no significativo (p = 0.1068) por lo que los cultivares no serían significativamente diferentes entre sí en este aspecto.

En cuanto al modelo para los ácidos saturados se observó que también supera la prueba de supuestos como puede observarse en la Figura 5 y 6.

Supuestos:

## 
##  Shapiro-Wilk normality test
## 
## data:  resid(m2, type = "pearson")
## W = 0.96997, p-value = 0.01823

Figura 5: Prueba de supuestos para la parte fija del modelo de ácidos saturados. Izq: Residuos vs. predichos. Der: QQ-plot.

En la Figura 5, nuevamente, se puede ver que los supuestos de la parte fija dan relativamente bien. Si bien el p valor del Shapiro-Wilks da significativo, el QQ-plot sugiere que la normalidad se puede seguir asumiendo. A todo esto se le suma un buen perfil de residuos vs. predichos que atisban homocedasticidad.

## [1] 9 8
## 
##  Shapiro-Wilk normality test
## 
## data:  ref$Cultivar$`(Intercept)`
## W = 0.94048, p-value = 0.4632

Figura 6: QQ-plot para la parte aleatoria para el modelo de ácidos saturados.

El p-valor para la prueba de normalidad de la parte aleatoria da no significativo (p = 0.4632). Esto, junto con un QQ-plot (Figura 6), nos permiten seguir asumiendo normalidad.

Habiendo discutido los supuestos del modelo, se procede a observar los resultados. Estos pueden verse en la Figura 7.

## Type III Analysis of Variance Table with Satterthwaite's method
##           Sum Sq Mean Sq NumDF DenDF F value    Pr(>F)    
## Localidad 4.0252  1.3417     3    88  7.7128 0.0001241 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## ANOVA-like table for random-effects: Single term deletions
## 
## Model:
## saturados ~ Localidad + (1 | Cultivar)
##                npar  logLik   AIC    LRT Df Pr(>Chisq)    
## <none>            6 -69.201 150.4                         
## (1 | Cultivar)    5 -76.101 162.2 13.801  1  0.0002032 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
  saturados
Predictors Estimates CI p
(Intercept) 6.68 6.46 – 6.90 <0.001
Localidad [Loc 2] -0.23 -0.46 – -0.00 0.047
Localidad [Loc 3] -0.39 -0.62 – -0.16 0.001
Localidad [Loc 4] 0.12 -0.11 – 0.35 0.321
Random Effects
σ2 0.17
τ00 Cultivar 0.06
ICC 0.27
N Cultivar 13
Observations 104
Marginal R2 / Conditional R2 0.141 / 0.372

Figura 7: Arriba: Concentraciones de ácidos saturados predichas por el modelo según localidad. Abajo: Resultado del modelo de interceptos aleatorios para los Cultivares.

En cuanto a los saturados se puede ver tambien que las localidades explican una gran parte de la variacion. Pero esta vez la variable aleatoria sí es significaitva y, para contestar la pregunta, los cultivares con la menor cantidad de saturados son los 8 y 12, al igual que lo anticipado por la descriptiva. Adicionalmente, los efectos aleatorios del Cultivar sí resultaron significativos en este caso.

Pregunta 2: ¿Cómo agruparía los cultivares con base en la similitud del perfil de ácidos grasos, tocoferoles e índice de estabilidad?

Para lograr una clasificación de Cultivares que contemplte a los tres criterios en simultaneo se intentó confeccionar una variable que sea una resultante de éstas. Esto se logró llevando a cabo un análisis de perfiles latentes (LPA) que agrupa variables por superposicion de distribuciones a partir de métodos bayesianos (link). El resultado de este análisis constituye una mirada holística de los cultivares atendiendo a los tres criterios de similitud a la vez.

El análisis de perfiles latentes tiene el requirimiento de imputar datos faltantes. Ésto puede verse en la Figura 8 en donde se muestran los datos imputados marcados en rojo.

Figura 8: Gráfico de varaibles pareadas con datos imputados marcados en rojo

## [1] "Opimal number of classes"
## [1] 4
## [1] "Optimal model variant"
## [1] "EEI"
## Bayesian Information Criterion (BIC): 
##         EEI       EEE       VVI       VVV
## 1 -2164.784 -2171.988 -2164.784 -2171.988
## 2 -2175.983 -2175.471 -2163.091 -2158.286
## 3 -2177.212 -2186.569 -2179.832 -2188.161
## 4 -2156.089 -2166.452 -2190.143 -2215.703
## 5 -2171.679 -2179.696 -2199.388 -2238.244
## 6 -2182.743 -2184.816 -2216.184 -2271.083
## 7 -2185.908 -2196.547 -2237.378 -2276.724
## 8 -2193.281 -2213.121 -2256.326 -2312.572
## 9 -2210.226 -2231.588 -2277.025 -2356.153
## 
## Top 3 models based on the BIC criterion: 
##     EEI,4     VVV,2     VVI,2 
## -2156.089 -2158.286 -2163.091
## [1] "tabulate class-membership numbers"
## 
##  1  2  3  4 
## 21 11 46 26
## [1] "display the means per class"
##                        [,1]      [,2]      [,3]       [,4]
## Tocopherol.total 1140.22943 878.63036 925.08149 898.290857
## OSI                11.05604  14.73096  10.06074   9.152626
## Oil.content        46.05279  47.28662  48.26581  45.650024

El resultado del análisis de perfiles latentes indica que el número idóneo de perfiles es 4. Estos perfiles tienen las siguientes características:

  • El perfil número 1 tiene 20.1% de class-membership (menos de 5% es inaceptable) y además tiene las siguientes características: Una media de 1140 ug/g de tocoferoles totales siendo el perfil de mayor contenido de tocoferoles Un OSI medio de 11.05 siendo el intermedio (vida util media de aceites) Una cantidad de aceites media de 46.05 g/100g

  • El perfil número 2 tiene 10.5% de class-membership lo cual está bien. Y tiene estas caracteristicas: Una media de 878 ug/g de tocoferoles siendo los que menos tienen Un OSI medio de 14.73 siendo los acieties con más vida util de todos Una cantidad de aceite de 47.28 g/100g

  • El perfil número 3 tiene un 44.2% de class membership, lo cual es joya. Y tiene estas caracteristicas: Una media de 925 ug/g de tocoferoles Un OSI medio de 10.06. Una cantidad de aceite de 48.26 g/100g

  • El perfil número 4 tiene un 25% de class membership, lo cual es joya. Y tiene estas caracteristicas: Una media de 898 ug/g de tocoferoles Un OSI medio de 9.15, el más bajo de todos (poca vida util) Una cantidad de aceite de 45.65 g/100g

Si bien la descripción paramétrica de los perfiles resulta interesante, la visualización de los datos agrupados según sus perfiles predichos es mucho más visual. Esto puede observarse ne la Figura 9 que consta de dos gráficos interactivos.

Figura 9: Gráficos de dispersión interactivos tridimensionales para los 3 criterios de clasificación. Arriba: datos crudos. Abajo: separados según los perfiles encontrados (Perfil 1: azul, Perfil 2: naranja, Perfil 3: verde, Perfil 4: rojo).

Luego, se observó cómo los cultivares se reparten en los perfiles encontrados. Estos resultados pueden verse en la Figura 10:

Figura 10: Distribución de perfiles en cada Cultivar

Si agrupamos por mayoría de probabilidades, los cultivares forman los siguientes grupos:

  • Grupo del perfil 1: cultivares 3, 10

  • Grupo con aspecto de perfil 2 : cultivares 6, 9, 11

  • Grupo del perfil 3: Cultivares 2, 5, 8, 12 y 13

  • Grupo del perfil 4: Cultivares 1, 4, 7

Cada grupo tiene las propiedades de su perfil las cuales ya fueron descritas, sin embargo, algunos cultivares tienen lo que hemos demonidado como “aspecto de perfil 2”. Esto se debe a que este perfil es el más escaso pero tambien con las propiedades más divergentes con la menor cantidad de tocoferoles y el más grande índice de estabilidad. Estos cultivares tendran valores acercados a los correspondientes del perfil 2 pero sin alcanzarlos completamente.

En resumen, los cultivares se pueden clasificar de manera exitosa utilizando los 3 criterios de clasificación a partir de una variable holística que resume su información. La clasificación resultante de esta variable representa una mirada integral sobre las caracteristicas de los cultivares.

Pregunta 3: ¿El contenido de ácido linolénico se ve afectado por la temperatura durante el periodo entre el inicio de floración y la madurez fisiológica (IF-MF)?

Para responder esta pregunta, tenemos 3 variables a considerar: la mínima, media y máxima. Por supuesto, estas tres variables comparten mucha información por lo que incluirlas en el mismo análisis sería un grosero error de colinealidad. La clave es elegir aquella temperatura que sea la más pertinente biologicamente. Se sabe que a mayor temperatura, la colza acumula más acidos saturados que polinsaturados como el linolénico según Triboi-Blondel 1999 link y Trémolières 1978 link. Sabiendo ésto, se espera que el contenido de ácido linolénico se vea afectado por la temperatura de éstos períodos.

Primero se realizaron gráficos exploratorios para observar cómo podría estar influenciado el contenido de ácido linolénico con la temperatura, considerando a la localidad y al cultivar.

Figura 11. Boxplots de las temperaturas máximas (arriba), medias (centro) y mínimas (abajo) de las distintas localidades. La barra indica la media.

Figura 12. Ácido linolénico en función de la temperaturas máximas (arriba), medias (centro) y mínimas (abajo), separado por localidad.

A partir de las figuras 11 y 12 se puede observar que las cuatro localidades tendrían distintos patrones de temperaturas máximas, medias y mínimas, pero que las temperaturas más extremas habría sólo estarían representadas en una localidad.

Figura 13. Ácido linolénico en función de la temperaturas máximas (arriba), medias (centro) y mínimas (abajo), separado por cultivar

Se observa en las figuras 12 y 13 una tendencia cuadrática negativa de la concentración de ácido linolénico respecto a las temperaturas, con un máximo a temperaturas medias, salvo cuando se utiliza a la temperatura mínima, donde no se observa ningún patrón muy claro.

Por estas razones se decidió realizar regresiones cuadráticas con las diferentes temperaturas, considerando al cultivar como variable de efecto aleatorio en cada una de ellas, según:

ACA PONER EL MODELO LINDO CON TEMPERATURA Y ACLARAR QUE SE CAMBIÓ CADA T

\[ Ác.Linolénico_{ijk} = \beta_{0} + \beta_{1}Temp + \beta_{2}Temp^2_{} + B_{i} + \epsilon_{ijk} \] y donde \(B_{j(k)}\) son los Cultivares que poseen las parcelas (j = 1 al 13 y k = 1 al 2) .

Luego, se analizaron los supuestos de homocedasticidad y normalidad de los residuos y de la variable de efectos aleatorios de los distintos modelos, y se preseleccionaron a los que utilizaban a la temperatura máxima y media.

## [1] 72 55
## 
##  Shapiro-Wilk normality test
## 
## data:  e
## W = 0.94146, p-value = 0.0001749
## [1] "Prueba de heterocedasticidad (Performance):"
## OK: Error variance appears to be homoscedastic (p = 0.936).

## [1] 3 2
## 
##  Shapiro-Wilk normality test
## 
## data:  be_k
## W = 0.94879, p-value = 0.5801

## [1] 72 27
## 
##  Shapiro-Wilk normality test
## 
## data:  e
## W = 0.94857, p-value = 0.0005055
## [1] "Prueba de heterocedasticidad (Performance):"
## OK: Error variance appears to be homoscedastic (p = 0.896).

## [1] 2 3
## 
##  Shapiro-Wilk normality test
## 
## data:  be_k
## W = 0.89347, p-value = 0.1088

En ambos modelos no hay evidencia para rechazar el supuesto de homocedasticidad, ni la normalidad de la variable de efectos aleatorios. Respecto a la normalidad de los residuos, habría evidencias para rechazar su buen ajuste a una distribución normal, pero se analizará con ANOVA, que es robusto frente a la falta de normalidad.

Luego, se realizó una selección de modelos comparando los AIC y las varianzas de cada uno, eligiendo aquel donde éstas sean menores:

##       df      AIC
## m_max  5 175.5068
## m_med  5 187.4767

Ya que el modelo de la regresión que utiliza a la temperatura máxima es aquel que posee un menor AIC y varianzas se decidió utilizar este, y se obtuvieron los siguientes resultados:

## [1] "#################### Summary ####################"
## Linear mixed model fit by REML. t-tests use Satterthwaite's method [
## lmerModLmerTest]
## Formula: Linolenic.Acid ~ poly(Tmx.IF.MF, 2) + (1 | Cultivar)
##    Data: df
## 
## REML criterion at convergence: 165.5
## 
## Scaled residuals: 
##     Min      1Q  Median      3Q     Max 
## -2.0065 -0.5824 -0.1113  0.4917  4.5500 
## 
## Random effects:
##  Groups   Name        Variance Std.Dev.
##  Cultivar (Intercept) 0.03597  0.1897  
##  Residual             0.26414  0.5139  
## Number of obs: 104, groups:  Cultivar, 13
## 
## Fixed effects:
##                      Estimate Std. Error        df t value Pr(>|t|)    
## (Intercept)           8.43260    0.07285  10.36069 115.756  < 2e-16 ***
## poly(Tmx.IF.MF, 2)1  -3.89498    0.52415  94.68959  -7.431 4.74e-11 ***
## poly(Tmx.IF.MF, 2)2  -4.94981    0.54361 100.97088  -9.105 8.39e-15 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Correlation of Fixed Effects:
##               (Intr) p(T.IF.MF,2)1
## p(T.IF.MF,2)1  0.000              
## p(T.IF.MF,2)2  0.000 -0.059
## [1] "#################### ANOVA ####################"
## Type III Analysis of Variance Table with Satterthwaite's method
##                    Sum Sq Mean Sq NumDF  DenDF F value    Pr(>F)    
## poly(Tmx.IF.MF, 2) 38.712  19.356     2 93.979  73.279 < 2.2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## [1] "('#################### Intervalo de confianza ####################')"
##                         2.5 %     97.5 %
## .sig01               0.000000  0.3546505
## .sigma               0.442571  0.5943491
## (Intercept)          8.284809  8.5803835
## poly(Tmx.IF.MF, 2)1 -4.975798 -2.8751856
## poly(Tmx.IF.MF, 2)2 -6.036832 -3.7585000

Pregunta 4:¿Cuál de los factores (cultivar o ambiente) aporta mayor variación al contenido de ácidos grasos del grano? ¿Existe interacción genotipo-ambiente? ¿Qué cultivar/es recomendaría en sentido amplio o sitio específico?

Para poder evaluar una posible interacción y notar la varianza epxplicada por una varaible se realizó un modelo aleatorio multiple con interacción aleatoria. El mismo luce de la siguiente manera:

\[ Ac.Grasos_{ijk} = \mu + A_{i} + B_{j(k)} + A_{i} * B_{j(k)} + \epsilon_{ijk} \]

donde \(\alpha_i\) es la localidad (i = 1 a 4), y donde \(B_{j(k)}\) son las parcelas anidadas en los cultivares (j = 1 al 13 y k = 1 al 2).

La prueba de supuesto sugieren que podemos seguir asumiendo la normalidad de todas las partes aleatorias. Esto puede verse en la Figura X.

## [1] 7 3
## 
##  Shapiro-Wilk normality test
## 
## data:  ref$Cultivar$`(Intercept)`
## W = 0.92224, p-value = 0.2689

## [1] 3 1
## 
##  Shapiro-Wilk normality test
## 
## data:  ref$Localidad$`(Intercept)`
## W = 0.91047, p-value = 0.4849

## [1] 40 24
## 
##  Shapiro-Wilk normality test
## 
## data:  ref$`Localidad:Cultivar`$`(Intercept)`
## W = 0.97767, p-value = 0.432

Figura X: QQ-plots para cada parte aleatoria. Arriba: Cultivaree. Medio: Localidad. Abajo: interacción Cultivares/Localidad.

En cuanto a los resultados, se puede ver que la interacción aleatoria resulta no significativa por lo que se decidió sacarla del modelo para poder estimar más precisamente los componentes de varianza explicada.

## ANOVA-like table for random-effects: Single term deletions
## 
## Model:
## Oil.content ~ (1 | Localidad) + (1 | Localidad:Cultivar) + (1 | Cultivar)
##                          npar  logLik    AIC     LRT Df Pr(>Chisq)    
## <none>                      5 -177.62 365.24                          
## (1 | Localidad)             4 -185.27 378.53 15.2895  1  9.223e-05 ***
## (1 | Localidad:Cultivar)    4 -178.03 364.05  0.8051  1    0.36957    
## (1 | Cultivar)              4 -180.30 368.61  5.3639  1    0.02056 *  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

El nuevo modelo ajustado sin la interacción fue el siguiente:

\[ Ac.Grasos_{ijk} = \mu + A_{i} + B_{j(k)} + \epsilon_{ijk} \]

La Prueba de supuestos, nuevamente sugieren que podemos seguir asumiendo normalidad como puede verse en la FIgura Y.

## [1] 7 3
## 
##  Shapiro-Wilk normality test
## 
## data:  ref$Cultivar$`(Intercept)`
## W = 0.9196, p-value = 0.2478

## [1] 3 1
## 
##  Shapiro-Wilk normality test
## 
## data:  ref$Localidad$`(Intercept)`
## W = 0.91179, p-value = 0.4919

Figura Y: QQ-plots del modelo aleatorio sin interacción. Arriba: Cultivar. Abajo: Localidades.

Los resultados del modelo pueden verse a continuación en la Figura K:

## [1] "#################### Summary ####################"
## Linear mixed model fit by REML. t-tests use Satterthwaite's method [
## lmerModLmerTest]
## Formula: Oil.content ~ (1 | Localidad) + (1 | Cultivar)
##    Data: df
## 
## REML criterion at convergence: 356
## 
## Scaled residuals: 
##      Min       1Q   Median       3Q      Max 
## -2.49520 -0.52264  0.04308  0.52252  2.74830 
## 
## Random effects:
##  Groups    Name        Variance Std.Dev.
##  Cultivar  (Intercept) 0.4924   0.7017  
##  Localidad (Intercept) 0.8082   0.8990  
##  Residual              1.6953   1.3020  
## Number of obs: 99, groups:  Cultivar, 13; Localidad, 4
## 
## Fixed effects:
##             Estimate Std. Error      df t value Pr(>|t|)    
## (Intercept)  47.0673     0.5071  4.0461   92.81 6.89e-08 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## [1] "#################### LRT ####################"
## ANOVA-like table for random-effects: Single term deletions
## 
## Model:
## Oil.content ~ (1 | Localidad) + (1 | Cultivar)
##                 npar  logLik    AIC     LRT Df Pr(>Chisq)    
## <none>             4 -178.03 364.05                          
## (1 | Localidad)    3 -188.62 383.25 21.1979  1  4.142e-06 ***
## (1 | Cultivar)     3 -182.70 371.40  9.3507  1   0.002229 ** 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
  Oil.content
Predictors Estimates CI p
(Intercept) 47.07 45.67 – 48.47 <0.001
Random Effects
σ2 1.70
τ00 Cultivar 0.49
τ00 Localidad 0.81
ICC 0.43
N Localidad 4
N Cultivar 13
Observations 99
Marginal R2 / Conditional R2 0.000 / 0.434
## [[1]]

## 
## [[2]]

Figura K: Gráficos de intercepto aleatorio. Arriba: Cultivares. Abajo: Localidades.

Se puede observar que ambas variables resultan significativas para explicar la variabilidad de los ácidos grasos en el aceite de colza. Sin embargo existe una diferencia en cuanto a la cantidad de variabilidad explicada por cada una de las variables. Puede verse que la variabilidad explicada por los Cultivares es de 0.4924 mientras que la de localidad es de 0.8082 con una varianza residual de 1.6953. Con esta información se computaron los componentes de varianza que dieron de la siguiente manera:

  • Cultivares: explican un 16.43% de la variabilidad en ácidos grasos
  • Localidades: explican un 26.97 de la variabilidad en ácidos grasos
  • Residual: 56.58% de variabilidad no explicada por el modelo

Para resumir, el modelo indica que las localidades aportan una mayor variación al contenido de acidos grasos y lo hace sin interaccionar con los cultivares. Es por este motivo que no es posible recomendar un cultivar en sentido amplio sino que la productividad está supeditada más bien al ambiente, es decir, a la localidad en la cual se desarrolla la plantación.