Resumen Ejecutivo

El sector forestal en Chile es el tercero en la economía nacional después de la minería y los productos agroalimentarios. Las especies leñosas Quillaja saponaria (Eucalipto) y Quillaja saponaria (Quillay) representan opciones productivas reconocidas por los pequeños y medianos propietarios, y apicultores, respectivamente, sin embargo, en el último tiempo se ha evidenciado una pérdida progresiva de adaptabilidad de estas especies a las condiciones ambientales cambiantes en la Región del Bío Bío. El Mejoramiento Genético Forestal, es una rama de la silvicultura, la cual tiene como objetivo mejorar atributos de interés de los cultivos forestales, a través de la selección de genotipos de mejor adaptabilidad, productividad y calidad de productos forestales madereros y no madereros. No obstante, para la mayoría de las especies forestales, un ciclo de mejoramiento tradicional requiere entre 10 y 15 años para seleccionar los mejores fenotipos, representando un alto costo en logística, evaluación y análisis de ensayos.

El empleo de las modernas técnicas tales como Mutagénesis y Selección Genómica, representan un marco de estudio innovador que permitiría seleccionar genotipos en el corto plazo, lo que podrían tener gran importancia en el nuevo escenario mundial de cambio climático, el cual afecta la productividad de suelos de aptitud forestal de la Región del Bío Bío, actualmente improductivos y en manos principalmente de pequeños y medianos propietarios. El uso de estas herramientas aún es incipiente en el mejoramiento y la conservación genética forestal en Chile, razón por la cual el estudio técnico-científico de su aplicabilidad en especies de rápido crecimiento, tales como Eucalyptus y Quillay, pueden significar un gran avance el aumento de la adaptación, productividad y calidad, y representa un punto de partida para su posterior aplicación a otras especies con distintos propósitos. La presente propuesta busca disminuir las brechas relacionadas con la disminución de la adaptabilidad, productividad y calidad de productos forestales dada carencia de materia genético idóneo y el limitado acceso del grupo objetivo a nuevas tecnologías que le permitan hacer frente a los efectos negativos del cambio climático. Cabe mencionar que esta propuesta está alineada con el “Plan de Adaptación al Cambio Climático del Sector Silvoagropecuario” liderado por el Ministerio del Medio Ambiente el cual considera las innovaciones tecnológicas y del fortalecimiento de la investigación y desarrollo, como elementos determinantes para aumentar la productividad y el crecimiento y satisfacer en mejor forma las exigencias de los mercados, la presente propuesta es una acción directa a las medidas N° 11 “Desarrollar programas de mejoramiento genético para cultivos agrícolas vulnerables al cambio climático, usando herramientas convencionales y moleculares de última generación” y N° 12 “Desarrollar un programa de conservación genética ex situ de recursos forestales para la adaptación al cambio climático”.

Objetivo

Aumentar la productividad y la competitividad del sector forestal chileno, especialmente en la Región del Bío Bío, a través de la investigación con nuevas herramientas de mejoramiento genético forestal para mitigar los efectos del Cambio Climático

Resultados Esperados

  • Aumentar la disponibilidad de material genético mejorado de Quillaja saponaria y Quillaja saponaria para el uso por pequeños y medianos propietarios forestales, apicultores y viveros forestales de la Región del Bío Bío para fines de plantación, restauración y rehabilitación de suelos degradados.
  • Diseñar un Programa de Mejoramiento Genético de corto y mediano plazo de Quillaja saponaria y Quillaja saponaria utilizando Mutagénesis y Selección genómica que permitan poner en producción suelos de aptitud forestal de la Región del Bío Bío, actualmente improductivos y en manos principalmente de pequeños y medianos propietarios
  • Transferir nuevas tecnologías de vanguardia a pequeños y medianos propietarios forestales, y apicultores sin acceso, que le permitan adoptar prácticas silviculturales resilientes al clima, mejorando las oportunidades de generar negocios sustentables y sostenibles en la producción forestal maderera y no maderera (mieles, saponinas, y otros elementos químicos de uso farmacológico), ayudando al grupo objetivo aumentar sus ingresos.
  • Transferir nuevas herramientas tecnológicas relacionadas con el mejoramiento genético forestal a profesionales del sector público y privado que desarrollan transferencia tecnológica y capacitación a pequeños y medianos propietarios forestales y apicultores (INDAP, CONAF, SAG, Consultores Privados).

Metodología

Colecta de Material de terreno de Quillaja saponaria

Quillaja saponaria: la cosecha de esta especie, incluyo semillas de árboles de Sector Las Ciénagas, comuna de Los Ángeles. Esta semilla fue enviada a los investigadores de CCHEN (Comisión Chilena de Energía Nuclear) para dar inicio a los estudios dosimétricos que determinarán los límites de irradiación.

Árboles de *Quillaja saponaria* colectados Región del Bío- Bío
Árboles de *Quillaja saponaria* colectados Región del Bío- Bío

(Pre-siembra) Estimación parámetros de Semillas de Quillaja saponaria

I. Estimación de la Pureza de los lotes colectados de Quillaja saponaria

Para determinar la pureza, se tomaron \(n = 3\) muestras de los lotes, cada una con un peso inicial de \(m_i = 1\) gramo. Después de limpiar cada muestra, se registró su peso final \(m_f\). La pureza de cada muestra \(P_i\) se calculó como:

\[ P_i = \frac{m_f}{m_i} \times 100\% \]

El promedio de la pureza de las tres muestras se calculó como:

\[ \text{Pureza promedio} = \frac{1}{n} \sum_{i=1}^{n} P_i \]

El gráfico presenta las medias de pureza de cada lote individual, con una línea roja que representa la media general de todos los lotes.

II. Número de semillas por Kilo de los lotes colectados de Quillaja saponaria

Para esta parte de la caracterización, se tomaron \(n = 3\) muestras de \(200\) semillas \(j\) para cada lote \(i\) a analizar.

La fórmula para determinar el número total de semillas por kilo en cada lote es:

Para cada lote \(i\):

\[ \text{Promedio de semillas por kilo}_{i} = \frac{1}{n} \sum_{j=1}^{n} \frac{200}{peso_{i,j}} \]

donde \(peso_{i,j}\) es el peso de las 200 semillas en kilogramos para la muestra \(j\) del lote \(i\).

III. Capacidad germinativa de semillas de los lotes colectados de Quillaja saponaria

Para este estudio, se tomaron \(n = 3\) muestras de \(100\) semillas para todos los lotes\(i\) a analizar. Las semillas vanas identificadas mediante el método de flotación, se contabilizaron y descontaron del total, luego se calculó el promedio por lotes.

La fórmula para el cálculo del promedio de semillas efectivas para cada lote \(i\):

\[ \text{Promedio de viabilidad de lotes}_{i} = \frac{1}{n} \sum_{j=1}^{n} (100 - \text{semillas vanas}_{i,j}) \]

donde \(\text{semillas vanas}_{i,j}\) es el número de semillas vanas en la muestra \(j\) del lote \(i\).

IV. Energía germinativa de semillas de los lotes colectados de Quillaja saponaria

Se montó un ensayo germinativo para las distintas muestras luego de aplicar el Dosis correspondiente, generando 3 réplicas de 100 semillas por lote\(i\). Diariamente, se monitorearon y eliminaron las semillas germinadas. El criterio para considerar una semilla como germinada fue tener la radícula mayor a 2 mm.

El grafico muestra las medias de germinación por lote\(i\)

(Post siembra) Ensayo de sobrevivencia Quillaja saponaria

V. Estimación sobrevivencia media por vivero

Se evaluó conjuntamente con INFOR y CCHEN la supervivencia de las plantas de Quillaja saponaria. Se sembraron las semillas irradiadas en los viveros tanto en la Región Metropolitana (CCHEN) como en la Región del Biobío (INFOR). Se efectuaron 4 repeticiones de 50 semillas por cada especie, irradiadas con dosis gamma de 0 Gy, 50 Gy, 100 Gy, 150 Gy, 200 Gy, 250 Gy y 350 Gy.

Las dosis LD30 y LD50, en este nuevo enfoque, se determinarían a partir del 70% y 50% de supervivencia respectivamente, considerando como supervivientes aquellas plantas que lograron desarrollar hasta el segundo par de hojas verdaderas en un tiempo predeterminado.

  • Sobrev_rel: Frecuencia relativa de la sobrevivencia. Para determinarla, se empleó el máximo de plantas de los Dosis de control como referencia. En el caso del Quillay, el máximo es de 40 plantas (100%), mientras que para el Eucalypto es de 42 plantas (100%).

  • Sobrev_ta: Frecuencia relativa de la sobrevivencia con una transformación angular. Estas transformaciones se utilizan para estabilizar las varianzas en datos de proporciones o porcentajes, facilitando así su análisis y interpretación en contextos estadísticos.

    \[ \theta = \arcsin\left(\sqrt{\frac{p}{100}}\right) \]

    donde:

    - \( p \) es el porcentaje de supervivencia.

    - \(\theta\) es el valor transformado angularmente de la supervivencia.

Los resultados de la evaluación en dos viveros, CCHEN e INFOR, muestran las siguientes medias y desviaciones estándar de las tasas de sobrevivencia:

En el vivero CCHEN, la media de sobrevivencia es de 83.4% con una desviación estándar de 0.178%, mientras que en el vivero INFOR, la media de sobrevivencia es de 39.7% con una desviación estándar de 0.32%.

En conlusion, la sobrevivencia fue mayor en el vivero ubicado en la Región Metropolitana que en la Región del Biobío. :::

El análisis estadístico realizado para comparar la supervivencia de plantas entre los viveros CCHEN e INFOR se realizo mediante la prueba de U de Mann-Whitney, ya que los datos no cumplieron con la suposición de normalidad necesaria para la prueba t de Student.

Los resultados de la prueba de U de Mann-Whitney muestran una diferencia significativa en la supervivencia entre los viveros CCHEN e INFOR (p-value < 0.001). Indicando que existe una diferencia significativa en las medianas de la supervivencia entre los dos viveros.

VI. Estimación sobrevivencia media por dosis

Los resultados sugieren que, aunque el efecto de la radiación gamma en la supervivencia de plántulas de Quillaja saponaria puede variar entre viveros, hay una tendencia general de disminución de la supervivencia con el aumento de la dosis de radiación, especialmente en dosis altas (≥150 Gy) en el caso de CCHEN y (≥100 Gy) para INFOR. La diferencia en las respuestas entre los viveros podría deberse a variaciones en las condiciones ambientales, manejo o la variabilidad genética de las plántulas.

Se utilizó la prueba de Shapiro-Wilk para evaluar la normalidad de los datos de Sobrevivencia en función de diferentes Dosis en dos estudios, CCHEN e INFOR.

  • CCHEN: Los datos siguen una distribución normal en todos los grupos, excepto en el grupo de plantas sometidas a 200Gy, donde el valor p = 0.03. Por lo tanto, los resultados de las ANOVA deben interpretarse con precaución!

  • INFOR: Los datos siguen una distribución normal en todos los grupos, excepto en el grupo de plantas sometidas a 250Gy, donde el valor p = <0.01. Por lo tanto, los resultados de las ANOVA deben interpretarse con precaución!

Homogenegenidad de varianzas (Prueba de Levene)

  • CCHEN: Las varianzas son homogéneas entre los grupos

  • INFOR: las varianzas son homogéneas entre los grupos

VII. Análisis de varianza Sobrevivencia Vivero CCHEN | Especie : Quillaja saponaria

i. Análisis de varianza (ANOVA) Vivero CCHEN

Los resultados del análisis de varianza (ANOVA) para la supervivencia de plántulas de Quillaja saponaria en el vivero CCHEN, bajo diferentes dosis de radiación, no indican una diferencia significativa (p > 0.05). Sin embargo, con un nivel de significancia más alto (p < 0.1), se observa una diferencia significativa. Esto sugiere que, bajo los criterios convencionales, las diferentes dosis de radiación no tienen un efecto significativo en la supervivencia de las plántulas. No obstante, considerando un alfa más alto, podría haber indicios de un efecto. Estos resultados pueden compararse con otros estudios que utilicen diferentes niveles de alfa para interpretar la significancia de los efectos observados.

La comparación de cada Dosis con el control (0Gy) se realizó mediante la prueba de Dunnett, esta prueba es especialmente útil cuando se desea determinar si varios tratamientos tienen efectos significativamente diferentes del control sin inflar el error tipo I (falsos positivos), que puede ocurrir cuando se realizan múltiples comparaciones.

Todas las Dosis NO mostraron diferencias significativas en la supervivencia respecto al control

##             Df Sum Sq Mean Sq F value Pr(>F)  
## Dosis        1 0.1046 0.10462   3.295 0.0795 .
## Residuals   30 0.9526 0.03175                 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## La ANOVA es significativa (p < 0.1)

ii. Análisis de Kruskall Wallis (KS) Vivero CCHEN

Los resultados del análisis de rangos no paramétrico indican las diferentes dosis de radiación no tienen un efecto significativo en la supervivencia relativa de las plántulas de Quillaja saponaria. Estos resultados pueden ser comparados con otros estudios similares para confirmar si las diferentes dosis de radiación suelen no tener un impacto significativo en la supervivencia relativa de plántulas bajo condiciones similares.

Esta homogeneidad en los rangos se comprobó empíricamente usando una prueba pos hoc, específicamete la prueba de Dunn, ajustada con el método de Bonferroni. Los resultados confirman que no hay diferencias significativas en la supervivencia de las plántulas de Quillaja saponaria entre las diferentes dosis de radiación gamma en el vivero CCHEN. Todas las comparaciones muestran valores p ajustados mayores que 0.05, lo que sugiere que las dosis aplicadas no tienen un efecto significativo en la supervivencia relativa de las plántulas.

Aunque algunas comparaciones, como entre 200Gy y 350Gy, presentan valores p unadjusted menores a 0.05, estos no se mantienen significativos tras la corrección de Bonferroni.

## 
##  Kruskal-Wallis rank sum test
## 
## data:  sobrev_rel by Dosis
## Kruskal-Wallis chi-squared = 7.2474, df = 7, p-value = 0.4036
## La prueba de Kruskal-Wallis no es significativa (p >= 0.1)

VIII. Análisis de varianza Sobrevivencia Vivero INFOR | Especie : Quillaja saponaria

i. Análisis de varianza (ANOVA) Vivero INFOR

Los resultados del análisis de varianza (ANOVA) para la supervivencia de plántulas de Quillaja saponaria en el vivero INFOR, bajo diferentes dosis de radiación, indican una diferencia significativa (p < 0.05). Esto sugiere que las diferentes dosis de radiación aplicadas tienen un efecto significativo en la supervivencia de las plántulas.

La comparación de cada Dosis con el control (0 Gy) se realizó mediante la prueba de Dunnett. A partir de los Dosis de 150 Gy en adelante se observa una diferencia significativa en la supervivencia comparada con el control (0 Gy).

En particular, la dosis de 50 Gy mostró un pequeño aumento en la supervivencia comparado con el control. Aunque esta diferencia no es significativa, sugiere una posible tendencia a un efecto hormético o biopositivo para la especie, lo cual debería estudiarse más a fondo.

A medida que las dosis aumentan, la supervivencia de las plántulas disminuye notablemente. A 150 Gy, la media de supervivencia es de 47%, y esta disminución continúa hasta alcanzar una media de 0.0000 a 350 Gy. Este patrón de disminución refleja el efecto adverso de las altas dosis de radiación en la supervivencia de las plántulas de Quillaja saponaria.

##             Df Sum Sq Mean Sq F value   Pr(>F)    
## Dosis        1 2.8776  2.8776   257.9 2.82e-16 ***
## Residuals   30 0.3347  0.0112                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## La ANOVA es significativa (p < 0.05)

ii. Análisis de Kruskall Wallis (KS) Vivero INFOR

## 
##  Kruskal-Wallis rank sum test
## 
## data:  sobrev_rel by Dosis
## Kruskal-Wallis chi-squared = 29.564, df = 7, p-value = 0.0001141
## La prueba de Kruskal-Wallis es significativa (p < 0.05)

IX. Modelos lineales para ajuste de dosis LD50 y LD30

Para la estimación de las dosis, se procedió a modelar la variable sobrevivencia utilizando dos enfoques: un modelo lineal y un modelo logístico. En el caso de datos de conteos y proporciones, se recomienda el uso de modelos logísticos. Estos modelos son adecuados porque permiten modelar directamente las probabilidades de un evento, facilitando la interpretación de los resultados en términos de odds ratios. Además, los modelos logísticos manejan mejor la variabilidad en los datos de conteos y proporciones, proporcionando estimaciones más robustas y precisas al no asumir una relación lineal constante.

Los valores de las LD50 (dosis letal media) variaron según el modelo utilizado, al igual que la varianza explicada y los coeficientes específicos de cada tipo de modelo. Los modelos se aplicaron de manera individual en cada vivero para evaluar la variabilidad intraespecífica.

i. Modelo Lineal Quillaja saponaria | Vivero = CCHEN
## 
## Call:
## lm(formula = sobrev_rel ~ Dosis, data = data_quillay_cchen)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -0.59295 -0.06994  0.02484  0.10938  0.22825 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  0.9214744  0.0575110  16.023    3e-16 ***
## Dosis       -0.0004991  0.0002750  -1.815   0.0795 .  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.1782 on 30 degrees of freedom
## Multiple R-squared:  0.09896,    Adjusted R-squared:  0.06892 
## F-statistic: 3.295 on 1 and 30 DF,  p-value: 0.07951
ii. Modelo Lineal Quillaja saponaria | Vivero = INFOR
## 
## Call:
## lm(formula = sobrev_rel ~ Dosis, data = data_quillay_infor)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -0.18803 -0.07078 -0.01816  0.06143  0.23023 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  0.854701   0.034093   25.07  < 2e-16 ***
## Dosis       -0.002618   0.000163  -16.06 2.82e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.1056 on 30 degrees of freedom
## Multiple R-squared:  0.8958, Adjusted R-squared:  0.8923 
## F-statistic: 257.9 on 1 and 30 DF,  p-value: 2.821e-16
iii. Modelo Lineal Quillaja saponaria | Vivero = AMBOS
## 
## Call:
## lm(formula = sobrev_rel ~ Dosis, data = data_quillay)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -0.42159 -0.24334  0.00984  0.20314  0.63168 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  0.8880876  0.0666766  13.319  < 2e-16 ***
## Dosis       -0.0015583  0.0003188  -4.888 7.53e-06 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.2922 on 62 degrees of freedom
## Multiple R-squared:  0.2782, Adjusted R-squared:  0.2666 
## F-statistic:  23.9 on 1 and 62 DF,  p-value: 7.526e-06
iv. Conclusiones Modelos Lineales
Sobrevivencia de plantulas

Los resultados de la evaluación de la sobrevivencia relativa bajo diferentes Dosis de radiación gamma en Quillaja saponaria muestran una tendencia a disminuir en dosis superiores a 150 Gy.

Modelo lineal para Quillaja sapoanria - CCHEN
  • Parámetros: El modelo lineal ajustado para Quillaja saponaria muestra que la relación entre Dosis y Sobrevivencia NO es estadísticamente significativa al nivel del 5% (p = 0.06). El intercepto es 0.92, lo que indica que sin Dosis (Dosis = 0), la sobrevivencia relativa promedio es aproximadamente 92%%. Sin embargo, la pendiente negativa sugiere que hay una ligera tendencia decreciente en la sobrevivencia relativa con el aumento de la dosis.

  • R-cuadrado: El valor de R-cuadrado ajustado es 0.06892, indicando que aproximadamente el 7% de la variabilidad de la Sobrevivencia_rel se explica por las Dosis.

Modelo para Quillaja saponaria - INFOR
  • Parámetros: El modelo lineal ajustado para Quillaja saponaria muestra una relación estadísticamente significativa entre las Dosis y la Sobrevivencia_rel (p < 0.001). El intercepto es 0.8880, indicando que sin Dosis (Dosis = 0), la sobrevivencia relativa promedio es aproximadamente 88.88%, un poco mas bajo que los valores vistos en el vivero CCHEN. La pendiente del modelo al igual que en CCHEN es negativa (-0.00243) sugiere que la sobrevivencia relativa disminuye con el aumento del Dosis.

  • R-cuadrado: El valor de R-cuadrado ajustado es 0.8923, indicando que aproximadamente el 89.23% de la variabilidad en la Sobrevivencia se explica por el Dosis.

Modelo para Quillaja saponaria (ambos viveros)
  • Parámetros: El modelo lineal ajustado para ambos viveros también muestra una relación estadísticamente significativa entre las Dosis y la Sobrevivencia_rel (p < 0.001). El intercepto es 0.8264, indicando que sin Dosis (Dosis = 0), la sobrevivencia relativa promedio es aproximadamente 82.64%. La pendiente negativa (-0.00145) sugiere una disminución en la sobrevivencia relativa con el aumento de las Dosis.

  • R-cuadrado: El valor es de 0.2639, indicando que aproximadamente el 26.39% de la variabilidad en la Sobrevivencia se explica por el Dosis.

Comparación de Modelos

  • Significancia: El modelo ajustado para data_quillay_infor muestra la relación más significativa entre las Dosis y Sobrevivencia_rel (p < 0.001), seguido por el modelo para ambos viveros. El modelo para data_quillay_cchen no muestra una relación significativa (p = 0.0836).

  • R-cuadrado Ajustado: El modelo para data_quillay_infor tiene el R-cuadrado ajustado más alto (0.8923), lo que indica que explica mejor la variabilidad en la sobrevivencia relativa en comparación con los otros dos modelos. Al comparar las LD50 generadas por ambos viveros, 121 Gy y 136 Gy para CCHEN e INFOR respectivamente, notamos que sin bien los datos muestran diferencias las LD50 se fijan cercanas.

La fusion de ambos datos para calcular la LD50 termina en un sobreajuste de la dosis.

X. Modelos logísticos para ajuste de dosis LD50 y LD30

i. Modelo logístico Quillaja saponaria | Vivero = CCHEN

Se opta por el modelo logit (binomial con enlace logit) debido a que este modelo es más comúnmente utilizado y aceptado en estudios biológicos, lo que facilita la comparación de nuestros resultados con otros estudios en la literatura.

Además, los coeficientes del modelo logit se interpretan en términos de odds ratios, proporcionando una interpretación clara y directa del efecto de los Dosis sobre la probabilidad de supervivencia.

## 
## Call:
## glm(formula = cbind(plantas, 42 - plantas) ~ Dosis, family = binomial, 
##     data = data_quillay_cchen)
## 
## Coefficients:
##               Estimate Std. Error z value Pr(>|z|)    
## (Intercept)  1.7578353  0.1319535  13.322   <2e-16 ***
## Dosis       -0.0027391  0.0005864  -4.671    3e-06 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 215.60  on 31  degrees of freedom
## Residual deviance: 193.25  on 30  degrees of freedom
## AIC: 309.24
## 
## Number of Fisher Scoring iterations: 4
ii. Modelo logístico Quillaja saponaria | Vivero = INFOR
## 
## Call:
## glm(formula = cbind(plantas, 42 - plantas) ~ Dosis, family = binomial, 
##     data = data_quillay_infor)
## 
## Coefficients:
##               Estimate Std. Error z value Pr(>|z|)    
## (Intercept)  1.6092885  0.1263199   12.74   <2e-16 ***
## Dosis       -0.0140092  0.0007723  -18.14   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 592.914  on 31  degrees of freedom
## Residual deviance:  80.494  on 30  degrees of freedom
## AIC: 185.19
## 
## Number of Fisher Scoring iterations: 4
iii. Modelo logístico Quillaja saponaria | Vivero = Ambos
## 
## Call:
## glm(formula = cbind(plantas, 42 - plantas) ~ Dosis, family = binomial, 
##     data = data_quillay)
## 
## Coefficients:
##               Estimate Std. Error z value Pr(>|z|)    
## (Intercept)  1.4469750  0.0821826   17.61   <2e-16 ***
## Dosis       -0.0063729  0.0003804  -16.75   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 1283.99  on 63  degrees of freedom
## Residual deviance:  970.38  on 62  degrees of freedom
## AIC: 1187.1
## 
## Number of Fisher Scoring iterations: 4

iv. Conclusiones de los Modelos Logísticos

Sobrevivencia de Plántulas

En todos los modelos, la dosis es altamente significativa (valor p < 0.001), lo que indica que hay una fuerte relación entre la dosis y la probabilidad de supervivencia de las plantas.

Modelo logistico para data_quillay_cchen

El modelo logístico para data_quillay_cchen muestra que la variable Dosis tiene un efecto significativo en la sobrevivencia de las plántulas.

El Intercepto = 1.7578, nos dice el valor inicial de la supervivencia cuando la dosis es cero. En términos de probabilidad, esto equivale a una supervivencia inicial del 85.29%. Este valor se obtiene al transformar el intercepto usando la fórmula de la función logística inversa:

\[ \text{Probabilidad} = \frac{1}{1 + e^{-\text{Intercepto}}} \approx \frac{1}{1 + e^{-1.7578}} \approx 0.8529 \, (85.29\%) \]

Una unidad adicional de dosis reduce la probabilidad de supervivencia en aproximadamente un 0.02%.

El modelo tiene una devianza nula de 215.60 con 31 grados de libertad y una devianza residual de 193.25 con 30 grados de libertad. El AIC del modelo es 309.24. El número de iteraciones de Fisher Scoring fue 4.

Modelo para data_quillay_infor

El modelo logístico para data_quillay_infor muestra que la variable Dosis tiene un efecto significativo en la sobrevivencia de las plántulas.

El Intercepto = 1.609, nos dice el valor inicial de la supervivencia cuando la dosis es cero. En términos de probabilidad, esto equivale a una supervivencia inicial del 83.82%. Este valor se obtiene al transformar el intercepto usando la fórmula de la función logística inversa:

\[ \text{Probabilidad} = \frac{1}{1 + e^{-\text{Intercepto}}} \approx \frac{1}{1 + e^{-1.609}} \approx 0.8332 \, (83.32\%) \]

Una unidad adicional de dosis reduce la probabilidad de supervivencia en aproximadamente un 0.17%.

El modelo tiene una devianza nula de 592.914 con 31 grados de libertad y una devianza residual de 80.494 con 30 grados de libertad. El AIC del modelo es 185.19. El número de iteraciones de Fisher Scoring fue 4.

:::

Modelo para ambos viveros

El modelo logístico para Ambos viveros muestra que la variable Dosis tiene un efecto significativo en la sobrevivencia de las plántulas.

El Intercepto = 1.446, nos dice el valor inicial de la supervivencia cuando la dosis es cero. En términos de probabilidad, esto equivale a una supervivencia inicial del 81.052%. Este valor se obtiene al transformar el intercepto usando la fórmula de la función logística inversa:

\[ \text{Probabilidad} = \frac{1}{1 + e^{-\text{Intercepto}}} \approx \frac{1}{1 + e^{-1.446975}} \approx 0.8105 \, (81.05\%) \]

Una unidad adicional de dosis reduce la probabilidad de supervivencia en aproximadamente un 0.05%.

El modelo tiene una devianza nula de 1283.99 con 63 grados de libertad y una devianza residual de 970.38 con 62 grados de libertad. El AIC del modelo es 1187.1. El número de iteraciones de Fisher Scoring fue 4.

Comparación de Modelos

Al comparar los tres modelos logísticos, se observa que todos indican una relación significativa entre Dosis y la sobrevivencia de las plántulas. Sin embargo, el impacto de Dosis varía entre los viveros, siendo más fuerte en Vivero INFOR con un coeficiente más negativo (-0.0140) en comparación con Vivero CCHEN (-0.0027) y el modelo combinado (-0.0064). Esto sugiere que la respuesta a Dosis puede diferir dependiendo del vivero específico.

Los modelos logísticos para los datos de data_quillay_cchen, data_quillay_infor, y el modelo combinado, proporcionan una base para estimar las dosis letales DL50 y DL30. Para cada uno de estos modelos, se pueden calcular las dosis específicas donde la probabilidad de sobrevivencia es del 50% (DL50) y del 30% (DL30).

Dosis letales para la especie Quillaja saponaria:

LD50 [90.0 - 136.3]

LD30[17.80 - 88.04]

XI. Modelos multivariados para ajustes de dosis LD50 y LD30

XII. Fenotipificación de plantas | vivero : INFOR

Las estimaciones de la LD50 y LD70 en experimentos de mutagénesis pueden ser precisadas o mejoradas su capacidad predictiva al considerar otras variables morfológicas, como altura, raíces y número de hojas. De las cuatro bandejas, cada una con 50 plántulas para cada dosis, se tomaron muestras aleatorias para calcular las medias de estas y otras variables morfológicas. Con estos experimentos, se realizo un análisis de componentes principales (PCA) para identificar las principales variables morfológicas que contribuyen a la variabilidad observada en la respuesta a las dosis. Los resultados obtenidos se presentan a continuación:

I. Analisis de Componenetes Principales | INFOR

El análisis de componentes principales (PCA) se realizó para caracterizar fenotípicamente las plantas mediante mediciones morfológicas.

Se seleccionaron tres componentes principales que explicaron la mayor parte de la varianza en los datos. La varianza explicada por cada componente fue del 52.26%, 28.98% y 9.54%, respectivamente, sumando una varianza acumulada del 90.78%.

Los valores propios asociados a estos componentes fueron 2.613 para el primer componente, 1.449 para el segundo y 0.477 para el tercero. Es decir, los dos primeros componentes pueden ser utilizados en modelos.

## 
## Results for PCA decomposition (class pcares)
## 
## Major fields:
## $scores - matrix with score values
## $T2 - matrix with T2 distances
## $Q - matrix with Q residuals
## $ncomp.selected - selected number of components
## $expvar - explained variance for each component
## $cumexpvar - cumulative explained variance
## 
## Summary for PCA model (class pca)
## Type of limits: ddmoments
## Alpha: 0.05
## Gamma: 0.01
## 
##        Eigenvals Expvar Cumexpvar Nq Nh
## Comp 1     2.613  52.26     52.26  2  2
## Comp 2     1.449  28.98     81.24  4  3
## Comp 3     0.477   9.54     90.78  3  5

II. Varianza explicada

La varianza acumulada de los 3 primeros componentes es de 94.85%.

III. Búsqueda de outlier

No se encontraron valores atípicos en la base de datos

IV. Visualización de Scores

El análisis de componentes principales (PCA) revela que los dos primeros componentes principales explican el 81.24% de la variabilidad total, con Comp 1 representando el 52.26% y Comp 2 el 28.98%. El PCA muestra una clara separación por dosis aplicada a las plántulas, donde las dosis más bajas (grises) se agrupan en la parte izquierda del gráfico, las dosis medias (verde a naranja) están más dispersas, y las dosis más altas (rojas) se concentran en la parte derecha.

El segundo componente principal (CP2) es particularmente efectivo para diferenciar las dosis de Dosis, explicando el 28.98% de la variabilidad. Las dosis más altas (200 Gy y 250 Gy) se agrupan en la parte derecha del gráfico de scores, mientras que las dosis más bajas se agrupan en la parte izquierda. CP2 está fuertemente influenciado por la supervivencia relativa, que tiene una carga negativa muy alta. Esto sugiere que Comp 2 captura variaciones significativas relacionadas con la Dosis sobre la supervivencia, mientras que las otras variables morfológicas tienen cargas menores.

El primer componente principal (CP1) captura la variabilidad entre las características areas y subterránea de las plantas. Las cargas negativas el numero medio de hojas y altura media, junto con las cargas positivas de número de raices y largo medio de raiz principal, sugieren una relación inversa entre estas características. Este análisis destaca cómo las dosis influyen en las características morfológicas de las plántulas, proporcionando una visión clara de los efectos de las dosis en los experimentos de mutagénesis.

V. Visualización de loading

El gráfico de correlación muestra la relación entre las variables morfológicas (media_hojas, media_altura, media_raices, media_raizp, sobrev_rel) y los componentes principales (Comp 1, Comp 2, Comp 3). Las correlaciones se indican por el tamaño y color de los círculos: círculos más grandes y más oscuros indican una mayor correlación, mientras que el color azul indica una correlación positiva y el color rojo indica una correlación negativa.

Comp 1 presenta fuertes correlaciones negativas con todas las variables morfológicas, especialmente con media_hojas (-0.81) y media_altura (-0.82). Esto sugiere que Comp 1 captura variabilidad opuesta a estas variables, donde plántulas con mayores valores en estas variables tienden a tener menores valores en Comp 1.

Comp 2 muestra correlaciones positivas significativas con las variables relacionadas con las raíces (media_raices (0.65) y media_raizp (0.69)), y correlaciones negativas con media_altura (-0.41) y sobrev_rel (-0.58). Esto indica que Comp 2 captura variabilidad relacionada con las raíces en oposición a la altura y la supervivencia relativa.

Comp 3 no muestra correlaciones fuertes con ninguna de las variables originales, pero tiene correlaciones moderadas con media_hojas (-0.51) y sobrev_rel (0.39). Esto sugiere que Comp 3 podría estar capturando variabilidad adicional que no está fuertemente relacionada con las variables morfológicas medidas.

VI. Modelación multivariada

Para modelar la supervivencia de las plantas, se utilizó un enfoque multivariado con el fin de reducir la dimensionalidad de los datos y capturar la variabilidad más significativa, incluyendo otras variables además de sobrevivencia.

El PCA reveló que el segundo componente principal explicaba el 22.31% de la varianza de los datos, mostrando una fuerte correlación con la sobrevivencia de las plantas. Por lo tanto, se seleccionó el segundo componente principal para modelar la supervivencia.

El modelo mostró que la dosis de radiación tenía un efecto significativo sobre el segundo componente (p < 0.001), explicando el 59.29% de la variabilidad en este componente (R² ajustado = 0.5743). Esto indica que la dosis de radiación es un predictor significativo de las variaciones capturadas por el segundo componente principal.

Sin embargo solo se logra el aumento de 1% en la varianza explicada en relacion al modelo bivariado entre sobrevivencia y Dosis, el cual lograba un 56%, por ello se concluye que las variables morfologicas más la la sobrevivencia en un enfoque multivariado, no ayuda a mejorar la estimación de las LDs.

## 
## Call:
## lm(formula = Comp.1 ~ Dosis, data = combined_df)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -2.2242 -1.2663  0.0568  0.9613  1.7830 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -1.476126   0.460954  -3.202 0.004109 ** 
## Dosis        0.011809   0.003045   3.878 0.000811 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 1.274 on 22 degrees of freedom
## Multiple R-squared:  0.4061, Adjusted R-squared:  0.3791 
## F-statistic: 15.04 on 1 and 22 DF,  p-value: 0.0008113

Para analizar los resultados del análisis de componentes principales (PCA) y la relación con la dosis aplicada, se realizó el siguiente procedimiento:

Primero, se extrajeron los scores del PCA y se convirtieron en un dataframe llamado scores_df. Paralelamente, las dosis (subset_unidas_y) también se convirtieron en un dataframe (dosis_df). Estos dataframes se combinaron en combined_df para su posterior análisis.

A continuación, se calculó la mediana (p50) y el percentil 30 (p70) del primer componente principal (Comp.1). Posteriormente, se ajustó un modelo de regresión lineal para predecir Comp.1 en función de la dosis (Dosis).

El resumen del modelo de regresión lineal muestra que el intercepto es -1.4761 con un error estándar de 0.4610, y el coeficiente de la dosis es 0.0118 con un error estándar de 0.0030. Ambos coeficientes son altamente significativos (valor p < 0.01), indicando una fuerte relación entre la dosis y Comp.1.

Las estadísticas del modelo indican un error estándar residual de 1.274 con 22 grados de libertad. El R-cuadrado múltiple es 0.4061, lo que significa que aproximadamente el 40.61% de la variabilidad en Comp.1 puede ser explicada por la dosis. El valor ajustado de R-cuadrado es 0.3791, y la F-estadística es 15.04 con un valor p < 0.001, lo que confirma la significancia global del modelo.

Finalmente, se calcularon los valores de DL50 y DL70 utilizando la fórmula de la regresión lineal. Los valores obtenidos fueron:

  • DL50: 89.12644
  • DL70: 28.13877

Estos valores representan las dosis correspondientes al 50% y 70% en el primer componente principal respectivamente, proporcionando una medida de la eficacia de las dosis en términos de la variabilidad capturada por Comp.1.

XIII. Fenotipificación de plantas | vivero : CCHEN

De las cuatro bandejas, cada una con 50 plántulas para cada Dosis, se tomaron muestras aleatorias para calcular las medias de las variables morfológicas. Los resultados obtenidos se presentan a continuación:

## `summarise()` has grouped output by 'Dosis'. You can override using the
## `.groups` argument.

I.Analisis de Componenetes Principales | CCHEN

El análisis de componentes principales (PCA) mostró que la varianza explicada por cada componente fue del 66.96%, 18.05% y 8.01%, respectivamente, sumando una varianza acumulada del 93.02%. Los valores propios asociados a estos componentes fueron 4.017 para el primer componente, 1.083 para el segundo, y 0.481 para el tercero. Solo los dos primeros componente es adecuado para realizar análisis posteriores.

## 
## Results for PCA decomposition (class pcares)
## 
## Major fields:
## $scores - matrix with score values
## $T2 - matrix with T2 distances
## $Q - matrix with Q residuals
## $ncomp.selected - selected number of components
## $expvar - explained variance for each component
## $cumexpvar - cumulative explained variance
## 
## Summary for PCA model (class pca)
## Type of limits: ddmoments
## Alpha: 0.05
## Gamma: 0.01
## 
##        Eigenvals Expvar Cumexpvar Nq Nh
## Comp 1     4.017  66.96     66.96  1  2
## Comp 2     1.083  18.05     85.01  3  2
## Comp 3     0.481   8.01     93.02  3  2

II. Varianza explicada

III. Búsqueda de outlier

La base presenta 1 valor extremo, sin embargo NO es considerado outlier.

IV. Visualización de Scores

El PCA muestra los scores de las diferentes dosis de Dosis en el gráfico de dispersión. En este gráfico, el primer componente (Comp 1) explica el 66.96% de la variabilidad, mientras que el segundo componente (Comp 2) explica el 18.05 de la variabilidad.

Aunque Comp 2 captura una menor proporción de la variabilidad total, es clave para la separación de las dosis. Las dosis más altas (200 y 250) tienden a agruparse en la parte superior del gráfico de scores, mientras que las dosis más bajas se encuentran en la parte inferior.

Esto sugiere que Comp 2 captura variaciones significativas relacionadas con la intensidad del Dosis de las dosis.

V. Visualización de loading

Las cargas de los componentes principales (loadings) proporcionan información sobre cómo cada variable contribuye a los componentes principales identificados en el análisis de PCA.

El primer componente (Comp 1), que explica el 66.96% de la variabilidad, tiene altas cargas positivas para todas las variables morfológicas. Las cargas más altas se observan en media_P.fresco (0.947) y media_Altura (0.922), lo que sugiere que Comp 1 captura la variabilidad general de estas medidas. Esto indica que Comp 1 está fuertemente influenciado por el tamaño y la biomasa de las plantas.

El segundo componente (Comp 2), que explica el 7.24% de la variabilidad, tiene una carga moderadamente positiva para media_P.seco (0.518), pero cargas relativamente bajas y cercanas a cero para las demás variables, y una carga negativa para media_Altura (-0.236). Esto sugiere que Comp 2 distingue principalmente las variaciones en el peso seco de las plantas, separando las dosis más altas de las más bajas.

El tercer componente (Comp 3) muestra cargas bajas en todas las variables, con una carga negativa notable para media_sobrev_rel (-0.445), sugiriendo que este componente captura variaciones menores relacionadas con la supervivencia relativa y otras características morfológicas.

Estos resultados indican que el primer componente principal es el más influyente y está asociado con el tamaño y la biomasa general de las plantas, mientras que el segundo componente captura variaciones específicas en el peso seco, y el tercer componente tiene una influencia menor en la variabilidad total.

VI. Modelo con componenetes principales | Vivero = CCHEN

## 
## Call:
## lm(formula = Comp.1 ~ Dosis, data = combined_df_cchen)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -1.5239 -0.9008  0.2258  0.5890  1.5321 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -2.504164   0.363240  -6.894 6.36e-07 ***
## Dosis        0.020033   0.002399   8.349 2.88e-08 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 1.004 on 22 degrees of freedom
## Multiple R-squared:  0.7601, Adjusted R-squared:  0.7492 
## F-statistic: 69.71 on 1 and 22 DF,  p-value: 2.885e-08
## DL50: 140.2848
## DL70: 149.4844

exit()