1 Importar Librerías y Datos

A continuación se presenta el script con el cual importamos las librerías necesarias y la base de datos con la que se presenta el ejemplo del informe llamado “seeds”.

library(table1) #indicadores
library(ggplot2) #gráficos
library(plotly) #animaciones
library(faraway) #datos
data(seeds) #carga datos
head(seeds) #presenta datos
germ moisture covered
22 1 no
41 3 no
66 5 no
82 7 no
79 9 no
0 11 no

La base contiene información sobre el experimento realizado para evaluar la germinación de semillas de forraje y como esta se ve afectada por la humedad del suelo (moisture). El experimento contiene un total de 48 observaciones.

2 Análisis de Datos

2.1 Exploración de Datos

Para la exploración de los datos utilizamos los indicadores generados con table1 y gráficos de ggplot2:

table1(~germ+moisture,data=seeds)
Overall
(N=48)
germ
Mean (SD) 47.8 (28.0)
Median [Min, Max] 51.0 [0, 84.0]
Missing 1 (2.1%)
moisture
Mean (SD) 6.00 (3.45)
Median [Min, Max] 6.00 [1.00, 11.0]

Se observa en la tabla que la media de germinación es de 48% con una desviación del 28%. Mientras que la humedad del suelo fue variada en el experimento desde 1 al 11%.

ggplot(data = seeds, aes(x = germ)) +
### Distribución de la Germinación
  geom_histogram(
    binwidth = 5, 
    fill = "skyblue3",     # color de relleno
    color = "black",      # borde de las barras
    alpha = 0.8           # transparencia
  ) +
  labs(
    title = "Histograma de Germinación",
    x = "Germinación",
    y = "Frecuencia"
  ) + theme_minimal()

En la gráfica se observa que en 8 de las repeticiones no germinaron ninguna de las semillas, mientras que en algunas la germinación superó el 75%. Es decir, una diferencia importante que como hipótesis se espera esté explicada por la humedad del suelo.

2.1.1 Relación Germinación-Humedad

Ahora, continuando con la exploración de datos, vamos a realizar un análisis bivariado entre germinación y humedad del suelo para identificar posibles correlaciones.

seeds$moisture_cate=as.factor(seeds$moisture)
table1(~germ | moisture_cate, data=seeds)
1
(N=8)
3
(N=8)
5
(N=8)
7
(N=8)
9
(N=8)
11
(N=8)
Overall
(N=48)
germ
Mean (SD) 33.5 (10.1) 60.6 (17.4) 71.4 (9.35) 65.0 (15.6) 57.6 (19.7) 0 (0) 47.8 (28.0)
Median [Min, Max] 34.0 [22.0, 45.0] 62.0 [38.0, 80.0] 73.5 [51.0, 81.0] 67.5 [40.0, 84.0] 68.0 [31.0, 79.0] 0 [0, 0] 51.0 [0, 84.0]
Missing 0 (0%) 0 (0%) 0 (0%) 0 (0%) 1 (12.5%) 0 (0%) 1 (2.1%)

Se observa que existe un comportamiento no lineal entre la relación de germinación y humedad del suelo. Indicando que valores bajos de humedad tienen una media de germinación baja, al igual que los altos (ejemplo con 11% de humedad, ninguna semilla germinó).

ggplot(data=seeds, aes(x=moisture, y=germ))+geom_point()+geom_smooth()+theme_minimal()

Se puede observar con mayor detalle la relación no lineal indicando que existe un óptimo de humedad para maximizar la germinación de semillas alrededor del 5% de humedad del suelo.

3 Conclusiones

  • La exploración inicial de los datos permitió identificar las posibles relaciones entre las variables de interés. En este caso, la visualización de la distribución de la germinación y la comparación con los niveles de humedad en el suelo revelaron que esta última podría influir significativamente en los resultados experimentales.

  • El uso e R Markdown para la elaboración de informes permite la integración eficiente de códigos, tablas, gráficos y texto en un único documento, el cual se puede publicar en línea. Además, al reflejar automáticamente las modificaciones que se realizan, dicha plataforma constituye una herramienta útil para la presentación clara de los análisis estadísticos.