1 Importar librerias y datos

A continuación se presenta el script con el cual importamos las librerias necesarias y la base de datos con la que se presenta el ejemplo del informe llamadas “seeds”

library(table1)#indicadores
library(ggplot2)#graficos
library(plotly)#animaciones
library(faraway)#datos 
data(seeds)#carga datos
head(seeds)#presenta datos 
germ moisture covered
22 1 no
41 3 no
66 5 no
82 7 no
79 9 no
0 11 no

la base contiene información sobre el experimento realizado para evaluar la germinación de semillas(germ) de forraje y como esta se ve afectada por la humedad del suelo (moisture). El experimento contiene un total de 48 observaciones.

1.0.1 Exploración de datos

para la exploración de datos utilizamos los indicadores generados con table1 y graficos de ggplot2:

table1(~germ+moisture,data=seeds)
Overall
(N=48)
germ
Mean (SD) 47.8 (28.0)
Median [Min, Max] 51.0 [0, 84.0]
Missing 1 (2.1%)
moisture
Mean (SD) 6.00 (3.45)
Median [Min, Max] 6.00 [1.00, 11.0]

Se observa en la tabla que la media de germinación es de 48% con una desviación del 28%. Mientras que la humedad solo fue variada en el experimento desde el 1% al 11%

ggplot(seeds, aes(x = germ)) +
  geom_histogram(binwidth = 5, fill = "green", color = "orange") +
  labs(
    title = "Histograma de Germinación",
    x = "Germinación",
    y = "Frecuencia"
  ) +
  theme_minimal() 
## Warning: Removed 1 row containing non-finite outside the scale range
## (`stat_bin()`).

En la grafica se muestra que en 8 de las repeticiones, no germinó ninguna de las semillas mientras que en algunas la germinación superó el 75%.Es decir una diferencia importante que como hipotesis se espera esté explicada por la humedad del suelo.

Ahora continuando con la exploración de datos vamos a realizar un análisis bivariado entre germinación y humedad del suelo para identificar posibles correlaciones

seeds$moisture_cate=as.factor(seeds$moisture)
table1(~germ | moisture_cate,data=seeds)
1
(N=8)
3
(N=8)
5
(N=8)
7
(N=8)
9
(N=8)
11
(N=8)
Overall
(N=48)
germ
Mean (SD) 33.5 (10.1) 60.6 (17.4) 71.4 (9.35) 65.0 (15.6) 57.6 (19.7) 0 (0) 47.8 (28.0)
Median [Min, Max] 34.0 [22.0, 45.0] 62.0 [38.0, 80.0] 73.5 [51.0, 81.0] 67.5 [40.0, 84.0] 68.0 [31.0, 79.0] 0 [0, 0] 51.0 [0, 84.0]
Missing 0 (0%) 0 (0%) 0 (0%) 0 (0%) 1 (12.5%) 0 (0%) 1 (2.1%)

se observa que existe un comportamiento no lineal entre la relación de germinación y humedad del suelo indicando que valores muy bajos de humedad tienen una media de germinación baja al igual que los altos(ejemplo con 11% de humedad ninguna semilla germinó)

ggplot(data = seeds, aes(x = moisture, y = germ)) +
  geom_point() +
  geom_smooth() +
  labs(
    title = "Relación entre humedad del suelo y germinación",
    x = "Humedad del suelo (%)",
    y = "Porcentaje de germinación"
  ) +
  theme_minimal()
## `geom_smooth()` using method = 'loess' and formula = 'y ~ x'
## Warning: Removed 1 row containing non-finite outside the scale range
## (`stat_smooth()`).
## Warning: Removed 1 row containing missing values or values outside the scale range
## (`geom_point()`).

En la grafica se evidencia que la germinación aumenta con la humedad hasta un maxio en torno al 5-6%, tras lo cual disminuye progresivamente, alcanzando 0% en el 11% de humedad.

1.0.2 Conclusiones

  1. El análisis de exploración de datos revela que la humedad influye de manera no lineal en la germinación: valores intermedios(entre 5%-6%) maximizan la germinación, mientras que niveles muy bajos o muy altos reducen significativamente este proceso, llegando a evitar que suceda.

La exploración permite identificar patros, tendencias y valores atipicos en estudios biologicos. En este caso, la germinación.

  1. R Markdown, facilitó integrar elementos como tablas, gráficas , texto interpretativo y códigos, optimizando el proceso de análisis y elaboración del informe. esta integración permite trabajar de forma más eficiente y minimizando margen de errror en cuanto a resultados y obtención de datos.