Importar librerias y datos

Se presenta el codigo con el que se importaron las librerias y datos necesarios con las que se presenta el ejemplo del informe llamdo “seeds”

library(table1)#indicadores
library(ggplot2)#grficos
library(plotly)#animaciones
library(faraway)#datos
data(seeds)
head(seeds)
germ moisture covered
22 1 no
41 3 no
66 5 no
82 7 no
79 9 no
0 11 no
tema_morado <- theme_minimal(base_family = "lato") +
  theme(
    plot.title = element_text(face = "bold", size = 16, color = "#6A0DAD"),
    axis.title = element_text(size = 14, color = "#4B0082"),
    axis.text = element_text(size = 12, color = "#4B0082"),
    panel.grid.major = element_line(color = "grey85"),
    panel.grid.minor = element_blank()
  )

La base contiene información sobre el experimento realizado para evaluar la germinacion e las semillas de foraje y como esta se ve afectada por la humedad del suelo. El exprimento contiene un total de 48 observaciones

Exploracion de datos

Para la exploracion de datos, utilizamo los indicadoes generados con table1 y graficos ggplot2

table1(~germ+moisture,data=seeds)
Overall
(N=48)
germ
Mean (SD) 47.8 (28.0)
Median [Min, Max] 51.0 [0, 84.0]
Missing 1 (2.1%)
moisture
Mean (SD) 6.00 (3.45)
Median [Min, Max] 6.00 [1.00, 11.0]

Se observa en la tabla que la media de geminacion es de 48% con una desviacion del 28%. Mientras que la humedad del suelo fue variada en el experimento desde 1% al 11%

ggplot(data = seeds, aes(x = germ)) +
  geom_histogram(fill = "#6A0DAD", color = "white", bins = 10, alpha = 0.8) +
  labs(
    title = "Distribución de la germinación",
    x = "Porcentaje de germinación",
    y = "Frecuencia"
  ) +
  tema_morado

En la grafica se observa que en 8 de las repeticiones no germinaron ninguna de las semillas mientras que en elgunas la germinacion supero el 75%. Es decir una diferencia importante que como hipotesis se espera este explicada por la humedad del suelo.

Se realiza un analisis bivariado entre germinacion y humedad del suelo para identificar las posibles correlaciones

seeds$moisture_cate=as.factor(seeds$moisture)
table1(~germ|moisture+moisture_cate,data=seeds)
1
3
5
7
9
11
Overall
1
(N=8)
3
(N=8)
5
(N=8)
7
(N=8)
9
(N=8)
11
(N=8)
1
(N=8)
3
(N=8)
5
(N=8)
7
(N=8)
9
(N=8)
11
(N=8)
germ
Mean (SD) 33.5 (10.1) 60.6 (17.4) 71.4 (9.35) 65.0 (15.6) 57.6 (19.7) 0 (0) 33.5 (10.1) 60.6 (17.4) 71.4 (9.35) 65.0 (15.6) 57.6 (19.7) 0 (0)
Median [Min, Max] 34.0 [22.0, 45.0] 62.0 [38.0, 80.0] 73.5 [51.0, 81.0] 67.5 [40.0, 84.0] 68.0 [31.0, 79.0] 0 [0, 0] 34.0 [22.0, 45.0] 62.0 [38.0, 80.0] 73.5 [51.0, 81.0] 67.5 [40.0, 84.0] 68.0 [31.0, 79.0] 0 [0, 0]
Missing 0 (0%) 0 (0%) 0 (0%) 0 (0%) 1 (12.5%) 0 (0%) 0 (0%) 0 (0%) 0 (0%) 0 (0%) 1 (12.5%) 0 (0%)

Se observa que existe un comportamiento no lineal entre la relacion de germinacion y humedad del suelo. Indicando que valores bajos de humedad tienen una media de germinacion baja al igual que los altos

ggplot(data = seeds, aes(x = moisture, y = germ)) +
  geom_point(color = "#6A0DAD", size = 3, alpha = 0.7) +
  geom_smooth(method = "loess", color = "#4B0082", fill = "#D8BFD8") +
  labs(
    title = "Relación entre humedad y germinación",
    x = "Humedad del suelo (%)",
    y = "Germinación (%)"
  ) +
  tema_morado

Se puede observar con mayor detalle la relacion no lineal indicando que existe un optimo de humedad para maximizar la germinacion de las semillas alrededor de 5% de humedad en el suelo

Conclusiones

Con respecto al uso de R Markdown se vuelve una manera agil y dinamica que facilita la creacion de informes claros implementanto tanto el analisis estadistico como el analisis textual en un mismo entorno, integrando codigos como texto en un mismo lugar

Es posible concluir que la germinacion de las semillas empleadas en el experimento dependen de una manera no lineal de la humedad del suelo, obteniendo un punto optimo de alrededor de 5% meintras que valores muy bajos o muy altos de humedad reducen significativamente la germinacion