Importar Librerias y Datos

A continuación se presenta el script con el cual importamos las librerias necesarias y la base de datos con la que se presenta el ejemplo del informe llamada “seeds”.

library(table1) #indicadores
library(ggplot2) #graficos
library(plotly) #animaciones
library(faraway)
data(seeds) ##carga datos
head(seeds) #presenta datos
germ moisture covered
22 1 no
41 3 no
66 5 no
82 7 no
79 9 no
0 11 no

La base contiene información sobre el experimento realizado para evaluar la germinación de semillas (germ) de forraje y como esta se ve afectada por la humedad del suelo(moisture).El experimento contiene un total de 48 observaciones.

EXPLORACIÓN DE DATOS

Para la exploración de datos utilizamos los indicadores generados con table1 y graficos de ggplot2:

table1(~germ+moisture, data=seeds)
Overall
(N=48)
germ
Mean (SD) 47.8 (28.0)
Median [Min, Max] 51.0 [0, 84.0]
Missing 1 (2.1%)
moisture
Mean (SD) 6.00 (3.45)
Median [Min, Max] 6.00 [1.00, 11.0]

Se observa en la tabla que la media de germinación este de 48 % con una desviación del 28%. Mientras que la humedad del suelo fue variada en el experimento desde 1% al 11%.

ggplot(seeds, aes(x = germ)) +
  geom_histogram(binwidth = 5, fill = "gray", color = "black") +
  labs(
    title = "Histograma de Germinación",
    x = "Germinación",
    y = "Frecuencia"
  ) +
  theme_minimal()
## Warning: Removed 1 row containing non-finite outside the scale range
## (`stat_bin()`).

En a grafica se observaque 8 de las repeticiones no germinaron nunguhna bde las seillas mientras que en algunas la gerinación supero 75%. Es decir, una diferencia importante que como hipotesis se espera este explicada por la humedad del suelo.

Ahora continuando con la exploración de datos vamos a realizar un analisis bivariado entre germinación y humedad del suelo para identificar posibles correlaciones.

seeds$moisture_cate <- as.factor(seeds$moisture)
table1(~ germ + moisture + moisture_cate, data = seeds)
Overall
(N=48)
germ
Mean (SD) 47.8 (28.0)
Median [Min, Max] 51.0 [0, 84.0]
Missing 1 (2.1%)
moisture
Mean (SD) 6.00 (3.45)
Median [Min, Max] 6.00 [1.00, 11.0]
moisture_cate
1 8 (16.7%)
3 8 (16.7%)
5 8 (16.7%)
7 8 (16.7%)
9 8 (16.7%)
11 8 (16.7%)

se observa que existe un comportamiento no lineal entre la relación de germinación y humedad del suelo. Indicadoresque valores bajos de humedad tienen una media de germinación baja que altos ( ejemplo con 11% de humedad ninguna semilla germino).

ggplot(data = seeds, aes(x = moisture, y = germ)) +
  geom_point() +
  geom_smooth() +
  labs(
    title = "Relación entre Humedad del Suelo y Germinación",
    x = "Humedad del suelo (%)",
    y = "Germinación (%)"
  )
## `geom_smooth()` using method = 'loess' and formula = 'y ~ x'
## Warning: Removed 1 row containing non-finite outside the scale range
## (`stat_smooth()`).
## Warning: Removed 1 row containing missing values or values outside the scale range
## (`geom_point()`).

se puede observar con mayor detalle la relación no lineal indicando que existe un optimo de humedad

Conclusión de los resultados del estudio:
El análisis mostró que la germinación presenta un comportamiento no lineal respecto a la humedad. Valores bajos y altos de humedad generan menor germinación, mientras que un nivel óptimo de aproximadamente 5% maximiza la germinación.

Conclusión del uso de R:
RMarkdown y las librerías de R permitieron integrar la exploración de datos, la visualización y el análisis en un solo documento interactivo y reproducible, ideal para comunicar resultados de forma clara y profesional.