A continuación se presenta el script con el cual importamos las librerias necesarias y la base de datos con la que se presenta el ejemplo del informe llamadas “seeds”
library(table1)#indicadores
library(ggplot2)#graficos
library(plotly)#animaciones
library(faraway)#datos
data(seeds)#carga datos
head(seeds)#presenta datos
germ | moisture | covered |
---|---|---|
22 | 1 | no |
41 | 3 | no |
66 | 5 | no |
82 | 7 | no |
79 | 9 | no |
0 | 11 | no |
la base contiene información sobre el experimento realizado para evaluar la germinación de semillas(germ) de forraje y como esta se ve afectada por la humedad del suelo (moisture). El experimento contiene un total de 48 observaciones.
para la exploración de datos utilizamos los indicadores generados con table1 y graficos de ggplot2:
Overall (N=48) |
|
---|---|
germ | |
Mean (SD) | 47.8 (28.0) |
Median [Min, Max] | 51.0 [0, 84.0] |
Missing | 1 (2.1%) |
moisture | |
Mean (SD) | 6.00 (3.45) |
Median [Min, Max] | 6.00 [1.00, 11.0] |
Se observa en la tabla que la media de germinación es de 48% con una desviación del 28%. Mientras que la humedad solo fue variada en el experimento desde el 1% al 11%
ggplot(seeds, aes(x = germ)) +
geom_histogram(binwidth = 5, fill = "green", color = "orange") +
labs(
title = "Histograma de Germinación",
x = "Germinación",
y = "Frecuencia"
) +
theme_minimal()
## Warning: Removed 1 row containing non-finite outside the scale range
## (`stat_bin()`).
En la grafica se muestra que en 8 de las repeticiones, no germinó ninguna de las semillas mientras que en algunas la germinación superó el 75%.Es decir una diferencia importante que como hipotesis se espera esté explicada por la humedad del suelo.
Ahora continuando con la exploración de datos vamos a realizar un análisis bivariado entre germinación y humedad del suelo para identificar posibles correlaciones
1 (N=8) |
3 (N=8) |
5 (N=8) |
7 (N=8) |
9 (N=8) |
11 (N=8) |
Overall (N=48) |
|
---|---|---|---|---|---|---|---|
germ | |||||||
Mean (SD) | 33.5 (10.1) | 60.6 (17.4) | 71.4 (9.35) | 65.0 (15.6) | 57.6 (19.7) | 0 (0) | 47.8 (28.0) |
Median [Min, Max] | 34.0 [22.0, 45.0] | 62.0 [38.0, 80.0] | 73.5 [51.0, 81.0] | 67.5 [40.0, 84.0] | 68.0 [31.0, 79.0] | 0 [0, 0] | 51.0 [0, 84.0] |
Missing | 0 (0%) | 0 (0%) | 0 (0%) | 0 (0%) | 1 (12.5%) | 0 (0%) | 1 (2.1%) |
se observa que existe un comportamiento no lineal entre la relación de germinación y humedad del suelo indicando que valores muy bajos de humedad tienen una media de germinación baja al igual que los altos(ejemplo con 11% de humedad ninguna semilla germinó)
ggplot(data = seeds, aes(x = moisture, y = germ)) +
geom_point() +
geom_smooth() +
labs(
title = "Relación entre humedad del suelo y germinación",
x = "Humedad del suelo (%)",
y = "Porcentaje de germinación"
) +
theme_minimal()
## `geom_smooth()` using method = 'loess' and formula = 'y ~ x'
## Warning: Removed 1 row containing non-finite outside the scale range
## (`stat_smooth()`).
## Warning: Removed 1 row containing missing values or values outside the scale range
## (`geom_point()`).
En la grafica se evidencia que la germinación aumenta con la humedad hasta un maxio en torno al 5-6%, tras lo cual disminuye progresivamente, alcanzando 0% en el 11% de humedad.
La exploración permite identificar patros, tendencias y valores atipicos en estudios biologicos. En este caso, la germinación.