library(tidyverse)
## -- Attaching packages --------------------------------------- tidyverse 1.3.1 --
## v ggplot2 3.3.5 v purrr 0.3.4
## v tibble 3.1.6 v dplyr 1.0.7
## v tidyr 1.2.0 v stringr 1.4.0
## v readr 1.4.0 v forcats 0.5.1
## -- Conflicts ------------------------------------------ tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag() masks stats::lag()
library(readxl)
library(skimr)
library(janitor)
##
## Attaching package: 'janitor'
## The following objects are masked from 'package:stats':
##
## chisq.test, fisher.test
library(tidymodels)
## Registered S3 method overwritten by 'tune':
## method from
## required_pkgs.model_spec parsnip
## -- Attaching packages -------------------------------------- tidymodels 0.1.4 --
## v broom 0.7.9 v rsample 0.1.1
## v dials 0.1.0 v tune 0.1.6
## v infer 1.0.0 v workflows 0.2.4
## v modeldata 0.1.1 v workflowsets 0.1.0
## v parsnip 0.2.0 v yardstick 0.0.9
## v recipes 0.2.0
## Warning: package 'parsnip' was built under R version 4.1.3
## -- Conflicts ----------------------------------------- tidymodels_conflicts() --
## x scales::discard() masks purrr::discard()
## x dplyr::filter() masks stats::filter()
## x recipes::fixed() masks stringr::fixed()
## x dplyr::lag() masks stats::lag()
## x yardstick::spec() masks readr::spec()
## x recipes::step() masks stats::step()
## x tune::tune() masks parsnip::tune()
## * Search for functions across packages at https://www.tidymodels.org/find/
library(GGally)
## Registered S3 method overwritten by 'GGally':
## method from
## +.gg ggplot2
library(plotly)
##
## Attaching package: 'plotly'
## The following object is masked from 'package:ggplot2':
##
## last_plot
## The following object is masked from 'package:stats':
##
## filter
## The following object is masked from 'package:graphics':
##
## layout
library(ggeffects)
library(car)
## Loading required package: carData
##
## Attaching package: 'car'
## The following object is masked from 'package:dplyr':
##
## recode
## The following object is masked from 'package:purrr':
##
## some
library(lmtest)
## Warning: package 'lmtest' was built under R version 4.1.3
## Loading required package: zoo
##
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
##
## as.Date, as.Date.numeric
Analizar la composición bromatológica de 5 gramíneas forrajeras con registros de 18 departamentos y 174 municipios de Colombia. Es de interés identificar factores (variables) que puedan ser considerados como importantes en la variabilidad de la composición bromatológica de las especies. .
Objetivo está orientado a ejecutar las siguientes actividades:
Validación de datos: deberá implementar algún mecanismo que le permita detectar (si existen) posibles errores en los datos.
Exploración de datos: construir gráficos que permitan atender la necesidad del planteamiento inicial.
Propuesta de modelación debe construir mínimo 3 modelos que permitan explicar y predecir la variable proteína.
Preguntas adicionales:
¿Es posible predecir la lignina con base en la altura y edad de corte? ¿Existen interacciones en los modelos que construyó para la variable proteína? Si alguien está interesado en establecer cuál es la mejor época de recolección, ¿usted qué le diría en términos estadísticos?
datos <- read_csv("Alimentro_Depurada.csv") %>%
clean_names()
##
## -- Column specification --------------------------------------------------------
## cols(
## .default = col_double(),
## ingrediente = col_character(),
## departamento = col_character(),
## municipio = col_character(),
## topografia = col_character(),
## textura_de_suelo = col_character(),
## epoca_recoleccion = col_character()
## )
## i Use `spec()` for the full column specifications.
datos %>%
head()
## # A tibble: 6 x 25
## ingrediente departamento municipio topografia textura_de_suelo
## <chr> <chr> <chr> <chr> <chr>
## 1 Ryegrass perenne - Lolium ~ Putumayo Sibundoy Plana ND
## 2 Ryegrass perenne - Lolium ~ Putumayo Sibundoy Plana ND
## 3 Ryegrass perenne - Lolium ~ Cundinamarca Mosquera Plana Franco arcilloso
## 4 Ryegrass perenne - Lolium ~ Cundinamarca Mosquera Plana Franco arcilloso
## 5 Ryegrass perenne - Lolium ~ Cundinamarca Mosquera Plana Franco arcilloso
## 6 Ryegrass perenne - Lolium ~ Cundinamarca Mosquera Plana Franco arcilloso
## # ... with 20 more variables: epoca_recoleccion <chr>, altura_corte_cm <dbl>,
## # altura_planta_cm <dbl>, edad_corte_d <dbl>, proteina <dbl>, ceniza <dbl>,
## # extracto_etereo <dbl>, fdn <dbl>, fda <dbl>, lignina <dbl>,
## # hemicelulosa <dbl>, almidon <dbl>, carbohidratos_noes <dbl>,
## # carbohidratos_solubles <dbl>, digestibilidad_ms <dbl>,
## # energia_digestible <dbl>, energia_metabolizable <dbl>,
## # energia_neta_manten <dbl>, energia_neta_ganancia <dbl>, ...
datos %>%
names
## [1] "ingrediente" "departamento" "municipio"
## [4] "topografia" "textura_de_suelo" "epoca_recoleccion"
## [7] "altura_corte_cm" "altura_planta_cm" "edad_corte_d"
## [10] "proteina" "ceniza" "extracto_etereo"
## [13] "fdn" "fda" "lignina"
## [16] "hemicelulosa" "almidon" "carbohidratos_noes"
## [19] "carbohidratos_solubles" "digestibilidad_ms" "energia_digestible"
## [22] "energia_metabolizable" "energia_neta_manten" "energia_neta_ganancia"
## [25] "energia_neta_lactancia"
datos %>%
glimpse()
## Rows: 17,472
## Columns: 25
## $ ingrediente <chr> "Ryegrass perenne - Lolium perenne - Hoja, Tall~
## $ departamento <chr> "Putumayo", "Putumayo", "Cundinamarca", "Cundin~
## $ municipio <chr> "Sibundoy", "Sibundoy", "Mosquera", "Mosquera",~
## $ topografia <chr> "Plana", "Plana", "Plana", "Plana", "Plana", "P~
## $ textura_de_suelo <chr> "ND", "ND", "Franco arcilloso", "Franco arcillo~
## $ epoca_recoleccion <chr> "Transición sequía a lluvia", "Transición sequí~
## $ altura_corte_cm <dbl> 5, 5, 10, 10, 10, 10, 5, 5, 5, 5, 5, 5, 5, 5, 5~
## $ altura_planta_cm <dbl> 25, 25, 48, 48, 48, 48, 12, 12, 12, 10, 10, 10,~
## $ edad_corte_d <dbl> 35, 35, 77, 77, 77, 77, 42, 42, 42, 35, 35, 35,~
## $ proteina <dbl> 18.35, 26.80, 12.36, 12.08, 11.67, 11.68, 13.01~
## $ ceniza <dbl> 9.62, 10.69, 10.00, 10.06, 9.74, 9.56, 11.10, 9~
## $ extracto_etereo <dbl> 3.14, 3.26, 2.80, 2.77, 2.67, 2.85, 2.71, 2.65,~
## $ fdn <dbl> 50.45, 46.55, 62.84, 62.87, 62.80, 63.75, 49.16~
## $ fda <dbl> 26.37, 26.22, 33.34, 34.29, 34.07, 34.22, 28.65~
## $ lignina <dbl> 5.15, 5.14, 8.03, 8.04, 8.33, 8.18, 5.72, 5.00,~
## $ hemicelulosa <dbl> 24.08, 20.33, 29.50, 28.58, 28.73, 29.53, 20.51~
## $ almidon <dbl> 8.78, 8.28, 5.79, 5.85, 6.18, 6.11, 5.25, 5.18,~
## $ carbohidratos_noes <dbl> 13.57, 11.76, 9.05, 9.83, 10.14, 10.27, 12.23, ~
## $ carbohidratos_solubles <dbl> 4.80, 3.48, 3.27, 3.98, 3.97, 4.16, 6.99, 7.22,~
## $ digestibilidad_ms <dbl> 65.85, 72.62, 58.88, 58.35, 58.10, 58.06, 60.87~
## $ energia_digestible <dbl> 2.76, 3.12, 2.46, 2.43, 2.41, 2.42, 2.50, 2.56,~
## $ energia_metabolizable <dbl> 2.21, 2.48, 1.92, 1.90, 1.89, 1.89, 2.00, 2.05,~
## $ energia_neta_manten <dbl> 1.34, 1.59, 1.08, 1.06, 1.05, 1.05, 1.16, 1.20,~
## $ energia_neta_ganancia <dbl> 0.77, 0.99, 0.52, 0.50, 0.49, 0.49, 0.59, 0.63,~
## $ energia_neta_lactancia <dbl> 1.36, 1.51, 1.20, 1.19, 1.18, 1.18, 1.24, 1.27,~
Se observan 25 variables incluida la variables objeto: proteina. Con seis variables categóricas (chr), entre las que figura la variable ingrediente, y 19 numéricas (dbl).
skim(datos)
| Name | datos |
| Number of rows | 17472 |
| Number of columns | 25 |
| _______________________ | |
| Column type frequency: | |
| character | 6 |
| numeric | 19 |
| ________________________ | |
| Group variables | None |
Variable type: character
| skim_variable | n_missing | complete_rate | min | max | empty | n_unique | whitespace |
|---|---|---|---|---|---|---|---|
| ingrediente | 0 | 1 | 37 | 63 | 0 | 5 | 0 |
| departamento | 0 | 1 | 4 | 18 | 0 | 18 | 0 |
| municipio | 0 | 1 | 3 | 27 | 0 | 174 | 0 |
| topografia | 0 | 1 | 2 | 9 | 0 | 4 | 0 |
| textura_de_suelo | 0 | 1 | 2 | 16 | 0 | 9 | 0 |
| epoca_recoleccion | 0 | 1 | 6 | 26 | 0 | 4 | 0 |
Variable type: numeric
| skim_variable | n_missing | complete_rate | mean | sd | p0 | p25 | p50 | p75 | p100 | hist |
|---|---|---|---|---|---|---|---|---|---|---|
| altura_corte_cm | 0 | 1 | 10.58 | 11.31 | 0.00 | 0.00 | 8.00 | 20.00 | 50.00 | ▇▃▂▁▁ |
| altura_planta_cm | 0 | 1 | 48.58 | 30.54 | 0.00 | 26.50 | 46.40 | 66.70 | 330.00 | ▇▃▁▁▁ |
| edad_corte_d | 0 | 1 | 37.31 | 17.16 | 0.00 | 28.00 | 35.00 | 42.00 | 147.00 | ▇▇▂▁▁ |
| proteina | 0 | 1 | 13.20 | 5.29 | 2.87 | 8.92 | 12.08 | 17.13 | 32.87 | ▅▇▅▂▁ |
| ceniza | 0 | 1 | 11.33 | 1.98 | 4.07 | 10.02 | 11.16 | 12.47 | 19.45 | ▁▃▇▂▁ |
| extracto_etereo | 0 | 1 | 2.07 | 0.41 | 0.55 | 1.79 | 2.04 | 2.31 | 4.54 | ▁▇▅▁▁ |
| fdn | 0 | 1 | 59.93 | 7.26 | 26.77 | 54.94 | 61.72 | 65.34 | 80.98 | ▁▁▅▇▁ |
| fda | 0 | 1 | 33.31 | 4.58 | 13.78 | 30.42 | 33.61 | 36.32 | 49.85 | ▁▂▇▅▁ |
| lignina | 0 | 1 | 7.14 | 1.54 | 1.37 | 6.09 | 7.32 | 8.26 | 11.93 | ▁▃▇▇▁ |
| hemicelulosa | 0 | 1 | 26.63 | 4.09 | 7.71 | 24.16 | 27.47 | 29.56 | 42.15 | ▁▂▇▆▁ |
| almidon | 0 | 1 | 5.22 | 2.17 | 0.01 | 3.75 | 5.29 | 6.77 | 16.85 | ▃▇▃▁▁ |
| carbohidratos_noes | 0 | 1 | 7.68 | 3.23 | 0.02 | 5.39 | 7.36 | 9.65 | 22.46 | ▂▇▃▁▁ |
| carbohidratos_solubles | 0 | 1 | 2.47 | 1.90 | 0.01 | 1.07 | 1.98 | 3.39 | 15.63 | ▇▂▁▁▁ |
| digestibilidad_ms | 0 | 1 | 59.55 | 5.28 | 46.29 | 55.43 | 58.58 | 63.63 | 77.68 | ▁▇▆▃▁ |
| energia_digestible | 0 | 1 | 2.45 | 0.26 | 1.86 | 2.24 | 2.40 | 2.64 | 3.37 | ▂▇▆▂▁ |
| energia_metabolizable | 0 | 1 | 1.95 | 0.22 | 1.41 | 1.78 | 1.91 | 2.12 | 2.69 | ▁▇▆▃▁ |
| energia_neta_manten | 0 | 1 | 1.10 | 0.20 | 0.57 | 0.94 | 1.07 | 1.26 | 1.77 | ▁▇▆▃▁ |
| energia_neta_ganancia | 0 | 1 | 0.54 | 0.19 | 0.04 | 0.40 | 0.51 | 0.69 | 1.15 | ▁▇▆▅▁ |
| energia_neta_lactancia | 0 | 1 | 1.21 | 0.12 | 0.91 | 1.12 | 1.19 | 1.31 | 1.63 | ▁▇▆▃▁ |
las variables presentan la totalidad de los datos (complete_rate =1). La variable proteína ostenta una media de 13,2, con desviación estandar de 5,29 unidades
datos_si <- datos %>%
select(- proteina, proteina)
datos_si
## # A tibble: 17,472 x 25
## ingrediente departamento municipio topografia textura_de_suelo
## <chr> <chr> <chr> <chr> <chr>
## 1 Ryegrass perenne - Lolium~ Putumayo Sibundoy Plana ND
## 2 Ryegrass perenne - Lolium~ Putumayo Sibundoy Plana ND
## 3 Ryegrass perenne - Lolium~ Cundinamarca Mosquera Plana Franco arcilloso
## 4 Ryegrass perenne - Lolium~ Cundinamarca Mosquera Plana Franco arcilloso
## 5 Ryegrass perenne - Lolium~ Cundinamarca Mosquera Plana Franco arcilloso
## 6 Ryegrass perenne - Lolium~ Cundinamarca Mosquera Plana Franco arcilloso
## 7 Ryegrass perenne - Lolium~ Cundinamarca Mosquera Plana Franco
## 8 Ryegrass perenne - Lolium~ Cundinamarca Mosquera Plana Franco
## 9 Ryegrass perenne - Lolium~ Cundinamarca Mosquera Plana Franco
## 10 Ryegrass perenne - Lolium~ Cundinamarca Mosquera Plana Franco
## # ... with 17,462 more rows, and 20 more variables: epoca_recoleccion <chr>,
## # altura_corte_cm <dbl>, altura_planta_cm <dbl>, edad_corte_d <dbl>,
## # ceniza <dbl>, extracto_etereo <dbl>, fdn <dbl>, fda <dbl>, lignina <dbl>,
## # hemicelulosa <dbl>, almidon <dbl>, carbohidratos_noes <dbl>,
## # carbohidratos_solubles <dbl>, digestibilidad_ms <dbl>,
## # energia_digestible <dbl>, energia_metabolizable <dbl>,
## # energia_neta_manten <dbl>, energia_neta_ganancia <dbl>, ...
Se ubicó a la variable objeto hasta la última columna del dataframe y facilitar, así, la realización de las matríces de correlación
Nos enfocamos en la relación que existe entre los grupos conformados por las variables proteína, ingrediente y algunas de las otras variables, tanto categóricas como numéricas.
datos_si %>%
ggplot(aes(x = proteina, fill = ingrediente)) +
geom_density(alpha = 0.5)
promedio_proteina <- datos_si %>%
pull(proteina) %>%
mean(na.rm = TRUE)
promedio_proteina
## [1] 13.19589
datos_si %>%
group_by(ingrediente) %>%
summarise(
pro_proteina = mean(proteina),
des_proteina = sd(proteina)
) %>%
ungroup() %>%
ggplot (aes(
x = ingrediente,
y = pro_proteina,
ymin = pro_proteina - des_proteina,
ymax = pro_proteina + des_proteina
)) +
theme(axis.text.x = element_text(angle = 20, hjust = 1))+
geom_point() +
geom_errorbar(width = 0.2) +
geom_hline (yintercept = promedio_proteina, lty = 2, color = "pink", size = 1 )
datos_mean_sd_K <- filter(datos_si, ingrediente == "Kikuyo - Cenchrus clandestinus - Hoja, Tallo", na.rm = TRUE )
datos_mean_sd_K
## # A tibble: 4,613 x 25
## ingrediente departamento municipio topografia textura_de_suelo
## <chr> <chr> <chr> <chr> <chr>
## 1 Kikuyo - Cenchrus clandes~ Norte de Sa~ Pamplona Plana Limoso
## 2 Kikuyo - Cenchrus clandes~ Cundinamarca Soacha Plana Franco
## 3 Kikuyo - Cenchrus clandes~ Cundinamarca Soacha Plana Franco
## 4 Kikuyo - Cenchrus clandes~ Cundinamarca Soacha Plana Franco
## 5 Kikuyo - Cenchrus clandes~ Cundinamarca Soacha Plana Franco
## 6 Kikuyo - Cenchrus clandes~ Cundinamarca Soacha Plana Franco
## 7 Kikuyo - Cenchrus clandes~ Cundinamarca Mosquera Plana Franco
## 8 Kikuyo - Cenchrus clandes~ Cundinamarca Mosquera Plana Franco
## 9 Kikuyo - Cenchrus clandes~ Cundinamarca Mosquera Plana Franco
## 10 Kikuyo - Cenchrus clandes~ Cundinamarca Mosquera Plana Franco
## # ... with 4,603 more rows, and 20 more variables: epoca_recoleccion <chr>,
## # altura_corte_cm <dbl>, altura_planta_cm <dbl>, edad_corte_d <dbl>,
## # ceniza <dbl>, extracto_etereo <dbl>, fdn <dbl>, fda <dbl>, lignina <dbl>,
## # hemicelulosa <dbl>, almidon <dbl>, carbohidratos_noes <dbl>,
## # carbohidratos_solubles <dbl>, digestibilidad_ms <dbl>,
## # energia_digestible <dbl>, energia_metabolizable <dbl>,
## # energia_neta_manten <dbl>, energia_neta_ganancia <dbl>, ...
mean_Kikuyo <- datos_mean_sd_K %>%
pull(proteina) %>%
mean()
mean_Kikuyo
## [1] 17.7967
sd_Kikuyo <- datos_mean_sd_K %>%
pull (proteina) %>%
sd()
sd_Kikuyo
## [1] 3.884778
datos_mean_sd_R <- filter(datos_si, ingrediente == "Ryegrass perenne - Lolium perenne - Hoja, Tallo", na.rm = TRUE )
datos_mean_sd_R
## # A tibble: 3,018 x 25
## ingrediente departamento municipio topografia textura_de_suelo
## <chr> <chr> <chr> <chr> <chr>
## 1 Ryegrass perenne - Lolium~ Putumayo Sibundoy Plana ND
## 2 Ryegrass perenne - Lolium~ Putumayo Sibundoy Plana ND
## 3 Ryegrass perenne - Lolium~ Cundinamarca Mosquera Plana Franco arcilloso
## 4 Ryegrass perenne - Lolium~ Cundinamarca Mosquera Plana Franco arcilloso
## 5 Ryegrass perenne - Lolium~ Cundinamarca Mosquera Plana Franco arcilloso
## 6 Ryegrass perenne - Lolium~ Cundinamarca Mosquera Plana Franco arcilloso
## 7 Ryegrass perenne - Lolium~ Cundinamarca Mosquera Plana Franco
## 8 Ryegrass perenne - Lolium~ Cundinamarca Mosquera Plana Franco
## 9 Ryegrass perenne - Lolium~ Cundinamarca Mosquera Plana Franco
## 10 Ryegrass perenne - Lolium~ Cundinamarca Mosquera Plana Franco
## # ... with 3,008 more rows, and 20 more variables: epoca_recoleccion <chr>,
## # altura_corte_cm <dbl>, altura_planta_cm <dbl>, edad_corte_d <dbl>,
## # ceniza <dbl>, extracto_etereo <dbl>, fdn <dbl>, fda <dbl>, lignina <dbl>,
## # hemicelulosa <dbl>, almidon <dbl>, carbohidratos_noes <dbl>,
## # carbohidratos_solubles <dbl>, digestibilidad_ms <dbl>,
## # energia_digestible <dbl>, energia_metabolizable <dbl>,
## # energia_neta_manten <dbl>, energia_neta_ganancia <dbl>, ...
mean_Ryegrass <- datos_mean_sd_R %>%
pull(proteina) %>%
mean()
mean_Ryegrass
## [1] 17.97793
sd_Ryegrass <- datos_mean_sd_R %>%
pull (proteina) %>%
sd()
sd_Ryegrass
## [1] 4.219584
Los ingredientes representados por los forrajes Kikuyo y Ryegrass perenne, presentan datos distribuidos estadísticos, similares, en valores por encima del promedio de la variable proteína
Las otros ingredientes presentan distribuciones similares con promedios inferiores a la media de la variable proteína
datos_si %>%
group_by(epoca_recoleccion, ingrediente) %>%
summarise(promedio_proteina = mean(proteina, na.rm = TRUE)) %>%
ggplot(aes(x = epoca_recoleccion, y = promedio_proteina, color = ingrediente)) +
theme(axis.text.x = element_text(angle = 45, hjust = 1)) +
geom_point() +
geom_line(aes(group = ingrediente))
## `summarise()` has grouped output by 'epoca_recoleccion'. You can override using the `.groups` argument.
datos_si %>%
group_by(textura_de_suelo, ingrediente) %>%
summarise(promedio_proteina = mean(proteina, na.rm = TRUE)) %>%
ggplot(aes(x = textura_de_suelo, y = promedio_proteina, color = ingrediente)) +
theme(axis.text.x = element_text(angle = 45, hjust = 1)) +
geom_point() +
geom_line(aes(group = ingrediente))
## `summarise()` has grouped output by 'textura_de_suelo'. You can override using the `.groups` argument.
datos_si %>%
group_by(textura_de_suelo, ingrediente) %>%
summarise(promedio_alturacorte = mean(altura_corte_cm,na.rm = TRUE), promedio_proteina = mean(proteina, na.rm = TRUE)) %>%
ggplot(aes(x = promedio_alturacorte, y = promedio_proteina, color = ingrediente)) +
theme(axis.text.x = element_text(angle = 45, hjust = 1)) +
geom_point() +
geom_line(aes(group = ingrediente))
## `summarise()` has grouped output by 'textura_de_suelo'. You can override using the `.groups` argument.
datos_si %>%
group_by(departamento, ingrediente) %>%
summarise(promedio = mean(proteina, na.rm = TRUE)) %>%
ggplot(aes(x = departamento, y = promedio, color = ingrediente)) +
theme(axis.text.x = element_text(angle = 45, hjust = 1)) +
geom_point() +
geom_line(aes(group = ingrediente))
## `summarise()` has grouped output by 'departamento'. You can override using the `.groups` argument.
datos_si %>%
group_by(departamento) %>%
summarise(promedio_proteina= mean(proteina)) %>%
ggplot(mapping = aes(x = fct_reorder(departamento, promedio_proteina), y = promedio_proteina)) +
geom_col(color = "red", fill = "pink") +
coord_flip()
datos_dto <- datos_si %>%
select(c(departamento, ingrediente))
datos_dto %>%
head()
## # A tibble: 6 x 2
## departamento ingrediente
## <chr> <chr>
## 1 Putumayo Ryegrass perenne - Lolium perenne - Hoja, Tallo
## 2 Putumayo Ryegrass perenne - Lolium perenne - Hoja, Tallo
## 3 Cundinamarca Ryegrass perenne - Lolium perenne - Hoja, Tallo
## 4 Cundinamarca Ryegrass perenne - Lolium perenne - Hoja, Tallo
## 5 Cundinamarca Ryegrass perenne - Lolium perenne - Hoja, Tallo
## 6 Cundinamarca Ryegrass perenne - Lolium perenne - Hoja, Tallo
putumayo_ingre <- filter(datos_dto, departamento == "Putumayo")
putumayo_ingre
## # A tibble: 6 x 2
## departamento ingrediente
## <chr> <chr>
## 1 Putumayo Ryegrass perenne - Lolium perenne - Hoja, Tallo
## 2 Putumayo Ryegrass perenne - Lolium perenne - Hoja, Tallo
## 3 Putumayo Kikuyo - Cenchrus clandestinus - Hoja, Tallo
## 4 Putumayo Kikuyo - Cenchrus clandestinus - Hoja, Tallo
## 5 Putumayo Kikuyo - Cenchrus clandestinus - Hoja, Tallo
## 6 Putumayo Kikuyo - Cenchrus clandestinus - Hoja, Tallo
Boyaca_ingre <- filter(datos_dto, departamento == "Boyacá")
Boyaca_ingre
## # A tibble: 1,613 x 2
## departamento ingrediente
## <chr> <chr>
## 1 Boyacá Ryegrass perenne - Lolium perenne - Hoja, Tallo
## 2 Boyacá Ryegrass perenne - Lolium perenne - Hoja, Tallo
## 3 Boyacá Ryegrass perenne - Lolium perenne - Hoja, Tallo
## 4 Boyacá Ryegrass perenne - Lolium perenne - Hoja, Tallo
## 5 Boyacá Ryegrass perenne - Lolium perenne - Hoja, Tallo
## 6 Boyacá Ryegrass perenne - Lolium perenne - Hoja, Tallo
## 7 Boyacá Ryegrass perenne - Lolium perenne - Hoja, Tallo
## 8 Boyacá Ryegrass perenne - Lolium perenne - Hoja, Tallo
## 9 Boyacá Ryegrass perenne - Lolium perenne - Hoja, Tallo
## 10 Boyacá Ryegrass perenne - Lolium perenne - Hoja, Tallo
## # ... with 1,603 more rows
Observamos pocos datos en algunas relaciones entre las variables departamento e ingrediente, por ejemplo, en el caso de putumayo sólo hay 6 datos, uno para Cauca, Seis para Bogotá y uno para Atlántico. Lo que puede sesgar la inferencia que se hace sobre la media en la proteína relacionada con el departamento
Los datos reflejados en las gráficas, fruto de la relación entre la variables ingrediente, proteína, epoca_de_recolección, textura_de_suelo, altura de corte y departamento, muestran que, independiente de las variables, el promedio mas alto de proteína se mantiene en los forrajes Kikuyo y Ryegrass Perenne
El departamento de putumayo relaciona los promedios de proteína más altos (gráfica 6). Se debe, al parecer, porque los forrajes Kikuyo y Ryegrass están asignados a ese departamento (gráfica_5). (con pocos datos)
El forraje mas relacionado con los departamentos es Kikuyo (13)
Los forrajes que menos se relacionan con los departamentos son Buffel y Rhodes (4 respectivamente).
Antioquia_ingre <- filter(datos_dto, departamento == "Antioquia")
Antioquia_ingre
## # A tibble: 2,858 x 2
## departamento ingrediente
## <chr> <chr>
## 1 Antioquia Ryegrass perenne - Lolium perenne - Hoja, Tallo
## 2 Antioquia Ryegrass perenne - Lolium perenne - Hoja, Tallo
## 3 Antioquia Ryegrass perenne - Lolium perenne - Hoja, Tallo
## 4 Antioquia Ryegrass perenne - Lolium perenne - Hoja, Tallo
## 5 Antioquia Ryegrass perenne - Lolium perenne - Hoja, Tallo
## 6 Antioquia Kikuyo - Cenchrus clandestinus - Hoja, Tallo
## 7 Antioquia Kikuyo - Cenchrus clandestinus - Hoja, Tallo
## 8 Antioquia Kikuyo - Cenchrus clandestinus - Hoja, Tallo
## 9 Antioquia Kikuyo - Cenchrus clandestinus - Hoja, Tallo
## 10 Antioquia Kikuyo - Cenchrus clandestinus - Hoja, Tallo
## # ... with 2,848 more rows
Antioquia_Ryegrass <- Antioquia_ingre %>%
filter(ingrediente == "Ryegrass perenne - Lolium perenne - Hoja, Tallo")
Antioquia_Ryegrass
## # A tibble: 5 x 2
## departamento ingrediente
## <chr> <chr>
## 1 Antioquia Ryegrass perenne - Lolium perenne - Hoja, Tallo
## 2 Antioquia Ryegrass perenne - Lolium perenne - Hoja, Tallo
## 3 Antioquia Ryegrass perenne - Lolium perenne - Hoja, Tallo
## 4 Antioquia Ryegrass perenne - Lolium perenne - Hoja, Tallo
## 5 Antioquia Ryegrass perenne - Lolium perenne - Hoja, Tallo
Antioquia_Kikuyo <- Antioquia_ingre %>%
filter(ingrediente == "Kikuyo - Cenchrus clandestinus - Hoja, Tallo")
Antioquia_Kikuyo
## # A tibble: 227 x 2
## departamento ingrediente
## <chr> <chr>
## 1 Antioquia Kikuyo - Cenchrus clandestinus - Hoja, Tallo
## 2 Antioquia Kikuyo - Cenchrus clandestinus - Hoja, Tallo
## 3 Antioquia Kikuyo - Cenchrus clandestinus - Hoja, Tallo
## 4 Antioquia Kikuyo - Cenchrus clandestinus - Hoja, Tallo
## 5 Antioquia Kikuyo - Cenchrus clandestinus - Hoja, Tallo
## 6 Antioquia Kikuyo - Cenchrus clandestinus - Hoja, Tallo
## 7 Antioquia Kikuyo - Cenchrus clandestinus - Hoja, Tallo
## 8 Antioquia Kikuyo - Cenchrus clandestinus - Hoja, Tallo
## 9 Antioquia Kikuyo - Cenchrus clandestinus - Hoja, Tallo
## 10 Antioquia Kikuyo - Cenchrus clandestinus - Hoja, Tallo
## # ... with 217 more rows
Antioquia_Buffel <- Antioquia_ingre %>%
filter(ingrediente == "Buffel - Cenchrus ciliaris - Hoja, Tallo")
Antioquia_Buffel
## # A tibble: 190 x 2
## departamento ingrediente
## <chr> <chr>
## 1 Antioquia Buffel - Cenchrus ciliaris - Hoja, Tallo
## 2 Antioquia Buffel - Cenchrus ciliaris - Hoja, Tallo
## 3 Antioquia Buffel - Cenchrus ciliaris - Hoja, Tallo
## 4 Antioquia Buffel - Cenchrus ciliaris - Hoja, Tallo
## 5 Antioquia Buffel - Cenchrus ciliaris - Hoja, Tallo
## 6 Antioquia Buffel - Cenchrus ciliaris - Hoja, Tallo
## 7 Antioquia Buffel - Cenchrus ciliaris - Hoja, Tallo
## 8 Antioquia Buffel - Cenchrus ciliaris - Hoja, Tallo
## 9 Antioquia Buffel - Cenchrus ciliaris - Hoja, Tallo
## 10 Antioquia Buffel - Cenchrus ciliaris - Hoja, Tallo
## # ... with 180 more rows
Antioquia_Rhodes <- Antioquia_ingre %>%
filter(ingrediente == "Rhodes - Chloris gayana - Hoja, Tallo")
Antioquia_Rhodes
## # A tibble: 240 x 2
## departamento ingrediente
## <chr> <chr>
## 1 Antioquia Rhodes - Chloris gayana - Hoja, Tallo
## 2 Antioquia Rhodes - Chloris gayana - Hoja, Tallo
## 3 Antioquia Rhodes - Chloris gayana - Hoja, Tallo
## 4 Antioquia Rhodes - Chloris gayana - Hoja, Tallo
## 5 Antioquia Rhodes - Chloris gayana - Hoja, Tallo
## 6 Antioquia Rhodes - Chloris gayana - Hoja, Tallo
## 7 Antioquia Rhodes - Chloris gayana - Hoja, Tallo
## 8 Antioquia Rhodes - Chloris gayana - Hoja, Tallo
## 9 Antioquia Rhodes - Chloris gayana - Hoja, Tallo
## 10 Antioquia Rhodes - Chloris gayana - Hoja, Tallo
## # ... with 230 more rows
Antioquia_Megathyrsus <- Antioquia_ingre %>%
filter(ingrediente == "Megathyrsus maximus sp. - Megathyrsus maximus sp. - Hoja, Tallo")
Antioquia_Megathyrsus
## # A tibble: 2,196 x 2
## departamento ingrediente
## <chr> <chr>
## 1 Antioquia Megathyrsus maximus sp. - Megathyrsus maximus sp. - Hoja, Tallo
## 2 Antioquia Megathyrsus maximus sp. - Megathyrsus maximus sp. - Hoja, Tallo
## 3 Antioquia Megathyrsus maximus sp. - Megathyrsus maximus sp. - Hoja, Tallo
## 4 Antioquia Megathyrsus maximus sp. - Megathyrsus maximus sp. - Hoja, Tallo
## 5 Antioquia Megathyrsus maximus sp. - Megathyrsus maximus sp. - Hoja, Tallo
## 6 Antioquia Megathyrsus maximus sp. - Megathyrsus maximus sp. - Hoja, Tallo
## 7 Antioquia Megathyrsus maximus sp. - Megathyrsus maximus sp. - Hoja, Tallo
## 8 Antioquia Megathyrsus maximus sp. - Megathyrsus maximus sp. - Hoja, Tallo
## 9 Antioquia Megathyrsus maximus sp. - Megathyrsus maximus sp. - Hoja, Tallo
## 10 Antioquia Megathyrsus maximus sp. - Megathyrsus maximus sp. - Hoja, Tallo
## # ... with 2,186 more rows
municipios_ant <- datos_si %>%
select(c(municipio, departamento))
municipios_ant %>%
head()
## # A tibble: 6 x 2
## municipio departamento
## <chr> <chr>
## 1 Sibundoy Putumayo
## 2 Sibundoy Putumayo
## 3 Mosquera Cundinamarca
## 4 Mosquera Cundinamarca
## 5 Mosquera Cundinamarca
## 6 Mosquera Cundinamarca
Antioquia_mun <- municipios_ant %>%
filter(departamento == "Antioquia")
municipioA <- Antioquia_mun %>% group_by(municipio) %>% filter (!duplicated(municipio))
municipioA
## # A tibble: 21 x 2
## # Groups: municipio [21]
## municipio departamento
## <chr> <chr>
## 1 San Pedro Antioquia
## 2 Don Matías Antioquia
## 3 Santa Rosa de Osos Antioquia
## 4 Belmira Antioquia
## 5 Bello Antioquia
## 6 Entrerrios Antioquia
## 7 San José de la Montaña Antioquia
## 8 Rionegro Antioquia
## 9 Medellín Antioquia
## 10 Marinilla Antioquia
## # ... with 11 more rows
sort(municipioA$municipio)
## [1] "Angostura" "Barbosa" "Bello"
## [4] "Belmira" "Don Matías" "El Carmen de Viboral"
## [7] "Entrerrios" "Guarne" "La Ceja"
## [10] "La Unión" "Marinilla" "Medellín"
## [13] "Retiro" "Rionegro" "San Jerónimo"
## [16] "San José de la Montaña" "San Pedro" "San Roque"
## [19] "Santa Rosa de Osos" "Sonson" "Yarumal"
Es acaso la variable topografía la que incide en la siembra de forrajes con baja expresión proteíca en los municipios muestra de Antioquia?
topografiaA <- datos_si %>%
select(c(departamento, topografia, municipio))
topografiaA2 <- topografiaA %>%
filter(departamento == "Antioquia") %>%
group_by(municipio) %>% filter(!duplicated(municipio))
topografiaA2
## # A tibble: 21 x 3
## # Groups: municipio [21]
## departamento topografia municipio
## <chr> <chr> <chr>
## 1 Antioquia Pendiente San Pedro
## 2 Antioquia Pendiente Don Matías
## 3 Antioquia Ondulada Santa Rosa de Osos
## 4 Antioquia Ondulada Belmira
## 5 Antioquia Pendiente Bello
## 6 Antioquia Pendiente Entrerrios
## 7 Antioquia Ondulada San José de la Montaña
## 8 Antioquia Ondulada Rionegro
## 9 Antioquia Ondulada Medellín
## 10 Antioquia Ondulada Marinilla
## # ... with 11 more rows
Los 21 municipios representativos del departemento de Antioquia cultivan forrajes con baja expresión proteica, por lo que parece es debido a la adaptación de las variedades Megathyrsus maximus sp. y rhodes a las condiciones topográficas y climáticas de esas regiones
datos_count <- datos_si %>%
select(altura_corte_cm:energia_neta_lactancia, proteina)
datos_count1 <- datos_si %>%
select(altura_corte_cm:fdn, proteina)
ggpairs(data = datos_count1, lower = list(continuous = "smooth"))
datos_count2 <- datos_si %>%
select(fda:carbohidratos_solubles, proteina)
ggpairs(data = datos_count2, lower = list(continuous = "smooth"))
datos_count3 <- datos_si %>%
select(digestibilidad_ms:energia_neta_lactancia, proteina)
ggpairs(data = datos_count3, lower = list(continuous = "smooth"))
Las variables: digestibilidad_ms, energia_digestible, energia_metabolizable, energia_neta_manten, energia_neta_ganancia y energia_neta_lactancia muestran correlaciones que superan el 90% con la proteína, es decir, influyen en la variación de ésta.
Las anteriores variables también presentan importante correlación entre ellas, lo que podría inducir a la multicolinelaidad del modelo estructurado con éstas
Será el modelo conformado por la variable categórica “ingrediente” junto aLgunas de las cuantitativas que presentan mayor correlación con la variable proteína, el que ostente mayor carácter predictivo.?
datos_modelo <- datos_si %>%
select(c(-departamento, -municipio))
datos_modelo %>%
names()
## [1] "ingrediente" "topografia" "textura_de_suelo"
## [4] "epoca_recoleccion" "altura_corte_cm" "altura_planta_cm"
## [7] "edad_corte_d" "ceniza" "extracto_etereo"
## [10] "fdn" "fda" "lignina"
## [13] "hemicelulosa" "almidon" "carbohidratos_noes"
## [16] "carbohidratos_solubles" "digestibilidad_ms" "energia_digestible"
## [19] "energia_metabolizable" "energia_neta_manten" "energia_neta_ganancia"
## [22] "energia_neta_lactancia" "proteina"
datos_sin_ingrediente <- datos_modelo %>%
select(c(-ingrediente))
datos_sin_ingrediente %>%
names()
## [1] "topografia" "textura_de_suelo" "epoca_recoleccion"
## [4] "altura_corte_cm" "altura_planta_cm" "edad_corte_d"
## [7] "ceniza" "extracto_etereo" "fdn"
## [10] "fda" "lignina" "hemicelulosa"
## [13] "almidon" "carbohidratos_noes" "carbohidratos_solubles"
## [16] "digestibilidad_ms" "energia_digestible" "energia_metabolizable"
## [19] "energia_neta_manten" "energia_neta_ganancia" "energia_neta_lactancia"
## [22] "proteina"
datos_sin_corre <- datos_modelo %>%
select(c(-digestibilidad_ms, -energia_digestible, -energia_metabolizable, -energia_neta_manten, -energia_neta_ganancia, -energia_neta_lactancia))
datos_sin_corre %>%
names()
## [1] "ingrediente" "topografia" "textura_de_suelo"
## [4] "epoca_recoleccion" "altura_corte_cm" "altura_planta_cm"
## [7] "edad_corte_d" "ceniza" "extracto_etereo"
## [10] "fdn" "fda" "lignina"
## [13] "hemicelulosa" "almidon" "carbohidratos_noes"
## [16] "carbohidratos_solubles" "proteina"
datos_sin_corre_mas_1 <- datos_modelo %>%
select(c(-digestibilidad_ms, -energia_metabolizable, -energia_neta_manten, -energia_neta_ganancia, -energia_neta_lactancia))
datos_sin_corre_mas_1 %>%
names()
## [1] "ingrediente" "topografia" "textura_de_suelo"
## [4] "epoca_recoleccion" "altura_corte_cm" "altura_planta_cm"
## [7] "edad_corte_d" "ceniza" "extracto_etereo"
## [10] "fdn" "fda" "lignina"
## [13] "hemicelulosa" "almidon" "carbohidratos_noes"
## [16] "carbohidratos_solubles" "energia_digestible" "proteina"
modelo_completo <- lm(proteina ~ ., data = datos_modelo)
summary(modelo_completo)
##
## Call:
## lm(formula = proteina ~ ., data = datos_modelo)
##
## Residuals:
## Min 1Q Median 3Q Max
## -0.0111733 -0.0033152 0.0000092 0.0032852 0.0136070
##
## Coefficients: (1 not defined because of singularities)
## Estimate
## (Intercept) -7.568e+01
## ingredienteKikuyo - Cenchrus clandestinus - Hoja, Tallo -1.485e-03
## ingredienteMegathyrsus maximus sp. - Megathyrsus maximus sp. - Hoja, Tallo -4.262e-04
## ingredienteRhodes - Chloris gayana - Hoja, Tallo -4.507e-04
## ingredienteRyegrass perenne - Lolium perenne - Hoja, Tallo -1.158e-04
## topografiaOndulada 7.898e-04
## topografiaPendiente 1.092e-03
## topografiaPlana 6.053e-04
## textura_de_sueloArenoso -2.657e-04
## textura_de_sueloFranco -3.183e-04
## textura_de_sueloFranco arcilloso -2.048e-06
## textura_de_sueloFranco arenoso -8.780e-04
## textura_de_sueloFranco limoso -5.376e-04
## textura_de_sueloLimoso -8.219e-04
## textura_de_sueloND -4.192e-04
## textura_de_sueloOtro 7.759e-04
## epoca_recoleccionSequía 1.844e-04
## epoca_recoleccionTransición lluvia a sequía 3.136e-04
## epoca_recoleccionTransición sequía a lluvia -1.045e-04
## altura_corte_cm 5.137e-06
## altura_planta_cm 8.917e-07
## edad_corte_d 4.441e-07
## ceniza -3.350e-05
## extracto_etereo -7.862e-04
## fdn -9.448e-05
## fda 3.947e-01
## lignina 1.964e-04
## hemicelulosa NA
## almidon -2.079e-03
## carbohidratos_noes 2.033e-03
## carbohidratos_solubles -2.094e-03
## digestibilidad_ms 1.278e+00
## energia_digestible 4.103e-03
## energia_metabolizable 7.604e-02
## energia_neta_manten -3.231e-01
## energia_neta_ganancia -4.545e-01
## energia_neta_lactancia 4.620e-02
## Std. Error
## (Intercept) 1.187e-02
## ingredienteKikuyo - Cenchrus clandestinus - Hoja, Tallo 1.983e-04
## ingredienteMegathyrsus maximus sp. - Megathyrsus maximus sp. - Hoja, Tallo 1.450e-04
## ingredienteRhodes - Chloris gayana - Hoja, Tallo 1.632e-04
## ingredienteRyegrass perenne - Lolium perenne - Hoja, Tallo 2.320e-04
## topografiaOndulada 5.956e-04
## topografiaPendiente 6.254e-04
## topografiaPlana 5.968e-04
## textura_de_sueloArenoso 2.619e-04
## textura_de_sueloFranco 1.703e-04
## textura_de_sueloFranco arcilloso 1.223e-04
## textura_de_sueloFranco arenoso 1.345e-04
## textura_de_sueloFranco limoso 2.196e-04
## textura_de_sueloLimoso 3.113e-04
## textura_de_sueloND 2.006e-04
## textura_de_sueloOtro 5.725e-04
## epoca_recoleccionSequía 7.633e-05
## epoca_recoleccionTransición lluvia a sequía 1.587e-04
## epoca_recoleccionTransición sequía a lluvia 1.465e-04
## altura_corte_cm 4.586e-06
## altura_planta_cm 1.602e-06
## edad_corte_d 2.493e-06
## ceniza 2.506e-05
## extracto_etereo 1.338e-04
## fdn 1.844e-05
## fda 1.974e-05
## lignina 6.259e-05
## hemicelulosa NA
## almidon 6.392e-03
## carbohidratos_noes 6.392e-03
## carbohidratos_solubles 6.392e-03
## digestibilidad_ms 5.882e-04
## energia_digestible 1.653e-03
## energia_metabolizable 1.099e-02
## energia_neta_manten 9.380e-03
## energia_neta_ganancia 7.768e-03
## energia_neta_lactancia 1.097e-02
## t value
## (Intercept) -6377.119
## ingredienteKikuyo - Cenchrus clandestinus - Hoja, Tallo -7.492
## ingredienteMegathyrsus maximus sp. - Megathyrsus maximus sp. - Hoja, Tallo -2.940
## ingredienteRhodes - Chloris gayana - Hoja, Tallo -2.763
## ingredienteRyegrass perenne - Lolium perenne - Hoja, Tallo -0.499
## topografiaOndulada 1.326
## topografiaPendiente 1.746
## topografiaPlana 1.014
## textura_de_sueloArenoso -1.015
## textura_de_sueloFranco -1.869
## textura_de_sueloFranco arcilloso -0.017
## textura_de_sueloFranco arenoso -6.528
## textura_de_sueloFranco limoso -2.448
## textura_de_sueloLimoso -2.640
## textura_de_sueloND -2.090
## textura_de_sueloOtro 1.355
## epoca_recoleccionSequía 2.416
## epoca_recoleccionTransición lluvia a sequía 1.976
## epoca_recoleccionTransición sequía a lluvia -0.713
## altura_corte_cm 1.120
## altura_planta_cm 0.557
## edad_corte_d 0.178
## ceniza -1.337
## extracto_etereo -5.877
## fdn -5.123
## fda 19992.717
## lignina 3.138
## hemicelulosa NA
## almidon -0.325
## carbohidratos_noes 0.318
## carbohidratos_solubles -0.328
## digestibilidad_ms 2173.371
## energia_digestible 2.482
## energia_metabolizable 6.919
## energia_neta_manten -34.449
## energia_neta_ganancia -58.515
## energia_neta_lactancia 4.212
## Pr(>|t|)
## (Intercept) < 2e-16
## ingredienteKikuyo - Cenchrus clandestinus - Hoja, Tallo 7.11e-14
## ingredienteMegathyrsus maximus sp. - Megathyrsus maximus sp. - Hoja, Tallo 0.00329
## ingredienteRhodes - Chloris gayana - Hoja, Tallo 0.00574
## ingredienteRyegrass perenne - Lolium perenne - Hoja, Tallo 0.61767
## topografiaOndulada 0.18482
## topografiaPendiente 0.08077
## topografiaPlana 0.31051
## textura_de_sueloArenoso 0.31032
## textura_de_sueloFranco 0.06162
## textura_de_sueloFranco arcilloso 0.98664
## textura_de_sueloFranco arenoso 6.85e-11
## textura_de_sueloFranco limoso 0.01438
## textura_de_sueloLimoso 0.00831
## textura_de_sueloND 0.03662
## textura_de_sueloOtro 0.17535
## epoca_recoleccionSequía 0.01569
## epoca_recoleccionTransición lluvia a sequía 0.04820
## epoca_recoleccionTransición sequía a lluvia 0.47577
## altura_corte_cm 0.26264
## altura_planta_cm 0.57773
## edad_corte_d 0.85863
## ceniza 0.18135
## extracto_etereo 4.26e-09
## fdn 3.04e-07
## fda < 2e-16
## lignina 0.00170
## hemicelulosa NA
## almidon 0.74495
## carbohidratos_noes 0.75046
## carbohidratos_solubles 0.74317
## digestibilidad_ms < 2e-16
## energia_digestible 0.01306
## energia_metabolizable 4.70e-12
## energia_neta_manten < 2e-16
## energia_neta_ganancia < 2e-16
## energia_neta_lactancia 2.55e-05
##
## (Intercept) ***
## ingredienteKikuyo - Cenchrus clandestinus - Hoja, Tallo ***
## ingredienteMegathyrsus maximus sp. - Megathyrsus maximus sp. - Hoja, Tallo **
## ingredienteRhodes - Chloris gayana - Hoja, Tallo **
## ingredienteRyegrass perenne - Lolium perenne - Hoja, Tallo
## topografiaOndulada
## topografiaPendiente .
## topografiaPlana
## textura_de_sueloArenoso
## textura_de_sueloFranco .
## textura_de_sueloFranco arcilloso
## textura_de_sueloFranco arenoso ***
## textura_de_sueloFranco limoso *
## textura_de_sueloLimoso **
## textura_de_sueloND *
## textura_de_sueloOtro
## epoca_recoleccionSequía *
## epoca_recoleccionTransición lluvia a sequía *
## epoca_recoleccionTransición sequía a lluvia
## altura_corte_cm
## altura_planta_cm
## edad_corte_d
## ceniza
## extracto_etereo ***
## fdn ***
## fda ***
## lignina **
## hemicelulosa
## almidon
## carbohidratos_noes
## carbohidratos_solubles
## digestibilidad_ms ***
## energia_digestible *
## energia_metabolizable ***
## energia_neta_manten ***
## energia_neta_ganancia ***
## energia_neta_lactancia ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.004187 on 17436 degrees of freedom
## Multiple R-squared: 1, Adjusted R-squared: 1
## F-statistic: 7.974e+08 on 35 and 17436 DF, p-value: < 2.2e-16
modelo_completo_sin_I <- lm(proteina ~ ., data = datos_sin_ingrediente)
summary(modelo_completo_sin_I )
##
## Call:
## lm(formula = proteina ~ ., data = datos_sin_ingrediente)
##
## Residuals:
## Min 1Q Median 3Q Max
## -0.0113262 -0.0033172 0.0000005 0.0032897 0.0133965
##
## Coefficients: (1 not defined because of singularities)
## Estimate Std. Error t value
## (Intercept) -7.571e+01 1.163e-02 -6511.883
## topografiaOndulada 8.894e-04 5.966e-04 1.491
## topografiaPendiente 9.927e-04 6.265e-04 1.585
## topografiaPlana 5.678e-04 5.985e-04 0.949
## textura_de_sueloArenoso -7.778e-04 2.563e-04 -3.035
## textura_de_sueloFranco -7.062e-04 1.653e-04 -4.273
## textura_de_sueloFranco arcilloso -1.880e-05 1.213e-04 -0.155
## textura_de_sueloFranco arenoso -8.930e-04 1.334e-04 -6.693
## textura_de_sueloFranco limoso -7.004e-04 2.188e-04 -3.201
## textura_de_sueloLimoso -9.700e-04 3.116e-04 -3.113
## textura_de_sueloND -7.911e-04 1.972e-04 -4.012
## textura_de_sueloOtro 5.310e-04 5.731e-04 0.926
## epoca_recoleccionSequía 1.302e-04 7.582e-05 1.717
## epoca_recoleccionTransición lluvia a sequía 2.906e-04 1.583e-04 1.836
## epoca_recoleccionTransición sequía a lluvia -4.473e-05 1.461e-04 -0.306
## altura_corte_cm 5.434e-06 3.918e-06 1.387
## altura_planta_cm 3.078e-06 1.475e-06 2.086
## edad_corte_d -4.747e-06 2.221e-06 -2.138
## ceniza -9.262e-06 2.350e-05 -0.394
## extracto_etereo -2.967e-04 1.216e-04 -2.441
## fdn -9.232e-05 1.833e-05 -5.037
## fda 3.947e-01 1.844e-05 21401.022
## lignina 1.110e-04 5.920e-05 1.875
## hemicelulosa NA NA NA
## almidon -2.087e-03 6.412e-03 -0.325
## carbohidratos_noes 2.046e-03 6.412e-03 0.319
## carbohidratos_solubles -2.096e-03 6.412e-03 -0.327
## digestibilidad_ms 1.279e+00 5.856e-04 2184.128
## energia_digestible 4.994e-03 1.617e-03 3.088
## energia_metabolizable 7.782e-02 1.102e-02 7.059
## energia_neta_manten -3.333e-01 9.364e-03 -35.593
## energia_neta_ganancia -4.688e-01 7.682e-03 -61.021
## energia_neta_lactancia 4.441e-02 1.100e-02 4.036
## Pr(>|t|)
## (Intercept) < 2e-16 ***
## topografiaOndulada 0.13602
## topografiaPendiente 0.11308
## topografiaPlana 0.34278
## textura_de_sueloArenoso 0.00241 **
## textura_de_sueloFranco 1.94e-05 ***
## textura_de_sueloFranco arcilloso 0.87685
## textura_de_sueloFranco arenoso 2.25e-11 ***
## textura_de_sueloFranco limoso 0.00137 **
## textura_de_sueloLimoso 0.00186 **
## textura_de_sueloND 6.05e-05 ***
## textura_de_sueloOtro 0.35423
## epoca_recoleccionSequía 0.08607 .
## epoca_recoleccionTransición lluvia a sequía 0.06638 .
## epoca_recoleccionTransición sequía a lluvia 0.75953
## altura_corte_cm 0.16541
## altura_planta_cm 0.03695 *
## edad_corte_d 0.03256 *
## ceniza 0.69353
## extracto_etereo 0.01467 *
## fdn 4.78e-07 ***
## fda < 2e-16 ***
## lignina 0.06075 .
## hemicelulosa NA
## almidon 0.74485
## carbohidratos_noes 0.74965
## carbohidratos_solubles 0.74378
## digestibilidad_ms < 2e-16 ***
## energia_digestible 0.00202 **
## energia_metabolizable 1.74e-12 ***
## energia_neta_manten < 2e-16 ***
## energia_neta_ganancia < 2e-16 ***
## energia_neta_lactancia 5.47e-05 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.004201 on 17440 degrees of freedom
## Multiple R-squared: 1, Adjusted R-squared: 1
## F-statistic: 8.943e+08 on 31 and 17440 DF, p-value: < 2.2e-16
Omitiendo las variables municipio y departamento, observamos como el modelo construido por el resto de los datos determina un R-cuadrado de 1. Sugiriendo un poder predictivo del 100%
Sustrayendo la variable ingrediente vemos que el modelo no cambia el valor del R-cuadrado lo que parece desestimar nuestra conjetura de su relevante aporte en la predicción
Serán los modelos estimados con bases en las variables con alta correlación con la variables proteína las que otorguen un buen carácter predictivo al modelo?
modelo_1 <- lm(proteina ~ ., data = datos_sin_corre)
summary(modelo_1)
##
## Call:
## lm(formula = proteina ~ ., data = datos_sin_corre)
##
## Residuals:
## Min 1Q Median 3Q Max
## -18.0224 -0.9637 -0.0290 0.9924 8.5811
##
## Coefficients: (1 not defined because of singularities)
## Estimate
## (Intercept) 43.0664820
## ingredienteKikuyo - Cenchrus clandestinus - Hoja, Tallo 4.9696386
## ingredienteMegathyrsus maximus sp. - Megathyrsus maximus sp. - Hoja, Tallo 0.4003271
## ingredienteRhodes - Chloris gayana - Hoja, Tallo 0.0652844
## ingredienteRyegrass perenne - Lolium perenne - Hoja, Tallo 3.6267022
## topografiaOndulada 0.3375938
## topografiaPendiente 0.6956883
## topografiaPlana 0.4834806
## textura_de_sueloArenoso 0.0674873
## textura_de_sueloFranco -0.2013645
## textura_de_sueloFranco arcilloso 0.7712534
## textura_de_sueloFranco arenoso 1.0587870
## textura_de_sueloFranco limoso -0.5868024
## textura_de_sueloLimoso 1.2517295
## textura_de_sueloND 1.2307047
## textura_de_sueloOtro -0.3955507
## epoca_recoleccionSequía -0.1020118
## epoca_recoleccionTransición lluvia a sequía 0.1114583
## epoca_recoleccionTransición sequía a lluvia 0.6776065
## altura_corte_cm 0.0113221
## altura_planta_cm 0.0053767
## edad_corte_d -0.0199807
## ceniza 0.0845485
## extracto_etereo -0.2224763
## fdn -0.5422984
## fda 0.3104675
## lignina -1.1845672
## hemicelulosa NA
## almidon 2.6149318
## carbohidratos_noes -2.7439842
## carbohidratos_solubles 1.9581073
## Std. Error
## (Intercept) 0.4814750
## ingredienteKikuyo - Cenchrus clandestinus - Hoja, Tallo 0.0747768
## ingredienteMegathyrsus maximus sp. - Megathyrsus maximus sp. - Hoja, Tallo 0.0628860
## ingredienteRhodes - Chloris gayana - Hoja, Tallo 0.0698623
## ingredienteRyegrass perenne - Lolium perenne - Hoja, Tallo 0.0962499
## topografiaOndulada 0.2603974
## topografiaPendiente 0.2731390
## topografiaPlana 0.2609440
## textura_de_sueloArenoso 0.1143563
## textura_de_sueloFranco 0.0744410
## textura_de_sueloFranco arcilloso 0.0530381
## textura_de_sueloFranco arenoso 0.0571728
## textura_de_sueloFranco limoso 0.0954743
## textura_de_sueloLimoso 0.1357073
## textura_de_sueloND 0.0871486
## textura_de_sueloOtro 0.2499301
## epoca_recoleccionSequía 0.0331285
## epoca_recoleccionTransición lluvia a sequía 0.0693390
## epoca_recoleccionTransición sequía a lluvia 0.0638147
## altura_corte_cm 0.0020021
## altura_planta_cm 0.0006986
## edad_corte_d 0.0010797
## ceniza 0.0100894
## extracto_etereo 0.0507921
## fdn 0.0068750
## fda 0.0068758
## lignina 0.0256980
## hemicelulosa NA
## almidon 2.7951745
## carbohidratos_noes 2.7951384
## carbohidratos_solubles 2.7950703
## t value
## (Intercept) 89.447
## ingredienteKikuyo - Cenchrus clandestinus - Hoja, Tallo 66.460
## ingredienteMegathyrsus maximus sp. - Megathyrsus maximus sp. - Hoja, Tallo 6.366
## ingredienteRhodes - Chloris gayana - Hoja, Tallo 0.934
## ingredienteRyegrass perenne - Lolium perenne - Hoja, Tallo 37.680
## topografiaOndulada 1.296
## topografiaPendiente 2.547
## topografiaPlana 1.853
## textura_de_sueloArenoso 0.590
## textura_de_sueloFranco -2.705
## textura_de_sueloFranco arcilloso 14.542
## textura_de_sueloFranco arenoso 18.519
## textura_de_sueloFranco limoso -6.146
## textura_de_sueloLimoso 9.224
## textura_de_sueloND 14.122
## textura_de_sueloOtro -1.583
## epoca_recoleccionSequía -3.079
## epoca_recoleccionTransición lluvia a sequía 1.607
## epoca_recoleccionTransición sequía a lluvia 10.618
## altura_corte_cm 5.655
## altura_planta_cm 7.696
## edad_corte_d -18.506
## ceniza 8.380
## extracto_etereo -4.380
## fdn -78.880
## fda 45.153
## lignina -46.096
## hemicelulosa NA
## almidon 0.936
## carbohidratos_noes -0.982
## carbohidratos_solubles 0.701
## Pr(>|t|)
## (Intercept) < 2e-16
## ingredienteKikuyo - Cenchrus clandestinus - Hoja, Tallo < 2e-16
## ingredienteMegathyrsus maximus sp. - Megathyrsus maximus sp. - Hoja, Tallo 1.99e-10
## ingredienteRhodes - Chloris gayana - Hoja, Tallo 0.35007
## ingredienteRyegrass perenne - Lolium perenne - Hoja, Tallo < 2e-16
## topografiaOndulada 0.19484
## topografiaPendiente 0.01087
## topografiaPlana 0.06393
## textura_de_sueloArenoso 0.55510
## textura_de_sueloFranco 0.00684
## textura_de_sueloFranco arcilloso < 2e-16
## textura_de_sueloFranco arenoso < 2e-16
## textura_de_sueloFranco limoso 8.11e-10
## textura_de_sueloLimoso < 2e-16
## textura_de_sueloND < 2e-16
## textura_de_sueloOtro 0.11352
## epoca_recoleccionSequía 0.00208
## epoca_recoleccionTransición lluvia a sequía 0.10798
## epoca_recoleccionTransición sequía a lluvia < 2e-16
## altura_corte_cm 1.58e-08
## altura_planta_cm 1.48e-14
## edad_corte_d < 2e-16
## ceniza < 2e-16
## extracto_etereo 1.19e-05
## fdn < 2e-16
## fda < 2e-16
## lignina < 2e-16
## hemicelulosa NA
## almidon 0.34954
## carbohidratos_noes 0.32626
## carbohidratos_solubles 0.48359
##
## (Intercept) ***
## ingredienteKikuyo - Cenchrus clandestinus - Hoja, Tallo ***
## ingredienteMegathyrsus maximus sp. - Megathyrsus maximus sp. - Hoja, Tallo ***
## ingredienteRhodes - Chloris gayana - Hoja, Tallo
## ingredienteRyegrass perenne - Lolium perenne - Hoja, Tallo ***
## topografiaOndulada
## topografiaPendiente *
## topografiaPlana .
## textura_de_sueloArenoso
## textura_de_sueloFranco **
## textura_de_sueloFranco arcilloso ***
## textura_de_sueloFranco arenoso ***
## textura_de_sueloFranco limoso ***
## textura_de_sueloLimoso ***
## textura_de_sueloND ***
## textura_de_sueloOtro
## epoca_recoleccionSequía **
## epoca_recoleccionTransición lluvia a sequía
## epoca_recoleccionTransición sequía a lluvia ***
## altura_corte_cm ***
## altura_planta_cm ***
## edad_corte_d ***
## ceniza ***
## extracto_etereo ***
## fdn ***
## fda ***
## lignina ***
## hemicelulosa
## almidon
## carbohidratos_noes
## carbohidratos_solubles
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 1.831 on 17442 degrees of freedom
## Multiple R-squared: 0.8804, Adjusted R-squared: 0.8802
## F-statistic: 4429 on 29 and 17442 DF, p-value: < 2.2e-16
modelo_12 <- lm(proteina ~ ., data = datos_sin_corre_mas_1)
summary(modelo_12)
##
## Call:
## lm(formula = proteina ~ ., data = datos_sin_corre_mas_1)
##
## Residuals:
## Min 1Q Median 3Q Max
## -4.0323 -0.2413 0.0039 0.2497 3.6415
##
## Coefficients: (1 not defined because of singularities)
## Estimate
## (Intercept) -4.720e+01
## ingredienteKikuyo - Cenchrus clandestinus - Hoja, Tallo 7.382e-01
## ingredienteMegathyrsus maximus sp. - Megathyrsus maximus sp. - Hoja, Tallo 2.336e-01
## ingredienteRhodes - Chloris gayana - Hoja, Tallo 4.424e-01
## ingredienteRyegrass perenne - Lolium perenne - Hoja, Tallo 7.362e-01
## topografiaOndulada 1.588e-01
## topografiaPendiente 3.783e-01
## topografiaPlana 1.689e-01
## textura_de_sueloArenoso -1.847e-01
## textura_de_sueloFranco -4.127e-02
## textura_de_sueloFranco arcilloso -6.109e-02
## textura_de_sueloFranco arenoso -8.625e-02
## textura_de_sueloFranco limoso -2.698e-01
## textura_de_sueloLimoso -1.836e-02
## textura_de_sueloND 3.389e-02
## textura_de_sueloOtro -4.899e-01
## epoca_recoleccionSequía -3.169e-02
## epoca_recoleccionTransición lluvia a sequía 1.064e-01
## epoca_recoleccionTransición sequía a lluvia -2.581e-02
## altura_corte_cm 3.293e-03
## altura_planta_cm 1.177e-03
## edad_corte_d -1.246e-03
## ceniza 1.373e-01
## extracto_etereo -8.656e-01
## fdn -3.915e-02
## fda 2.344e-01
## lignina -1.536e-02
## hemicelulosa NA
## almidon 6.331e-01
## carbohidratos_noes -7.318e-01
## carbohidratos_solubles 7.076e-01
## energia_digestible 2.260e+01
## Std. Error
## (Intercept) 2.088e-01
## ingredienteKikuyo - Cenchrus clandestinus - Hoja, Tallo 2.000e-02
## ingredienteMegathyrsus maximus sp. - Megathyrsus maximus sp. - Hoja, Tallo 1.539e-02
## ingredienteRhodes - Chloris gayana - Hoja, Tallo 1.711e-02
## ingredienteRyegrass perenne - Lolium perenne - Hoja, Tallo 2.419e-02
## topografiaOndulada 6.370e-02
## topografiaPendiente 6.682e-02
## topografiaPlana 6.384e-02
## textura_de_sueloArenoso 2.798e-02
## textura_de_sueloFranco 1.821e-02
## textura_de_sueloFranco arcilloso 1.307e-02
## textura_de_sueloFranco arenoso 1.416e-02
## textura_de_sueloFranco limoso 2.336e-02
## textura_de_sueloLimoso 3.329e-02
## textura_de_sueloND 2.144e-02
## textura_de_sueloOtro 6.114e-02
## epoca_recoleccionSequía 8.106e-03
## epoca_recoleccionTransición lluvia a sequía 1.696e-02
## epoca_recoleccionTransición sequía a lluvia 1.567e-02
## altura_corte_cm 4.900e-04
## altura_planta_cm 1.711e-04
## edad_corte_d 2.665e-04
## ceniza 2.470e-03
## extracto_etereo 1.249e-02
## fdn 1.937e-03
## fda 1.688e-03
## lignina 6.672e-03
## hemicelulosa NA
## almidon 6.838e-01
## carbohidratos_noes 6.838e-01
## carbohidratos_solubles 6.838e-01
## energia_digestible 4.317e-02
## t value
## (Intercept) -226.016
## ingredienteKikuyo - Cenchrus clandestinus - Hoja, Tallo 36.912
## ingredienteMegathyrsus maximus sp. - Megathyrsus maximus sp. - Hoja, Tallo 15.178
## ingredienteRhodes - Chloris gayana - Hoja, Tallo 25.862
## ingredienteRyegrass perenne - Lolium perenne - Hoja, Tallo 30.442
## topografiaOndulada 2.493
## topografiaPendiente 5.661
## topografiaPlana 2.646
## textura_de_sueloArenoso -6.601
## textura_de_sueloFranco -2.266
## textura_de_sueloFranco arcilloso -4.673
## textura_de_sueloFranco arenoso -6.092
## textura_de_sueloFranco limoso -11.549
## textura_de_sueloLimoso -0.552
## textura_de_sueloND 1.581
## textura_de_sueloOtro -8.013
## epoca_recoleccionSequía -3.910
## epoca_recoleccionTransición lluvia a sequía 6.272
## epoca_recoleccionTransición sequía a lluvia -1.647
## altura_corte_cm 6.721
## altura_planta_cm 6.876
## edad_corte_d -4.673
## ceniza 55.585
## extracto_etereo -69.327
## fdn -20.209
## fda 138.820
## lignina -2.303
## hemicelulosa NA
## almidon 0.926
## carbohidratos_noes -1.070
## carbohidratos_solubles 1.035
## energia_digestible 523.448
## Pr(>|t|)
## (Intercept) < 2e-16
## ingredienteKikuyo - Cenchrus clandestinus - Hoja, Tallo < 2e-16
## ingredienteMegathyrsus maximus sp. - Megathyrsus maximus sp. - Hoja, Tallo < 2e-16
## ingredienteRhodes - Chloris gayana - Hoja, Tallo < 2e-16
## ingredienteRyegrass perenne - Lolium perenne - Hoja, Tallo < 2e-16
## topografiaOndulada 0.01266
## topografiaPendiente 1.53e-08
## topografiaPlana 0.00815
## textura_de_sueloArenoso 4.21e-11
## textura_de_sueloFranco 0.02346
## textura_de_sueloFranco arcilloso 2.99e-06
## textura_de_sueloFranco arenoso 1.14e-09
## textura_de_sueloFranco limoso < 2e-16
## textura_de_sueloLimoso 0.58119
## textura_de_sueloND 0.11399
## textura_de_sueloOtro 1.19e-15
## epoca_recoleccionSequía 9.26e-05
## epoca_recoleccionTransición lluvia a sequía 3.64e-10
## epoca_recoleccionTransición sequía a lluvia 0.09959
## altura_corte_cm 1.86e-11
## altura_planta_cm 6.37e-12
## edad_corte_d 2.99e-06
## ceniza < 2e-16
## extracto_etereo < 2e-16
## fdn < 2e-16
## fda < 2e-16
## lignina 0.02131
## hemicelulosa NA
## almidon 0.35454
## carbohidratos_noes 0.28456
## carbohidratos_solubles 0.30076
## energia_digestible < 2e-16
##
## (Intercept) ***
## ingredienteKikuyo - Cenchrus clandestinus - Hoja, Tallo ***
## ingredienteMegathyrsus maximus sp. - Megathyrsus maximus sp. - Hoja, Tallo ***
## ingredienteRhodes - Chloris gayana - Hoja, Tallo ***
## ingredienteRyegrass perenne - Lolium perenne - Hoja, Tallo ***
## topografiaOndulada *
## topografiaPendiente ***
## topografiaPlana **
## textura_de_sueloArenoso ***
## textura_de_sueloFranco *
## textura_de_sueloFranco arcilloso ***
## textura_de_sueloFranco arenoso ***
## textura_de_sueloFranco limoso ***
## textura_de_sueloLimoso
## textura_de_sueloND
## textura_de_sueloOtro ***
## epoca_recoleccionSequía ***
## epoca_recoleccionTransición lluvia a sequía ***
## epoca_recoleccionTransición sequía a lluvia .
## altura_corte_cm ***
## altura_planta_cm ***
## edad_corte_d ***
## ceniza ***
## extracto_etereo ***
## fdn ***
## fda ***
## lignina *
## hemicelulosa
## almidon
## carbohidratos_noes
## carbohidratos_solubles
## energia_digestible ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.448 on 17441 degrees of freedom
## Multiple R-squared: 0.9928, Adjusted R-squared: 0.9928
## F-statistic: 8.067e+04 on 30 and 17441 DF, p-value: < 2.2e-16
Al modelo_completo suprimimos las 6 variables con más correlación con la variable respuesta, el carácter predictivo del modelo_1 descendio de 100% a 88%.
Con sólo insertar una de las variables sustraidas en el modelo_12 el R-cuadrado aumentó a 0.9928, un 99,28% de poder predictivo
Concluimos que los modelos que incorporen algunas de las varaibles digestibilidad_ms, energia_digestible, energia_metabolizable, energia_neta_manten, energia_neta_ganancia, energia_neta_lactancia podrían tener mayor capacidad predictiva
modelo_2 <- lm(proteina ~ fda + energia_metabolizable, data = datos_modelo)
summary(modelo_2)
##
## Call:
## lm(formula = proteina ~ fda + energia_metabolizable, data = datos_modelo)
##
## Residuals:
## Min 1Q Median 3Q Max
## -0.155979 -0.076907 -0.000551 0.077419 0.156554
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -5.973e+01 1.725e-02 -3462 <2e-16 ***
## fda 3.941e-01 2.433e-04 1619 <2e-16 ***
## energia_metabolizable 3.067e+01 5.165e-03 5937 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.08908 on 17469 degrees of freedom
## Multiple R-squared: 0.9997, Adjusted R-squared: 0.9997
## F-statistic: 3.082e+07 on 2 and 17469 DF, p-value: < 2.2e-16
Con las variables fda y energia_metabolizable, el modelo_2 arrojó un R-cuadrado de 0.9997. Un carácter predictivo del 99.97%
AIC(modelo_2, modelo_12, modelo_completo)
## df AIC
## modelo_2 4 -34913.78
## modelo_12 32 21556.22
## modelo_completo 37 -141725.34
vif(modelo_2)
## fda energia_metabolizable
## 2.731306 2.731306
El modelo_2 presenta un AIC bajo de -34913.78 y el factor de inflación de varianza (vif) para las dos variables arroja rangos menores de 5, lo que sugiere la carencia de colinealidad entre ellas.
datos_lignina <- datos_modelo %>%
select(-ingrediente, -textura_de_suelo, -topografia, -lignina, lignina)
datos_lignina %>%
names()
## [1] "epoca_recoleccion" "altura_corte_cm" "altura_planta_cm"
## [4] "edad_corte_d" "ceniza" "extracto_etereo"
## [7] "fdn" "fda" "hemicelulosa"
## [10] "almidon" "carbohidratos_noes" "carbohidratos_solubles"
## [13] "digestibilidad_ms" "energia_digestible" "energia_metabolizable"
## [16] "energia_neta_manten" "energia_neta_ganancia" "energia_neta_lactancia"
## [19] "proteina" "lignina"
datos_ml1 <- datos_lignina %>%
select(altura_corte_cm:almidon, lignina)
ggpairs(data = datos_ml1, lower = list(continuous = "smooth"))
datos_ml2 <- datos_lignina %>%
select(carbohidratos_noes:proteina, lignina)
ggpairs(data = datos_ml2, lower = list(continuous = "smooth"))
La variable lignina presenta correlaciones más fuertes con otras variables que con la altura_corte_cm (36.9%) y altura_planta_cm(14,3%)
modelo_1l <- lm(lignina ~ altura_corte_cm + edad_corte_d, data = datos_lignina)
summary(modelo_1l)
##
## Call:
## lm(formula = lignina ~ altura_corte_cm + edad_corte_d, data = datos_lignina)
##
## Residuals:
## Min 1Q Median 3Q Max
## -5.1821 -0.8697 0.0313 0.8869 5.3779
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 7.0770610 0.0275282 257.08 <2e-16 ***
## altura_corte_cm 0.0498705 0.0009443 52.81 <2e-16 ***
## edad_corte_d -0.0124993 0.0006223 -20.09 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 1.412 on 17469 degrees of freedom
## Multiple R-squared: 0.1554, Adjusted R-squared: 0.1553
## F-statistic: 1607 on 2 and 17469 DF, p-value: < 2.2e-16
modelo_2l <- lm(lignina ~ fda + fdn , data = datos_lignina)
summary(modelo_2l)
##
## Call:
## lm(formula = lignina ~ fda + fdn, data = datos_lignina)
##
## Residuals:
## Min 1Q Median 3Q Max
## -3.7816 -0.4352 -0.0157 0.4257 3.0507
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -4.222480 0.042823 -98.60 <2e-16 ***
## fda 0.058015 0.002185 26.55 <2e-16 ***
## fdn 0.157312 0.001377 114.24 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.6803 on 17469 degrees of freedom
## Multiple R-squared: 0.8039, Adjusted R-squared: 0.8039
## F-statistic: 3.58e+04 on 2 and 17469 DF, p-value: < 2.2e-16
Para construir un modelo que prediga la variable lignina usaría como predictoras las variables fdn y fda con valor R-cuadrado de 0.80 (80%) en vez de las variables altura_corte_cm, edad_corte_d que arrojan R-cuadrado de 0.15 (22%).
datos_epoca_recoleccion <- datos_modelo %>%
select(c(epoca_recoleccion, proteina, ingrediente))
datos_epoca_recoleccion %>%
head()
## # A tibble: 6 x 3
## epoca_recoleccion proteina ingrediente
## <chr> <dbl> <chr>
## 1 Transición sequía a lluvia 18.4 Ryegrass perenne - Lolium perenne - Hoja,~
## 2 Transición sequía a lluvia 26.8 Ryegrass perenne - Lolium perenne - Hoja,~
## 3 Lluvia 12.4 Ryegrass perenne - Lolium perenne - Hoja,~
## 4 Lluvia 12.1 Ryegrass perenne - Lolium perenne - Hoja,~
## 5 Lluvia 11.7 Ryegrass perenne - Lolium perenne - Hoja,~
## 6 Lluvia 11.7 Ryegrass perenne - Lolium perenne - Hoja,~
datos_epoca_recoleccion %>%
group_by(epoca_recoleccion, ingrediente) %>%
summarise(promedio_proteina = mean(proteina,na.rm = TRUE)) %>%
ggplot(aes(x = epoca_recoleccion, y = promedio_proteina, color = ingrediente)) +
theme(axis.text.x = element_text(angle = 45, hjust = 1)) +
geom_point() +
geom_line(aes(group = ingrediente))
## `summarise()` has grouped output by 'epoca_recoleccion'. You can override using the `.groups` argument.
datos_epoca_recoleccion %>%
group_by(epoca_recoleccion) %>%
summarise(
pro_proteina = mean(proteina),
des_proteina = sd(proteina)
) %>%
ungroup() %>%
ggplot (aes(
x = epoca_recoleccion,
y = pro_proteina,
ymin = pro_proteina - des_proteina,
ymax = pro_proteina + des_proteina
)) +
theme(axis.text.x = element_text(angle = 20, hjust = 1))+
geom_point() +
geom_errorbar(width = 0.2) +
geom_hline (yintercept = promedio_proteina, lty = 2, color = "pink", size = 1 )
La epoca de recolección que transcurre en la transición de sequía a lluvia el promedio de proteína aumenta para los forrajes Rhodes - Chloris gayana, Buffel - Cenchrus ciliaris y Megathyrsus maximus sp.- Megathyrsus maximus sp. Para el forraje Ryegrass perenne - Lolium perenne la epoca de recolección conveniente es la transición de lluvia a sequía y para Kikuyo - Cenchrus clandestinus la mejor época de cosecha es en sequía
Recomendaríamos que se realice la recolección en la época de transición de sequía a lluvia, porque en esta los promedios de proteínas son mayores en los forrajes estudiados