library(tidyverse)
## -- Attaching packages --------------------------------------- tidyverse 1.3.1 --
## v ggplot2 3.3.5     v purrr   0.3.4
## v tibble  3.1.6     v dplyr   1.0.7
## v tidyr   1.2.0     v stringr 1.4.0
## v readr   1.4.0     v forcats 0.5.1
## -- Conflicts ------------------------------------------ tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag()    masks stats::lag()
library(readxl)
library(skimr)
library(janitor)
## 
## Attaching package: 'janitor'
## The following objects are masked from 'package:stats':
## 
##     chisq.test, fisher.test
library(tidymodels)
## Registered S3 method overwritten by 'tune':
##   method                   from   
##   required_pkgs.model_spec parsnip
## -- Attaching packages -------------------------------------- tidymodels 0.1.4 --
## v broom        0.7.9     v rsample      0.1.1
## v dials        0.1.0     v tune         0.1.6
## v infer        1.0.0     v workflows    0.2.4
## v modeldata    0.1.1     v workflowsets 0.1.0
## v parsnip      0.2.0     v yardstick    0.0.9
## v recipes      0.2.0
## Warning: package 'parsnip' was built under R version 4.1.3
## -- Conflicts ----------------------------------------- tidymodels_conflicts() --
## x scales::discard() masks purrr::discard()
## x dplyr::filter()   masks stats::filter()
## x recipes::fixed()  masks stringr::fixed()
## x dplyr::lag()      masks stats::lag()
## x yardstick::spec() masks readr::spec()
## x recipes::step()   masks stats::step()
## x tune::tune()      masks parsnip::tune()
## * Search for functions across packages at https://www.tidymodels.org/find/
library(GGally)
## Registered S3 method overwritten by 'GGally':
##   method from   
##   +.gg   ggplot2
library(plotly)
## 
## Attaching package: 'plotly'
## The following object is masked from 'package:ggplot2':
## 
##     last_plot
## The following object is masked from 'package:stats':
## 
##     filter
## The following object is masked from 'package:graphics':
## 
##     layout
library(ggeffects)
library(car)
## Loading required package: carData
## 
## Attaching package: 'car'
## The following object is masked from 'package:dplyr':
## 
##     recode
## The following object is masked from 'package:purrr':
## 
##     some
library(lmtest)
## Warning: package 'lmtest' was built under R version 4.1.3
## Loading required package: zoo
## 
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
## 
##     as.Date, as.Date.numeric

Actividad

Analizar la composición bromatológica de 5 gramíneas forrajeras con registros de 18 departamentos y 174 municipios de Colombia. Es de interés identificar factores (variables) que puedan ser considerados como importantes en la variabilidad de la composición bromatológica de las especies. .

Objetivo está orientado a ejecutar las siguientes actividades:

  • Validación de datos: deberá implementar algún mecanismo que le permita detectar (si existen) posibles errores en los datos.

  • Exploración de datos: construir gráficos que permitan atender la necesidad del planteamiento inicial.

  • Propuesta de modelación debe construir mínimo 3 modelos que permitan explicar y predecir la variable proteína.

  • Preguntas adicionales:

    ¿Es posible predecir la lignina con base en la altura y edad de corte? ¿Existen interacciones en los modelos que construyó para la variable proteína? Si alguien está interesado en establecer cuál es la mejor época de recolección, ¿usted qué le diría en términos estadísticos?

Exploratoria de Datos

datos <- read_csv("Alimentro_Depurada.csv") %>% 
  clean_names()
## 
## -- Column specification --------------------------------------------------------
## cols(
##   .default = col_double(),
##   ingrediente = col_character(),
##   departamento = col_character(),
##   municipio = col_character(),
##   topografia = col_character(),
##   textura_de_suelo = col_character(),
##   epoca_recoleccion = col_character()
## )
## i Use `spec()` for the full column specifications.
datos %>% 
  head()
## # A tibble: 6 x 25
##   ingrediente                 departamento municipio topografia textura_de_suelo
##   <chr>                       <chr>        <chr>     <chr>      <chr>           
## 1 Ryegrass perenne - Lolium ~ Putumayo     Sibundoy  Plana      ND              
## 2 Ryegrass perenne - Lolium ~ Putumayo     Sibundoy  Plana      ND              
## 3 Ryegrass perenne - Lolium ~ Cundinamarca Mosquera  Plana      Franco arcilloso
## 4 Ryegrass perenne - Lolium ~ Cundinamarca Mosquera  Plana      Franco arcilloso
## 5 Ryegrass perenne - Lolium ~ Cundinamarca Mosquera  Plana      Franco arcilloso
## 6 Ryegrass perenne - Lolium ~ Cundinamarca Mosquera  Plana      Franco arcilloso
## # ... with 20 more variables: epoca_recoleccion <chr>, altura_corte_cm <dbl>,
## #   altura_planta_cm <dbl>, edad_corte_d <dbl>, proteina <dbl>, ceniza <dbl>,
## #   extracto_etereo <dbl>, fdn <dbl>, fda <dbl>, lignina <dbl>,
## #   hemicelulosa <dbl>, almidon <dbl>, carbohidratos_noes <dbl>,
## #   carbohidratos_solubles <dbl>, digestibilidad_ms <dbl>,
## #   energia_digestible <dbl>, energia_metabolizable <dbl>,
## #   energia_neta_manten <dbl>, energia_neta_ganancia <dbl>, ...

Nombre de Variables:

datos %>% 
  names
##  [1] "ingrediente"            "departamento"           "municipio"             
##  [4] "topografia"             "textura_de_suelo"       "epoca_recoleccion"     
##  [7] "altura_corte_cm"        "altura_planta_cm"       "edad_corte_d"          
## [10] "proteina"               "ceniza"                 "extracto_etereo"       
## [13] "fdn"                    "fda"                    "lignina"               
## [16] "hemicelulosa"           "almidon"                "carbohidratos_noes"    
## [19] "carbohidratos_solubles" "digestibilidad_ms"      "energia_digestible"    
## [22] "energia_metabolizable"  "energia_neta_manten"    "energia_neta_ganancia" 
## [25] "energia_neta_lactancia"

Tipos de Variables:

datos %>% 
  glimpse()
## Rows: 17,472
## Columns: 25
## $ ingrediente            <chr> "Ryegrass perenne - Lolium perenne - Hoja, Tall~
## $ departamento           <chr> "Putumayo", "Putumayo", "Cundinamarca", "Cundin~
## $ municipio              <chr> "Sibundoy", "Sibundoy", "Mosquera", "Mosquera",~
## $ topografia             <chr> "Plana", "Plana", "Plana", "Plana", "Plana", "P~
## $ textura_de_suelo       <chr> "ND", "ND", "Franco arcilloso", "Franco arcillo~
## $ epoca_recoleccion      <chr> "Transición sequía a lluvia", "Transición sequí~
## $ altura_corte_cm        <dbl> 5, 5, 10, 10, 10, 10, 5, 5, 5, 5, 5, 5, 5, 5, 5~
## $ altura_planta_cm       <dbl> 25, 25, 48, 48, 48, 48, 12, 12, 12, 10, 10, 10,~
## $ edad_corte_d           <dbl> 35, 35, 77, 77, 77, 77, 42, 42, 42, 35, 35, 35,~
## $ proteina               <dbl> 18.35, 26.80, 12.36, 12.08, 11.67, 11.68, 13.01~
## $ ceniza                 <dbl> 9.62, 10.69, 10.00, 10.06, 9.74, 9.56, 11.10, 9~
## $ extracto_etereo        <dbl> 3.14, 3.26, 2.80, 2.77, 2.67, 2.85, 2.71, 2.65,~
## $ fdn                    <dbl> 50.45, 46.55, 62.84, 62.87, 62.80, 63.75, 49.16~
## $ fda                    <dbl> 26.37, 26.22, 33.34, 34.29, 34.07, 34.22, 28.65~
## $ lignina                <dbl> 5.15, 5.14, 8.03, 8.04, 8.33, 8.18, 5.72, 5.00,~
## $ hemicelulosa           <dbl> 24.08, 20.33, 29.50, 28.58, 28.73, 29.53, 20.51~
## $ almidon                <dbl> 8.78, 8.28, 5.79, 5.85, 6.18, 6.11, 5.25, 5.18,~
## $ carbohidratos_noes     <dbl> 13.57, 11.76, 9.05, 9.83, 10.14, 10.27, 12.23, ~
## $ carbohidratos_solubles <dbl> 4.80, 3.48, 3.27, 3.98, 3.97, 4.16, 6.99, 7.22,~
## $ digestibilidad_ms      <dbl> 65.85, 72.62, 58.88, 58.35, 58.10, 58.06, 60.87~
## $ energia_digestible     <dbl> 2.76, 3.12, 2.46, 2.43, 2.41, 2.42, 2.50, 2.56,~
## $ energia_metabolizable  <dbl> 2.21, 2.48, 1.92, 1.90, 1.89, 1.89, 2.00, 2.05,~
## $ energia_neta_manten    <dbl> 1.34, 1.59, 1.08, 1.06, 1.05, 1.05, 1.16, 1.20,~
## $ energia_neta_ganancia  <dbl> 0.77, 0.99, 0.52, 0.50, 0.49, 0.49, 0.59, 0.63,~
## $ energia_neta_lactancia <dbl> 1.36, 1.51, 1.20, 1.19, 1.18, 1.18, 1.24, 1.27,~

Se observan 25 variables incluida la variables objeto: proteina. Con seis variables categóricas (chr), entre las que figura la variable ingrediente, y 19 numéricas (dbl).

Resumen estadístico:

skim(datos)
Data summary
Name datos
Number of rows 17472
Number of columns 25
_______________________
Column type frequency:
character 6
numeric 19
________________________
Group variables None

Variable type: character

skim_variable n_missing complete_rate min max empty n_unique whitespace
ingrediente 0 1 37 63 0 5 0
departamento 0 1 4 18 0 18 0
municipio 0 1 3 27 0 174 0
topografia 0 1 2 9 0 4 0
textura_de_suelo 0 1 2 16 0 9 0
epoca_recoleccion 0 1 6 26 0 4 0

Variable type: numeric

skim_variable n_missing complete_rate mean sd p0 p25 p50 p75 p100 hist
altura_corte_cm 0 1 10.58 11.31 0.00 0.00 8.00 20.00 50.00 ▇▃▂▁▁
altura_planta_cm 0 1 48.58 30.54 0.00 26.50 46.40 66.70 330.00 ▇▃▁▁▁
edad_corte_d 0 1 37.31 17.16 0.00 28.00 35.00 42.00 147.00 ▇▇▂▁▁
proteina 0 1 13.20 5.29 2.87 8.92 12.08 17.13 32.87 ▅▇▅▂▁
ceniza 0 1 11.33 1.98 4.07 10.02 11.16 12.47 19.45 ▁▃▇▂▁
extracto_etereo 0 1 2.07 0.41 0.55 1.79 2.04 2.31 4.54 ▁▇▅▁▁
fdn 0 1 59.93 7.26 26.77 54.94 61.72 65.34 80.98 ▁▁▅▇▁
fda 0 1 33.31 4.58 13.78 30.42 33.61 36.32 49.85 ▁▂▇▅▁
lignina 0 1 7.14 1.54 1.37 6.09 7.32 8.26 11.93 ▁▃▇▇▁
hemicelulosa 0 1 26.63 4.09 7.71 24.16 27.47 29.56 42.15 ▁▂▇▆▁
almidon 0 1 5.22 2.17 0.01 3.75 5.29 6.77 16.85 ▃▇▃▁▁
carbohidratos_noes 0 1 7.68 3.23 0.02 5.39 7.36 9.65 22.46 ▂▇▃▁▁
carbohidratos_solubles 0 1 2.47 1.90 0.01 1.07 1.98 3.39 15.63 ▇▂▁▁▁
digestibilidad_ms 0 1 59.55 5.28 46.29 55.43 58.58 63.63 77.68 ▁▇▆▃▁
energia_digestible 0 1 2.45 0.26 1.86 2.24 2.40 2.64 3.37 ▂▇▆▂▁
energia_metabolizable 0 1 1.95 0.22 1.41 1.78 1.91 2.12 2.69 ▁▇▆▃▁
energia_neta_manten 0 1 1.10 0.20 0.57 0.94 1.07 1.26 1.77 ▁▇▆▃▁
energia_neta_ganancia 0 1 0.54 0.19 0.04 0.40 0.51 0.69 1.15 ▁▇▆▅▁
energia_neta_lactancia 0 1 1.21 0.12 0.91 1.12 1.19 1.31 1.63 ▁▇▆▃▁

las variables presentan la totalidad de los datos (complete_rate =1). La variable proteína ostenta una media de 13,2, con desviación estandar de 5,29 unidades

Mover proteina a la última columna:

datos_si <- datos %>% 
  select(- proteina, proteina)
datos_si
## # A tibble: 17,472 x 25
##    ingrediente                departamento municipio topografia textura_de_suelo
##    <chr>                      <chr>        <chr>     <chr>      <chr>           
##  1 Ryegrass perenne - Lolium~ Putumayo     Sibundoy  Plana      ND              
##  2 Ryegrass perenne - Lolium~ Putumayo     Sibundoy  Plana      ND              
##  3 Ryegrass perenne - Lolium~ Cundinamarca Mosquera  Plana      Franco arcilloso
##  4 Ryegrass perenne - Lolium~ Cundinamarca Mosquera  Plana      Franco arcilloso
##  5 Ryegrass perenne - Lolium~ Cundinamarca Mosquera  Plana      Franco arcilloso
##  6 Ryegrass perenne - Lolium~ Cundinamarca Mosquera  Plana      Franco arcilloso
##  7 Ryegrass perenne - Lolium~ Cundinamarca Mosquera  Plana      Franco          
##  8 Ryegrass perenne - Lolium~ Cundinamarca Mosquera  Plana      Franco          
##  9 Ryegrass perenne - Lolium~ Cundinamarca Mosquera  Plana      Franco          
## 10 Ryegrass perenne - Lolium~ Cundinamarca Mosquera  Plana      Franco          
## # ... with 17,462 more rows, and 20 more variables: epoca_recoleccion <chr>,
## #   altura_corte_cm <dbl>, altura_planta_cm <dbl>, edad_corte_d <dbl>,
## #   ceniza <dbl>, extracto_etereo <dbl>, fdn <dbl>, fda <dbl>, lignina <dbl>,
## #   hemicelulosa <dbl>, almidon <dbl>, carbohidratos_noes <dbl>,
## #   carbohidratos_solubles <dbl>, digestibilidad_ms <dbl>,
## #   energia_digestible <dbl>, energia_metabolizable <dbl>,
## #   energia_neta_manten <dbl>, energia_neta_ganancia <dbl>, ...

Se ubicó a la variable objeto hasta la última columna del dataframe y facilitar, así, la realización de las matríces de correlación

Relación de la proteina en función de las variables categóricas y Numéricas.

Nos enfocamos en la relación que existe entre los grupos conformados por las variables proteína, ingrediente y algunas de las otras variables, tanto categóricas como numéricas.

Gráfica_1: Distribución proteina con respecto a ingrediente.

datos_si %>% 
  ggplot(aes(x = proteina, fill = ingrediente)) +
  geom_density(alpha = 0.5)

Gráfica_2: Estadísticos_plot proteina con respecto a ingrediente.

promedio_proteina <- datos_si %>% 
  pull(proteina) %>% 
  mean(na.rm = TRUE)
promedio_proteina
## [1] 13.19589
datos_si %>% 
  group_by(ingrediente) %>%
  summarise( 
    pro_proteina = mean(proteina),
    des_proteina = sd(proteina)
  ) %>% 
  
  ungroup() %>% 
  ggplot (aes(
    x = ingrediente,
    y = pro_proteina,
    ymin = pro_proteina - des_proteina,
    ymax = pro_proteina + des_proteina
   )) + 
  theme(axis.text.x = element_text(angle = 20, hjust = 1))+
  geom_point() +
  geom_errorbar(width = 0.2) +
  geom_hline (yintercept = promedio_proteina, lty = 2, color = "pink", size = 1 )

Datos para estadísticos (mean, sd) de ingrediente_Kikuyo y Ryegrass Perenne:

datos_mean_sd_K <- filter(datos_si, ingrediente == "Kikuyo - Cenchrus clandestinus - Hoja, Tallo", na.rm = TRUE )
datos_mean_sd_K
## # A tibble: 4,613 x 25
##    ingrediente                departamento municipio topografia textura_de_suelo
##    <chr>                      <chr>        <chr>     <chr>      <chr>           
##  1 Kikuyo - Cenchrus clandes~ Norte de Sa~ Pamplona  Plana      Limoso          
##  2 Kikuyo - Cenchrus clandes~ Cundinamarca Soacha    Plana      Franco          
##  3 Kikuyo - Cenchrus clandes~ Cundinamarca Soacha    Plana      Franco          
##  4 Kikuyo - Cenchrus clandes~ Cundinamarca Soacha    Plana      Franco          
##  5 Kikuyo - Cenchrus clandes~ Cundinamarca Soacha    Plana      Franco          
##  6 Kikuyo - Cenchrus clandes~ Cundinamarca Soacha    Plana      Franco          
##  7 Kikuyo - Cenchrus clandes~ Cundinamarca Mosquera  Plana      Franco          
##  8 Kikuyo - Cenchrus clandes~ Cundinamarca Mosquera  Plana      Franco          
##  9 Kikuyo - Cenchrus clandes~ Cundinamarca Mosquera  Plana      Franco          
## 10 Kikuyo - Cenchrus clandes~ Cundinamarca Mosquera  Plana      Franco          
## # ... with 4,603 more rows, and 20 more variables: epoca_recoleccion <chr>,
## #   altura_corte_cm <dbl>, altura_planta_cm <dbl>, edad_corte_d <dbl>,
## #   ceniza <dbl>, extracto_etereo <dbl>, fdn <dbl>, fda <dbl>, lignina <dbl>,
## #   hemicelulosa <dbl>, almidon <dbl>, carbohidratos_noes <dbl>,
## #   carbohidratos_solubles <dbl>, digestibilidad_ms <dbl>,
## #   energia_digestible <dbl>, energia_metabolizable <dbl>,
## #   energia_neta_manten <dbl>, energia_neta_ganancia <dbl>, ...
mean_Kikuyo <- datos_mean_sd_K %>% 
  pull(proteina) %>% 
  mean()
mean_Kikuyo
## [1] 17.7967
sd_Kikuyo <- datos_mean_sd_K %>%
  pull (proteina) %>% 
  sd()
sd_Kikuyo
## [1] 3.884778
datos_mean_sd_R <- filter(datos_si, ingrediente == "Ryegrass perenne - Lolium perenne - Hoja, Tallo", na.rm = TRUE )
datos_mean_sd_R
## # A tibble: 3,018 x 25
##    ingrediente                departamento municipio topografia textura_de_suelo
##    <chr>                      <chr>        <chr>     <chr>      <chr>           
##  1 Ryegrass perenne - Lolium~ Putumayo     Sibundoy  Plana      ND              
##  2 Ryegrass perenne - Lolium~ Putumayo     Sibundoy  Plana      ND              
##  3 Ryegrass perenne - Lolium~ Cundinamarca Mosquera  Plana      Franco arcilloso
##  4 Ryegrass perenne - Lolium~ Cundinamarca Mosquera  Plana      Franco arcilloso
##  5 Ryegrass perenne - Lolium~ Cundinamarca Mosquera  Plana      Franco arcilloso
##  6 Ryegrass perenne - Lolium~ Cundinamarca Mosquera  Plana      Franco arcilloso
##  7 Ryegrass perenne - Lolium~ Cundinamarca Mosquera  Plana      Franco          
##  8 Ryegrass perenne - Lolium~ Cundinamarca Mosquera  Plana      Franco          
##  9 Ryegrass perenne - Lolium~ Cundinamarca Mosquera  Plana      Franco          
## 10 Ryegrass perenne - Lolium~ Cundinamarca Mosquera  Plana      Franco          
## # ... with 3,008 more rows, and 20 more variables: epoca_recoleccion <chr>,
## #   altura_corte_cm <dbl>, altura_planta_cm <dbl>, edad_corte_d <dbl>,
## #   ceniza <dbl>, extracto_etereo <dbl>, fdn <dbl>, fda <dbl>, lignina <dbl>,
## #   hemicelulosa <dbl>, almidon <dbl>, carbohidratos_noes <dbl>,
## #   carbohidratos_solubles <dbl>, digestibilidad_ms <dbl>,
## #   energia_digestible <dbl>, energia_metabolizable <dbl>,
## #   energia_neta_manten <dbl>, energia_neta_ganancia <dbl>, ...
mean_Ryegrass <- datos_mean_sd_R %>% 
  pull(proteina) %>% 
  mean()
mean_Ryegrass
## [1] 17.97793
sd_Ryegrass <- datos_mean_sd_R %>%
  pull (proteina) %>% 
  sd()
sd_Ryegrass
## [1] 4.219584

Los ingredientes representados por los forrajes Kikuyo y Ryegrass perenne, presentan datos distribuidos estadísticos, similares, en valores por encima del promedio de la variable proteína

Las otros ingredientes presentan distribuciones similares con promedios inferiores a la media de la variable proteína

Gráfica_3: Agrupado proteina, epoca_recoleccion e ingrediente.

datos_si %>%
  group_by(epoca_recoleccion, ingrediente) %>%
  summarise(promedio_proteina = mean(proteina, na.rm = TRUE)) %>%
  ggplot(aes(x = epoca_recoleccion, y = promedio_proteina, color = ingrediente)) +
  theme(axis.text.x = element_text(angle = 45, hjust = 1)) +
  geom_point() +
  geom_line(aes(group = ingrediente))
## `summarise()` has grouped output by 'epoca_recoleccion'. You can override using the `.groups` argument.

Gráfica_4: Agrupado proteina, textura de suelo e ingrediente.

datos_si %>%
  group_by(textura_de_suelo, ingrediente) %>%
  summarise(promedio_proteina = mean(proteina, na.rm = TRUE)) %>%
  ggplot(aes(x = textura_de_suelo, y = promedio_proteina, color = ingrediente)) +
  theme(axis.text.x = element_text(angle = 45, hjust = 1)) +
  geom_point() +
  geom_line(aes(group = ingrediente))
## `summarise()` has grouped output by 'textura_de_suelo'. You can override using the `.groups` argument.

Altura de corte respecto textura de suelo

datos_si %>%
  group_by(textura_de_suelo, ingrediente) %>%
  summarise(promedio_alturacorte = mean(altura_corte_cm,na.rm = TRUE), promedio_proteina = mean(proteina, na.rm = TRUE)) %>%
  ggplot(aes(x = promedio_alturacorte, y = promedio_proteina, color = ingrediente)) +
  theme(axis.text.x = element_text(angle = 45, hjust = 1)) +
  geom_point() +
  geom_line(aes(group = ingrediente))
## `summarise()` has grouped output by 'textura_de_suelo'. You can override using the `.groups` argument.

Gráfica_5: Agrupado departamento e ingrediente.

datos_si %>% 
  group_by(departamento, ingrediente) %>% 
  summarise(promedio = mean(proteina, na.rm = TRUE)) %>% 
  ggplot(aes(x = departamento, y = promedio, color = ingrediente)) +
  theme(axis.text.x = element_text(angle = 45, hjust = 1)) +
  geom_point() +
  geom_line(aes(group = ingrediente))
## `summarise()` has grouped output by 'departamento'. You can override using the `.groups` argument.

Gráfica_6: Promedio Proteina por departamento.

datos_si %>% 
  group_by(departamento) %>% 
  summarise(promedio_proteina= mean(proteina)) %>% 
  ggplot(mapping = aes(x = fct_reorder(departamento, promedio_proteina), y = promedio_proteina)) +
  geom_col(color = "red", fill = "pink") +
  coord_flip()

Departemento x Promedio proteína:

datos_dto <- datos_si %>% 
  select(c(departamento, ingrediente))
datos_dto %>% 
  head()
## # A tibble: 6 x 2
##   departamento ingrediente                                    
##   <chr>        <chr>                                          
## 1 Putumayo     Ryegrass perenne - Lolium perenne - Hoja, Tallo
## 2 Putumayo     Ryegrass perenne - Lolium perenne - Hoja, Tallo
## 3 Cundinamarca Ryegrass perenne - Lolium perenne - Hoja, Tallo
## 4 Cundinamarca Ryegrass perenne - Lolium perenne - Hoja, Tallo
## 5 Cundinamarca Ryegrass perenne - Lolium perenne - Hoja, Tallo
## 6 Cundinamarca Ryegrass perenne - Lolium perenne - Hoja, Tallo

Putumayo:

putumayo_ingre <- filter(datos_dto, departamento == "Putumayo")
putumayo_ingre
## # A tibble: 6 x 2
##   departamento ingrediente                                    
##   <chr>        <chr>                                          
## 1 Putumayo     Ryegrass perenne - Lolium perenne - Hoja, Tallo
## 2 Putumayo     Ryegrass perenne - Lolium perenne - Hoja, Tallo
## 3 Putumayo     Kikuyo - Cenchrus clandestinus - Hoja, Tallo   
## 4 Putumayo     Kikuyo - Cenchrus clandestinus - Hoja, Tallo   
## 5 Putumayo     Kikuyo - Cenchrus clandestinus - Hoja, Tallo   
## 6 Putumayo     Kikuyo - Cenchrus clandestinus - Hoja, Tallo

Boyacá

Boyaca_ingre <- filter(datos_dto, departamento == "Boyacá")
Boyaca_ingre
## # A tibble: 1,613 x 2
##    departamento ingrediente                                    
##    <chr>        <chr>                                          
##  1 Boyacá       Ryegrass perenne - Lolium perenne - Hoja, Tallo
##  2 Boyacá       Ryegrass perenne - Lolium perenne - Hoja, Tallo
##  3 Boyacá       Ryegrass perenne - Lolium perenne - Hoja, Tallo
##  4 Boyacá       Ryegrass perenne - Lolium perenne - Hoja, Tallo
##  5 Boyacá       Ryegrass perenne - Lolium perenne - Hoja, Tallo
##  6 Boyacá       Ryegrass perenne - Lolium perenne - Hoja, Tallo
##  7 Boyacá       Ryegrass perenne - Lolium perenne - Hoja, Tallo
##  8 Boyacá       Ryegrass perenne - Lolium perenne - Hoja, Tallo
##  9 Boyacá       Ryegrass perenne - Lolium perenne - Hoja, Tallo
## 10 Boyacá       Ryegrass perenne - Lolium perenne - Hoja, Tallo
## # ... with 1,603 more rows

Observamos pocos datos en algunas relaciones entre las variables departamento e ingrediente, por ejemplo, en el caso de putumayo sólo hay 6 datos, uno para Cauca, Seis para Bogotá y uno para Atlántico. Lo que puede sesgar la inferencia que se hace sobre la media en la proteína relacionada con el departamento

Los datos reflejados en las gráficas, fruto de la relación entre la variables ingrediente, proteína, epoca_de_recolección, textura_de_suelo, altura de corte y departamento, muestran que, independiente de las variables, el promedio mas alto de proteína se mantiene en los forrajes Kikuyo y Ryegrass Perenne

El departamento de putumayo relaciona los promedios de proteína más altos (gráfica 6). Se debe, al parecer, porque los forrajes Kikuyo y Ryegrass están asignados a ese departamento (gráfica_5). (con pocos datos)

El forraje mas relacionado con los departamentos es Kikuyo (13)

Los forrajes que menos se relacionan con los departamentos son Buffel y Rhodes (4 respectivamente).

Antioquia: Panorama regional

Antioquia_ingre <- filter(datos_dto, departamento == "Antioquia")
Antioquia_ingre
## # A tibble: 2,858 x 2
##    departamento ingrediente                                    
##    <chr>        <chr>                                          
##  1 Antioquia    Ryegrass perenne - Lolium perenne - Hoja, Tallo
##  2 Antioquia    Ryegrass perenne - Lolium perenne - Hoja, Tallo
##  3 Antioquia    Ryegrass perenne - Lolium perenne - Hoja, Tallo
##  4 Antioquia    Ryegrass perenne - Lolium perenne - Hoja, Tallo
##  5 Antioquia    Ryegrass perenne - Lolium perenne - Hoja, Tallo
##  6 Antioquia    Kikuyo - Cenchrus clandestinus - Hoja, Tallo   
##  7 Antioquia    Kikuyo - Cenchrus clandestinus - Hoja, Tallo   
##  8 Antioquia    Kikuyo - Cenchrus clandestinus - Hoja, Tallo   
##  9 Antioquia    Kikuyo - Cenchrus clandestinus - Hoja, Tallo   
## 10 Antioquia    Kikuyo - Cenchrus clandestinus - Hoja, Tallo   
## # ... with 2,848 more rows
Antioquia_Ryegrass <- Antioquia_ingre %>% 
  filter(ingrediente == "Ryegrass perenne - Lolium perenne - Hoja, Tallo")
Antioquia_Ryegrass
## # A tibble: 5 x 2
##   departamento ingrediente                                    
##   <chr>        <chr>                                          
## 1 Antioquia    Ryegrass perenne - Lolium perenne - Hoja, Tallo
## 2 Antioquia    Ryegrass perenne - Lolium perenne - Hoja, Tallo
## 3 Antioquia    Ryegrass perenne - Lolium perenne - Hoja, Tallo
## 4 Antioquia    Ryegrass perenne - Lolium perenne - Hoja, Tallo
## 5 Antioquia    Ryegrass perenne - Lolium perenne - Hoja, Tallo
Antioquia_Kikuyo <- Antioquia_ingre %>% 
  filter(ingrediente == "Kikuyo - Cenchrus clandestinus - Hoja, Tallo")
Antioquia_Kikuyo
## # A tibble: 227 x 2
##    departamento ingrediente                                 
##    <chr>        <chr>                                       
##  1 Antioquia    Kikuyo - Cenchrus clandestinus - Hoja, Tallo
##  2 Antioquia    Kikuyo - Cenchrus clandestinus - Hoja, Tallo
##  3 Antioquia    Kikuyo - Cenchrus clandestinus - Hoja, Tallo
##  4 Antioquia    Kikuyo - Cenchrus clandestinus - Hoja, Tallo
##  5 Antioquia    Kikuyo - Cenchrus clandestinus - Hoja, Tallo
##  6 Antioquia    Kikuyo - Cenchrus clandestinus - Hoja, Tallo
##  7 Antioquia    Kikuyo - Cenchrus clandestinus - Hoja, Tallo
##  8 Antioquia    Kikuyo - Cenchrus clandestinus - Hoja, Tallo
##  9 Antioquia    Kikuyo - Cenchrus clandestinus - Hoja, Tallo
## 10 Antioquia    Kikuyo - Cenchrus clandestinus - Hoja, Tallo
## # ... with 217 more rows
Antioquia_Buffel <- Antioquia_ingre %>% 
  filter(ingrediente == "Buffel - Cenchrus ciliaris - Hoja, Tallo")
Antioquia_Buffel
## # A tibble: 190 x 2
##    departamento ingrediente                             
##    <chr>        <chr>                                   
##  1 Antioquia    Buffel - Cenchrus ciliaris - Hoja, Tallo
##  2 Antioquia    Buffel - Cenchrus ciliaris - Hoja, Tallo
##  3 Antioquia    Buffel - Cenchrus ciliaris - Hoja, Tallo
##  4 Antioquia    Buffel - Cenchrus ciliaris - Hoja, Tallo
##  5 Antioquia    Buffel - Cenchrus ciliaris - Hoja, Tallo
##  6 Antioquia    Buffel - Cenchrus ciliaris - Hoja, Tallo
##  7 Antioquia    Buffel - Cenchrus ciliaris - Hoja, Tallo
##  8 Antioquia    Buffel - Cenchrus ciliaris - Hoja, Tallo
##  9 Antioquia    Buffel - Cenchrus ciliaris - Hoja, Tallo
## 10 Antioquia    Buffel - Cenchrus ciliaris - Hoja, Tallo
## # ... with 180 more rows
Antioquia_Rhodes <- Antioquia_ingre %>% 
  filter(ingrediente == "Rhodes - Chloris gayana - Hoja, Tallo")
Antioquia_Rhodes
## # A tibble: 240 x 2
##    departamento ingrediente                          
##    <chr>        <chr>                                
##  1 Antioquia    Rhodes - Chloris gayana - Hoja, Tallo
##  2 Antioquia    Rhodes - Chloris gayana - Hoja, Tallo
##  3 Antioquia    Rhodes - Chloris gayana - Hoja, Tallo
##  4 Antioquia    Rhodes - Chloris gayana - Hoja, Tallo
##  5 Antioquia    Rhodes - Chloris gayana - Hoja, Tallo
##  6 Antioquia    Rhodes - Chloris gayana - Hoja, Tallo
##  7 Antioquia    Rhodes - Chloris gayana - Hoja, Tallo
##  8 Antioquia    Rhodes - Chloris gayana - Hoja, Tallo
##  9 Antioquia    Rhodes - Chloris gayana - Hoja, Tallo
## 10 Antioquia    Rhodes - Chloris gayana - Hoja, Tallo
## # ... with 230 more rows
Antioquia_Megathyrsus <- Antioquia_ingre %>% 
  filter(ingrediente == "Megathyrsus maximus sp. - Megathyrsus maximus sp. - Hoja, Tallo")
Antioquia_Megathyrsus
## # A tibble: 2,196 x 2
##    departamento ingrediente                                                    
##    <chr>        <chr>                                                          
##  1 Antioquia    Megathyrsus maximus sp. - Megathyrsus maximus sp. - Hoja, Tallo
##  2 Antioquia    Megathyrsus maximus sp. - Megathyrsus maximus sp. - Hoja, Tallo
##  3 Antioquia    Megathyrsus maximus sp. - Megathyrsus maximus sp. - Hoja, Tallo
##  4 Antioquia    Megathyrsus maximus sp. - Megathyrsus maximus sp. - Hoja, Tallo
##  5 Antioquia    Megathyrsus maximus sp. - Megathyrsus maximus sp. - Hoja, Tallo
##  6 Antioquia    Megathyrsus maximus sp. - Megathyrsus maximus sp. - Hoja, Tallo
##  7 Antioquia    Megathyrsus maximus sp. - Megathyrsus maximus sp. - Hoja, Tallo
##  8 Antioquia    Megathyrsus maximus sp. - Megathyrsus maximus sp. - Hoja, Tallo
##  9 Antioquia    Megathyrsus maximus sp. - Megathyrsus maximus sp. - Hoja, Tallo
## 10 Antioquia    Megathyrsus maximus sp. - Megathyrsus maximus sp. - Hoja, Tallo
## # ... with 2,186 more rows

Muestra representativa de municipios de Antioquia.

municipios_ant <- datos_si %>% 
  select(c(municipio, departamento))
municipios_ant %>% 
  head()
## # A tibble: 6 x 2
##   municipio departamento
##   <chr>     <chr>       
## 1 Sibundoy  Putumayo    
## 2 Sibundoy  Putumayo    
## 3 Mosquera  Cundinamarca
## 4 Mosquera  Cundinamarca
## 5 Mosquera  Cundinamarca
## 6 Mosquera  Cundinamarca
Antioquia_mun <- municipios_ant %>% 
  filter(departamento == "Antioquia") 
municipioA <- Antioquia_mun %>% group_by(municipio) %>% filter (!duplicated(municipio))
municipioA
## # A tibble: 21 x 2
## # Groups:   municipio [21]
##    municipio              departamento
##    <chr>                  <chr>       
##  1 San Pedro              Antioquia   
##  2 Don Matías             Antioquia   
##  3 Santa Rosa de Osos     Antioquia   
##  4 Belmira                Antioquia   
##  5 Bello                  Antioquia   
##  6 Entrerrios             Antioquia   
##  7 San José de la Montaña Antioquia   
##  8 Rionegro               Antioquia   
##  9 Medellín               Antioquia   
## 10 Marinilla              Antioquia   
## # ... with 11 more rows
sort(municipioA$municipio)
##  [1] "Angostura"              "Barbosa"                "Bello"                 
##  [4] "Belmira"                "Don Matías"             "El Carmen de Viboral"  
##  [7] "Entrerrios"             "Guarne"                 "La Ceja"               
## [10] "La Unión"               "Marinilla"              "Medellín"              
## [13] "Retiro"                 "Rionegro"               "San Jerónimo"          
## [16] "San José de la Montaña" "San Pedro"              "San Roque"             
## [19] "Santa Rosa de Osos"     "Sonson"                 "Yarumal"

Es acaso la variable topografía la que incide en la siembra de forrajes con baja expresión proteíca en los municipios muestra de Antioquia?

topografiaA <- datos_si %>%
  select(c(departamento, topografia, municipio))
topografiaA2 <- topografiaA %>% 
  filter(departamento == "Antioquia") %>%
  group_by(municipio) %>% filter(!duplicated(municipio))
topografiaA2
## # A tibble: 21 x 3
## # Groups:   municipio [21]
##    departamento topografia municipio             
##    <chr>        <chr>      <chr>                 
##  1 Antioquia    Pendiente  San Pedro             
##  2 Antioquia    Pendiente  Don Matías            
##  3 Antioquia    Ondulada   Santa Rosa de Osos    
##  4 Antioquia    Ondulada   Belmira               
##  5 Antioquia    Pendiente  Bello                 
##  6 Antioquia    Pendiente  Entrerrios            
##  7 Antioquia    Ondulada   San José de la Montaña
##  8 Antioquia    Ondulada   Rionegro              
##  9 Antioquia    Ondulada   Medellín              
## 10 Antioquia    Ondulada   Marinilla             
## # ... with 11 more rows

Los 21 municipios representativos del departemento de Antioquia cultivan forrajes con baja expresión proteica, por lo que parece es debido a la adaptación de las variedades Megathyrsus maximus sp. y rhodes a las condiciones topográficas y climáticas de esas regiones

Matrices de Correlación_Variables cuantitativas:

datos_count <- datos_si %>% 
  select(altura_corte_cm:energia_neta_lactancia, proteina)
datos_count1 <- datos_si %>% 
  select(altura_corte_cm:fdn, proteina)

ggpairs(data = datos_count1, lower = list(continuous = "smooth"))

datos_count2 <- datos_si %>% 
  select(fda:carbohidratos_solubles, proteina)

ggpairs(data = datos_count2, lower = list(continuous = "smooth"))

datos_count3 <- datos_si %>% 
  select(digestibilidad_ms:energia_neta_lactancia, proteina)

ggpairs(data = datos_count3, lower = list(continuous = "smooth"))

Las variables: digestibilidad_ms, energia_digestible, energia_metabolizable, energia_neta_manten, energia_neta_ganancia y energia_neta_lactancia muestran correlaciones que superan el 90% con la proteína, es decir, influyen en la variación de ésta.

Las anteriores variables también presentan importante correlación entre ellas, lo que podría inducir a la multicolinelaidad del modelo estructurado con éstas

Será el modelo conformado por la variable categórica “ingrediente” junto aLgunas de las cuantitativas que presentan mayor correlación con la variable proteína, el que ostente mayor carácter predictivo.?

Modelos:

datos_modelo <- datos_si %>% 
  select(c(-departamento, -municipio))

datos_modelo %>% 
  names()
##  [1] "ingrediente"            "topografia"             "textura_de_suelo"      
##  [4] "epoca_recoleccion"      "altura_corte_cm"        "altura_planta_cm"      
##  [7] "edad_corte_d"           "ceniza"                 "extracto_etereo"       
## [10] "fdn"                    "fda"                    "lignina"               
## [13] "hemicelulosa"           "almidon"                "carbohidratos_noes"    
## [16] "carbohidratos_solubles" "digestibilidad_ms"      "energia_digestible"    
## [19] "energia_metabolizable"  "energia_neta_manten"    "energia_neta_ganancia" 
## [22] "energia_neta_lactancia" "proteina"
datos_sin_ingrediente <- datos_modelo %>% 
  select(c(-ingrediente))
datos_sin_ingrediente %>% 
  names()
##  [1] "topografia"             "textura_de_suelo"       "epoca_recoleccion"     
##  [4] "altura_corte_cm"        "altura_planta_cm"       "edad_corte_d"          
##  [7] "ceniza"                 "extracto_etereo"        "fdn"                   
## [10] "fda"                    "lignina"                "hemicelulosa"          
## [13] "almidon"                "carbohidratos_noes"     "carbohidratos_solubles"
## [16] "digestibilidad_ms"      "energia_digestible"     "energia_metabolizable" 
## [19] "energia_neta_manten"    "energia_neta_ganancia"  "energia_neta_lactancia"
## [22] "proteina"
datos_sin_corre <- datos_modelo %>% 
  select(c(-digestibilidad_ms, -energia_digestible, -energia_metabolizable, -energia_neta_manten, -energia_neta_ganancia, -energia_neta_lactancia))
datos_sin_corre %>% 
  names()
##  [1] "ingrediente"            "topografia"             "textura_de_suelo"      
##  [4] "epoca_recoleccion"      "altura_corte_cm"        "altura_planta_cm"      
##  [7] "edad_corte_d"           "ceniza"                 "extracto_etereo"       
## [10] "fdn"                    "fda"                    "lignina"               
## [13] "hemicelulosa"           "almidon"                "carbohidratos_noes"    
## [16] "carbohidratos_solubles" "proteina"
datos_sin_corre_mas_1 <- datos_modelo %>% 
  select(c(-digestibilidad_ms, -energia_metabolizable, -energia_neta_manten, -energia_neta_ganancia, -energia_neta_lactancia))
datos_sin_corre_mas_1 %>% 
  names()
##  [1] "ingrediente"            "topografia"             "textura_de_suelo"      
##  [4] "epoca_recoleccion"      "altura_corte_cm"        "altura_planta_cm"      
##  [7] "edad_corte_d"           "ceniza"                 "extracto_etereo"       
## [10] "fdn"                    "fda"                    "lignina"               
## [13] "hemicelulosa"           "almidon"                "carbohidratos_noes"    
## [16] "carbohidratos_solubles" "energia_digestible"     "proteina"

Modelo_Completo

modelo_completo <- lm(proteina ~  ., data = datos_modelo)
summary(modelo_completo)
## 
## Call:
## lm(formula = proteina ~ ., data = datos_modelo)
## 
## Residuals:
##        Min         1Q     Median         3Q        Max 
## -0.0111733 -0.0033152  0.0000092  0.0032852  0.0136070 
## 
## Coefficients: (1 not defined because of singularities)
##                                                                              Estimate
## (Intercept)                                                                -7.568e+01
## ingredienteKikuyo - Cenchrus clandestinus - Hoja, Tallo                    -1.485e-03
## ingredienteMegathyrsus maximus sp. - Megathyrsus maximus sp. - Hoja, Tallo -4.262e-04
## ingredienteRhodes - Chloris gayana - Hoja, Tallo                           -4.507e-04
## ingredienteRyegrass perenne - Lolium perenne - Hoja, Tallo                 -1.158e-04
## topografiaOndulada                                                          7.898e-04
## topografiaPendiente                                                         1.092e-03
## topografiaPlana                                                             6.053e-04
## textura_de_sueloArenoso                                                    -2.657e-04
## textura_de_sueloFranco                                                     -3.183e-04
## textura_de_sueloFranco arcilloso                                           -2.048e-06
## textura_de_sueloFranco arenoso                                             -8.780e-04
## textura_de_sueloFranco limoso                                              -5.376e-04
## textura_de_sueloLimoso                                                     -8.219e-04
## textura_de_sueloND                                                         -4.192e-04
## textura_de_sueloOtro                                                        7.759e-04
## epoca_recoleccionSequía                                                     1.844e-04
## epoca_recoleccionTransición lluvia a sequía                                 3.136e-04
## epoca_recoleccionTransición sequía a lluvia                                -1.045e-04
## altura_corte_cm                                                             5.137e-06
## altura_planta_cm                                                            8.917e-07
## edad_corte_d                                                                4.441e-07
## ceniza                                                                     -3.350e-05
## extracto_etereo                                                            -7.862e-04
## fdn                                                                        -9.448e-05
## fda                                                                         3.947e-01
## lignina                                                                     1.964e-04
## hemicelulosa                                                                       NA
## almidon                                                                    -2.079e-03
## carbohidratos_noes                                                          2.033e-03
## carbohidratos_solubles                                                     -2.094e-03
## digestibilidad_ms                                                           1.278e+00
## energia_digestible                                                          4.103e-03
## energia_metabolizable                                                       7.604e-02
## energia_neta_manten                                                        -3.231e-01
## energia_neta_ganancia                                                      -4.545e-01
## energia_neta_lactancia                                                      4.620e-02
##                                                                            Std. Error
## (Intercept)                                                                 1.187e-02
## ingredienteKikuyo - Cenchrus clandestinus - Hoja, Tallo                     1.983e-04
## ingredienteMegathyrsus maximus sp. - Megathyrsus maximus sp. - Hoja, Tallo  1.450e-04
## ingredienteRhodes - Chloris gayana - Hoja, Tallo                            1.632e-04
## ingredienteRyegrass perenne - Lolium perenne - Hoja, Tallo                  2.320e-04
## topografiaOndulada                                                          5.956e-04
## topografiaPendiente                                                         6.254e-04
## topografiaPlana                                                             5.968e-04
## textura_de_sueloArenoso                                                     2.619e-04
## textura_de_sueloFranco                                                      1.703e-04
## textura_de_sueloFranco arcilloso                                            1.223e-04
## textura_de_sueloFranco arenoso                                              1.345e-04
## textura_de_sueloFranco limoso                                               2.196e-04
## textura_de_sueloLimoso                                                      3.113e-04
## textura_de_sueloND                                                          2.006e-04
## textura_de_sueloOtro                                                        5.725e-04
## epoca_recoleccionSequía                                                     7.633e-05
## epoca_recoleccionTransición lluvia a sequía                                 1.587e-04
## epoca_recoleccionTransición sequía a lluvia                                 1.465e-04
## altura_corte_cm                                                             4.586e-06
## altura_planta_cm                                                            1.602e-06
## edad_corte_d                                                                2.493e-06
## ceniza                                                                      2.506e-05
## extracto_etereo                                                             1.338e-04
## fdn                                                                         1.844e-05
## fda                                                                         1.974e-05
## lignina                                                                     6.259e-05
## hemicelulosa                                                                       NA
## almidon                                                                     6.392e-03
## carbohidratos_noes                                                          6.392e-03
## carbohidratos_solubles                                                      6.392e-03
## digestibilidad_ms                                                           5.882e-04
## energia_digestible                                                          1.653e-03
## energia_metabolizable                                                       1.099e-02
## energia_neta_manten                                                         9.380e-03
## energia_neta_ganancia                                                       7.768e-03
## energia_neta_lactancia                                                      1.097e-02
##                                                                              t value
## (Intercept)                                                                -6377.119
## ingredienteKikuyo - Cenchrus clandestinus - Hoja, Tallo                       -7.492
## ingredienteMegathyrsus maximus sp. - Megathyrsus maximus sp. - Hoja, Tallo    -2.940
## ingredienteRhodes - Chloris gayana - Hoja, Tallo                              -2.763
## ingredienteRyegrass perenne - Lolium perenne - Hoja, Tallo                    -0.499
## topografiaOndulada                                                             1.326
## topografiaPendiente                                                            1.746
## topografiaPlana                                                                1.014
## textura_de_sueloArenoso                                                       -1.015
## textura_de_sueloFranco                                                        -1.869
## textura_de_sueloFranco arcilloso                                              -0.017
## textura_de_sueloFranco arenoso                                                -6.528
## textura_de_sueloFranco limoso                                                 -2.448
## textura_de_sueloLimoso                                                        -2.640
## textura_de_sueloND                                                            -2.090
## textura_de_sueloOtro                                                           1.355
## epoca_recoleccionSequía                                                        2.416
## epoca_recoleccionTransición lluvia a sequía                                    1.976
## epoca_recoleccionTransición sequía a lluvia                                   -0.713
## altura_corte_cm                                                                1.120
## altura_planta_cm                                                               0.557
## edad_corte_d                                                                   0.178
## ceniza                                                                        -1.337
## extracto_etereo                                                               -5.877
## fdn                                                                           -5.123
## fda                                                                        19992.717
## lignina                                                                        3.138
## hemicelulosa                                                                      NA
## almidon                                                                       -0.325
## carbohidratos_noes                                                             0.318
## carbohidratos_solubles                                                        -0.328
## digestibilidad_ms                                                           2173.371
## energia_digestible                                                             2.482
## energia_metabolizable                                                          6.919
## energia_neta_manten                                                          -34.449
## energia_neta_ganancia                                                        -58.515
## energia_neta_lactancia                                                         4.212
##                                                                            Pr(>|t|)
## (Intercept)                                                                 < 2e-16
## ingredienteKikuyo - Cenchrus clandestinus - Hoja, Tallo                    7.11e-14
## ingredienteMegathyrsus maximus sp. - Megathyrsus maximus sp. - Hoja, Tallo  0.00329
## ingredienteRhodes - Chloris gayana - Hoja, Tallo                            0.00574
## ingredienteRyegrass perenne - Lolium perenne - Hoja, Tallo                  0.61767
## topografiaOndulada                                                          0.18482
## topografiaPendiente                                                         0.08077
## topografiaPlana                                                             0.31051
## textura_de_sueloArenoso                                                     0.31032
## textura_de_sueloFranco                                                      0.06162
## textura_de_sueloFranco arcilloso                                            0.98664
## textura_de_sueloFranco arenoso                                             6.85e-11
## textura_de_sueloFranco limoso                                               0.01438
## textura_de_sueloLimoso                                                      0.00831
## textura_de_sueloND                                                          0.03662
## textura_de_sueloOtro                                                        0.17535
## epoca_recoleccionSequía                                                     0.01569
## epoca_recoleccionTransición lluvia a sequía                                 0.04820
## epoca_recoleccionTransición sequía a lluvia                                 0.47577
## altura_corte_cm                                                             0.26264
## altura_planta_cm                                                            0.57773
## edad_corte_d                                                                0.85863
## ceniza                                                                      0.18135
## extracto_etereo                                                            4.26e-09
## fdn                                                                        3.04e-07
## fda                                                                         < 2e-16
## lignina                                                                     0.00170
## hemicelulosa                                                                     NA
## almidon                                                                     0.74495
## carbohidratos_noes                                                          0.75046
## carbohidratos_solubles                                                      0.74317
## digestibilidad_ms                                                           < 2e-16
## energia_digestible                                                          0.01306
## energia_metabolizable                                                      4.70e-12
## energia_neta_manten                                                         < 2e-16
## energia_neta_ganancia                                                       < 2e-16
## energia_neta_lactancia                                                     2.55e-05
##                                                                               
## (Intercept)                                                                ***
## ingredienteKikuyo - Cenchrus clandestinus - Hoja, Tallo                    ***
## ingredienteMegathyrsus maximus sp. - Megathyrsus maximus sp. - Hoja, Tallo ** 
## ingredienteRhodes - Chloris gayana - Hoja, Tallo                           ** 
## ingredienteRyegrass perenne - Lolium perenne - Hoja, Tallo                    
## topografiaOndulada                                                            
## topografiaPendiente                                                        .  
## topografiaPlana                                                               
## textura_de_sueloArenoso                                                       
## textura_de_sueloFranco                                                     .  
## textura_de_sueloFranco arcilloso                                              
## textura_de_sueloFranco arenoso                                             ***
## textura_de_sueloFranco limoso                                              *  
## textura_de_sueloLimoso                                                     ** 
## textura_de_sueloND                                                         *  
## textura_de_sueloOtro                                                          
## epoca_recoleccionSequía                                                    *  
## epoca_recoleccionTransición lluvia a sequía                                *  
## epoca_recoleccionTransición sequía a lluvia                                   
## altura_corte_cm                                                               
## altura_planta_cm                                                              
## edad_corte_d                                                                  
## ceniza                                                                        
## extracto_etereo                                                            ***
## fdn                                                                        ***
## fda                                                                        ***
## lignina                                                                    ** 
## hemicelulosa                                                                  
## almidon                                                                       
## carbohidratos_noes                                                            
## carbohidratos_solubles                                                        
## digestibilidad_ms                                                          ***
## energia_digestible                                                         *  
## energia_metabolizable                                                      ***
## energia_neta_manten                                                        ***
## energia_neta_ganancia                                                      ***
## energia_neta_lactancia                                                     ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.004187 on 17436 degrees of freedom
## Multiple R-squared:      1,  Adjusted R-squared:      1 
## F-statistic: 7.974e+08 on 35 and 17436 DF,  p-value: < 2.2e-16
modelo_completo_sin_I <- lm(proteina ~  ., data = datos_sin_ingrediente)
summary(modelo_completo_sin_I )
## 
## Call:
## lm(formula = proteina ~ ., data = datos_sin_ingrediente)
## 
## Residuals:
##        Min         1Q     Median         3Q        Max 
## -0.0113262 -0.0033172  0.0000005  0.0032897  0.0133965 
## 
## Coefficients: (1 not defined because of singularities)
##                                               Estimate Std. Error   t value
## (Intercept)                                 -7.571e+01  1.163e-02 -6511.883
## topografiaOndulada                           8.894e-04  5.966e-04     1.491
## topografiaPendiente                          9.927e-04  6.265e-04     1.585
## topografiaPlana                              5.678e-04  5.985e-04     0.949
## textura_de_sueloArenoso                     -7.778e-04  2.563e-04    -3.035
## textura_de_sueloFranco                      -7.062e-04  1.653e-04    -4.273
## textura_de_sueloFranco arcilloso            -1.880e-05  1.213e-04    -0.155
## textura_de_sueloFranco arenoso              -8.930e-04  1.334e-04    -6.693
## textura_de_sueloFranco limoso               -7.004e-04  2.188e-04    -3.201
## textura_de_sueloLimoso                      -9.700e-04  3.116e-04    -3.113
## textura_de_sueloND                          -7.911e-04  1.972e-04    -4.012
## textura_de_sueloOtro                         5.310e-04  5.731e-04     0.926
## epoca_recoleccionSequía                      1.302e-04  7.582e-05     1.717
## epoca_recoleccionTransición lluvia a sequía  2.906e-04  1.583e-04     1.836
## epoca_recoleccionTransición sequía a lluvia -4.473e-05  1.461e-04    -0.306
## altura_corte_cm                              5.434e-06  3.918e-06     1.387
## altura_planta_cm                             3.078e-06  1.475e-06     2.086
## edad_corte_d                                -4.747e-06  2.221e-06    -2.138
## ceniza                                      -9.262e-06  2.350e-05    -0.394
## extracto_etereo                             -2.967e-04  1.216e-04    -2.441
## fdn                                         -9.232e-05  1.833e-05    -5.037
## fda                                          3.947e-01  1.844e-05 21401.022
## lignina                                      1.110e-04  5.920e-05     1.875
## hemicelulosa                                        NA         NA        NA
## almidon                                     -2.087e-03  6.412e-03    -0.325
## carbohidratos_noes                           2.046e-03  6.412e-03     0.319
## carbohidratos_solubles                      -2.096e-03  6.412e-03    -0.327
## digestibilidad_ms                            1.279e+00  5.856e-04  2184.128
## energia_digestible                           4.994e-03  1.617e-03     3.088
## energia_metabolizable                        7.782e-02  1.102e-02     7.059
## energia_neta_manten                         -3.333e-01  9.364e-03   -35.593
## energia_neta_ganancia                       -4.688e-01  7.682e-03   -61.021
## energia_neta_lactancia                       4.441e-02  1.100e-02     4.036
##                                             Pr(>|t|)    
## (Intercept)                                  < 2e-16 ***
## topografiaOndulada                           0.13602    
## topografiaPendiente                          0.11308    
## topografiaPlana                              0.34278    
## textura_de_sueloArenoso                      0.00241 ** 
## textura_de_sueloFranco                      1.94e-05 ***
## textura_de_sueloFranco arcilloso             0.87685    
## textura_de_sueloFranco arenoso              2.25e-11 ***
## textura_de_sueloFranco limoso                0.00137 ** 
## textura_de_sueloLimoso                       0.00186 ** 
## textura_de_sueloND                          6.05e-05 ***
## textura_de_sueloOtro                         0.35423    
## epoca_recoleccionSequía                      0.08607 .  
## epoca_recoleccionTransición lluvia a sequía  0.06638 .  
## epoca_recoleccionTransición sequía a lluvia  0.75953    
## altura_corte_cm                              0.16541    
## altura_planta_cm                             0.03695 *  
## edad_corte_d                                 0.03256 *  
## ceniza                                       0.69353    
## extracto_etereo                              0.01467 *  
## fdn                                         4.78e-07 ***
## fda                                          < 2e-16 ***
## lignina                                      0.06075 .  
## hemicelulosa                                      NA    
## almidon                                      0.74485    
## carbohidratos_noes                           0.74965    
## carbohidratos_solubles                       0.74378    
## digestibilidad_ms                            < 2e-16 ***
## energia_digestible                           0.00202 ** 
## energia_metabolizable                       1.74e-12 ***
## energia_neta_manten                          < 2e-16 ***
## energia_neta_ganancia                        < 2e-16 ***
## energia_neta_lactancia                      5.47e-05 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.004201 on 17440 degrees of freedom
## Multiple R-squared:      1,  Adjusted R-squared:      1 
## F-statistic: 8.943e+08 on 31 and 17440 DF,  p-value: < 2.2e-16

Omitiendo las variables municipio y departamento, observamos como el modelo construido por el resto de los datos determina un R-cuadrado de 1. Sugiriendo un poder predictivo del 100%

Sustrayendo la variable ingrediente vemos que el modelo no cambia el valor del R-cuadrado lo que parece desestimar nuestra conjetura de su relevante aporte en la predicción

Serán los modelos estimados con bases en las variables con alta correlación con la variables proteína las que otorguen un buen carácter predictivo al modelo?

Modelo_1

modelo_1 <- lm(proteina ~  ., data = datos_sin_corre)
summary(modelo_1)
## 
## Call:
## lm(formula = proteina ~ ., data = datos_sin_corre)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -18.0224  -0.9637  -0.0290   0.9924   8.5811 
## 
## Coefficients: (1 not defined because of singularities)
##                                                                              Estimate
## (Intercept)                                                                43.0664820
## ingredienteKikuyo - Cenchrus clandestinus - Hoja, Tallo                     4.9696386
## ingredienteMegathyrsus maximus sp. - Megathyrsus maximus sp. - Hoja, Tallo  0.4003271
## ingredienteRhodes - Chloris gayana - Hoja, Tallo                            0.0652844
## ingredienteRyegrass perenne - Lolium perenne - Hoja, Tallo                  3.6267022
## topografiaOndulada                                                          0.3375938
## topografiaPendiente                                                         0.6956883
## topografiaPlana                                                             0.4834806
## textura_de_sueloArenoso                                                     0.0674873
## textura_de_sueloFranco                                                     -0.2013645
## textura_de_sueloFranco arcilloso                                            0.7712534
## textura_de_sueloFranco arenoso                                              1.0587870
## textura_de_sueloFranco limoso                                              -0.5868024
## textura_de_sueloLimoso                                                      1.2517295
## textura_de_sueloND                                                          1.2307047
## textura_de_sueloOtro                                                       -0.3955507
## epoca_recoleccionSequía                                                    -0.1020118
## epoca_recoleccionTransición lluvia a sequía                                 0.1114583
## epoca_recoleccionTransición sequía a lluvia                                 0.6776065
## altura_corte_cm                                                             0.0113221
## altura_planta_cm                                                            0.0053767
## edad_corte_d                                                               -0.0199807
## ceniza                                                                      0.0845485
## extracto_etereo                                                            -0.2224763
## fdn                                                                        -0.5422984
## fda                                                                         0.3104675
## lignina                                                                    -1.1845672
## hemicelulosa                                                                       NA
## almidon                                                                     2.6149318
## carbohidratos_noes                                                         -2.7439842
## carbohidratos_solubles                                                      1.9581073
##                                                                            Std. Error
## (Intercept)                                                                 0.4814750
## ingredienteKikuyo - Cenchrus clandestinus - Hoja, Tallo                     0.0747768
## ingredienteMegathyrsus maximus sp. - Megathyrsus maximus sp. - Hoja, Tallo  0.0628860
## ingredienteRhodes - Chloris gayana - Hoja, Tallo                            0.0698623
## ingredienteRyegrass perenne - Lolium perenne - Hoja, Tallo                  0.0962499
## topografiaOndulada                                                          0.2603974
## topografiaPendiente                                                         0.2731390
## topografiaPlana                                                             0.2609440
## textura_de_sueloArenoso                                                     0.1143563
## textura_de_sueloFranco                                                      0.0744410
## textura_de_sueloFranco arcilloso                                            0.0530381
## textura_de_sueloFranco arenoso                                              0.0571728
## textura_de_sueloFranco limoso                                               0.0954743
## textura_de_sueloLimoso                                                      0.1357073
## textura_de_sueloND                                                          0.0871486
## textura_de_sueloOtro                                                        0.2499301
## epoca_recoleccionSequía                                                     0.0331285
## epoca_recoleccionTransición lluvia a sequía                                 0.0693390
## epoca_recoleccionTransición sequía a lluvia                                 0.0638147
## altura_corte_cm                                                             0.0020021
## altura_planta_cm                                                            0.0006986
## edad_corte_d                                                                0.0010797
## ceniza                                                                      0.0100894
## extracto_etereo                                                             0.0507921
## fdn                                                                         0.0068750
## fda                                                                         0.0068758
## lignina                                                                     0.0256980
## hemicelulosa                                                                       NA
## almidon                                                                     2.7951745
## carbohidratos_noes                                                          2.7951384
## carbohidratos_solubles                                                      2.7950703
##                                                                            t value
## (Intercept)                                                                 89.447
## ingredienteKikuyo - Cenchrus clandestinus - Hoja, Tallo                     66.460
## ingredienteMegathyrsus maximus sp. - Megathyrsus maximus sp. - Hoja, Tallo   6.366
## ingredienteRhodes - Chloris gayana - Hoja, Tallo                             0.934
## ingredienteRyegrass perenne - Lolium perenne - Hoja, Tallo                  37.680
## topografiaOndulada                                                           1.296
## topografiaPendiente                                                          2.547
## topografiaPlana                                                              1.853
## textura_de_sueloArenoso                                                      0.590
## textura_de_sueloFranco                                                      -2.705
## textura_de_sueloFranco arcilloso                                            14.542
## textura_de_sueloFranco arenoso                                              18.519
## textura_de_sueloFranco limoso                                               -6.146
## textura_de_sueloLimoso                                                       9.224
## textura_de_sueloND                                                          14.122
## textura_de_sueloOtro                                                        -1.583
## epoca_recoleccionSequía                                                     -3.079
## epoca_recoleccionTransición lluvia a sequía                                  1.607
## epoca_recoleccionTransición sequía a lluvia                                 10.618
## altura_corte_cm                                                              5.655
## altura_planta_cm                                                             7.696
## edad_corte_d                                                               -18.506
## ceniza                                                                       8.380
## extracto_etereo                                                             -4.380
## fdn                                                                        -78.880
## fda                                                                         45.153
## lignina                                                                    -46.096
## hemicelulosa                                                                    NA
## almidon                                                                      0.936
## carbohidratos_noes                                                          -0.982
## carbohidratos_solubles                                                       0.701
##                                                                            Pr(>|t|)
## (Intercept)                                                                 < 2e-16
## ingredienteKikuyo - Cenchrus clandestinus - Hoja, Tallo                     < 2e-16
## ingredienteMegathyrsus maximus sp. - Megathyrsus maximus sp. - Hoja, Tallo 1.99e-10
## ingredienteRhodes - Chloris gayana - Hoja, Tallo                            0.35007
## ingredienteRyegrass perenne - Lolium perenne - Hoja, Tallo                  < 2e-16
## topografiaOndulada                                                          0.19484
## topografiaPendiente                                                         0.01087
## topografiaPlana                                                             0.06393
## textura_de_sueloArenoso                                                     0.55510
## textura_de_sueloFranco                                                      0.00684
## textura_de_sueloFranco arcilloso                                            < 2e-16
## textura_de_sueloFranco arenoso                                              < 2e-16
## textura_de_sueloFranco limoso                                              8.11e-10
## textura_de_sueloLimoso                                                      < 2e-16
## textura_de_sueloND                                                          < 2e-16
## textura_de_sueloOtro                                                        0.11352
## epoca_recoleccionSequía                                                     0.00208
## epoca_recoleccionTransición lluvia a sequía                                 0.10798
## epoca_recoleccionTransición sequía a lluvia                                 < 2e-16
## altura_corte_cm                                                            1.58e-08
## altura_planta_cm                                                           1.48e-14
## edad_corte_d                                                                < 2e-16
## ceniza                                                                      < 2e-16
## extracto_etereo                                                            1.19e-05
## fdn                                                                         < 2e-16
## fda                                                                         < 2e-16
## lignina                                                                     < 2e-16
## hemicelulosa                                                                     NA
## almidon                                                                     0.34954
## carbohidratos_noes                                                          0.32626
## carbohidratos_solubles                                                      0.48359
##                                                                               
## (Intercept)                                                                ***
## ingredienteKikuyo - Cenchrus clandestinus - Hoja, Tallo                    ***
## ingredienteMegathyrsus maximus sp. - Megathyrsus maximus sp. - Hoja, Tallo ***
## ingredienteRhodes - Chloris gayana - Hoja, Tallo                              
## ingredienteRyegrass perenne - Lolium perenne - Hoja, Tallo                 ***
## topografiaOndulada                                                            
## topografiaPendiente                                                        *  
## topografiaPlana                                                            .  
## textura_de_sueloArenoso                                                       
## textura_de_sueloFranco                                                     ** 
## textura_de_sueloFranco arcilloso                                           ***
## textura_de_sueloFranco arenoso                                             ***
## textura_de_sueloFranco limoso                                              ***
## textura_de_sueloLimoso                                                     ***
## textura_de_sueloND                                                         ***
## textura_de_sueloOtro                                                          
## epoca_recoleccionSequía                                                    ** 
## epoca_recoleccionTransición lluvia a sequía                                   
## epoca_recoleccionTransición sequía a lluvia                                ***
## altura_corte_cm                                                            ***
## altura_planta_cm                                                           ***
## edad_corte_d                                                               ***
## ceniza                                                                     ***
## extracto_etereo                                                            ***
## fdn                                                                        ***
## fda                                                                        ***
## lignina                                                                    ***
## hemicelulosa                                                                  
## almidon                                                                       
## carbohidratos_noes                                                            
## carbohidratos_solubles                                                        
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 1.831 on 17442 degrees of freedom
## Multiple R-squared:  0.8804, Adjusted R-squared:  0.8802 
## F-statistic:  4429 on 29 and 17442 DF,  p-value: < 2.2e-16
modelo_12 <- lm(proteina ~  ., data = datos_sin_corre_mas_1)
summary(modelo_12)
## 
## Call:
## lm(formula = proteina ~ ., data = datos_sin_corre_mas_1)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -4.0323 -0.2413  0.0039  0.2497  3.6415 
## 
## Coefficients: (1 not defined because of singularities)
##                                                                              Estimate
## (Intercept)                                                                -4.720e+01
## ingredienteKikuyo - Cenchrus clandestinus - Hoja, Tallo                     7.382e-01
## ingredienteMegathyrsus maximus sp. - Megathyrsus maximus sp. - Hoja, Tallo  2.336e-01
## ingredienteRhodes - Chloris gayana - Hoja, Tallo                            4.424e-01
## ingredienteRyegrass perenne - Lolium perenne - Hoja, Tallo                  7.362e-01
## topografiaOndulada                                                          1.588e-01
## topografiaPendiente                                                         3.783e-01
## topografiaPlana                                                             1.689e-01
## textura_de_sueloArenoso                                                    -1.847e-01
## textura_de_sueloFranco                                                     -4.127e-02
## textura_de_sueloFranco arcilloso                                           -6.109e-02
## textura_de_sueloFranco arenoso                                             -8.625e-02
## textura_de_sueloFranco limoso                                              -2.698e-01
## textura_de_sueloLimoso                                                     -1.836e-02
## textura_de_sueloND                                                          3.389e-02
## textura_de_sueloOtro                                                       -4.899e-01
## epoca_recoleccionSequía                                                    -3.169e-02
## epoca_recoleccionTransición lluvia a sequía                                 1.064e-01
## epoca_recoleccionTransición sequía a lluvia                                -2.581e-02
## altura_corte_cm                                                             3.293e-03
## altura_planta_cm                                                            1.177e-03
## edad_corte_d                                                               -1.246e-03
## ceniza                                                                      1.373e-01
## extracto_etereo                                                            -8.656e-01
## fdn                                                                        -3.915e-02
## fda                                                                         2.344e-01
## lignina                                                                    -1.536e-02
## hemicelulosa                                                                       NA
## almidon                                                                     6.331e-01
## carbohidratos_noes                                                         -7.318e-01
## carbohidratos_solubles                                                      7.076e-01
## energia_digestible                                                          2.260e+01
##                                                                            Std. Error
## (Intercept)                                                                 2.088e-01
## ingredienteKikuyo - Cenchrus clandestinus - Hoja, Tallo                     2.000e-02
## ingredienteMegathyrsus maximus sp. - Megathyrsus maximus sp. - Hoja, Tallo  1.539e-02
## ingredienteRhodes - Chloris gayana - Hoja, Tallo                            1.711e-02
## ingredienteRyegrass perenne - Lolium perenne - Hoja, Tallo                  2.419e-02
## topografiaOndulada                                                          6.370e-02
## topografiaPendiente                                                         6.682e-02
## topografiaPlana                                                             6.384e-02
## textura_de_sueloArenoso                                                     2.798e-02
## textura_de_sueloFranco                                                      1.821e-02
## textura_de_sueloFranco arcilloso                                            1.307e-02
## textura_de_sueloFranco arenoso                                              1.416e-02
## textura_de_sueloFranco limoso                                               2.336e-02
## textura_de_sueloLimoso                                                      3.329e-02
## textura_de_sueloND                                                          2.144e-02
## textura_de_sueloOtro                                                        6.114e-02
## epoca_recoleccionSequía                                                     8.106e-03
## epoca_recoleccionTransición lluvia a sequía                                 1.696e-02
## epoca_recoleccionTransición sequía a lluvia                                 1.567e-02
## altura_corte_cm                                                             4.900e-04
## altura_planta_cm                                                            1.711e-04
## edad_corte_d                                                                2.665e-04
## ceniza                                                                      2.470e-03
## extracto_etereo                                                             1.249e-02
## fdn                                                                         1.937e-03
## fda                                                                         1.688e-03
## lignina                                                                     6.672e-03
## hemicelulosa                                                                       NA
## almidon                                                                     6.838e-01
## carbohidratos_noes                                                          6.838e-01
## carbohidratos_solubles                                                      6.838e-01
## energia_digestible                                                          4.317e-02
##                                                                             t value
## (Intercept)                                                                -226.016
## ingredienteKikuyo - Cenchrus clandestinus - Hoja, Tallo                      36.912
## ingredienteMegathyrsus maximus sp. - Megathyrsus maximus sp. - Hoja, Tallo   15.178
## ingredienteRhodes - Chloris gayana - Hoja, Tallo                             25.862
## ingredienteRyegrass perenne - Lolium perenne - Hoja, Tallo                   30.442
## topografiaOndulada                                                            2.493
## topografiaPendiente                                                           5.661
## topografiaPlana                                                               2.646
## textura_de_sueloArenoso                                                      -6.601
## textura_de_sueloFranco                                                       -2.266
## textura_de_sueloFranco arcilloso                                             -4.673
## textura_de_sueloFranco arenoso                                               -6.092
## textura_de_sueloFranco limoso                                               -11.549
## textura_de_sueloLimoso                                                       -0.552
## textura_de_sueloND                                                            1.581
## textura_de_sueloOtro                                                         -8.013
## epoca_recoleccionSequía                                                      -3.910
## epoca_recoleccionTransición lluvia a sequía                                   6.272
## epoca_recoleccionTransición sequía a lluvia                                  -1.647
## altura_corte_cm                                                               6.721
## altura_planta_cm                                                              6.876
## edad_corte_d                                                                 -4.673
## ceniza                                                                       55.585
## extracto_etereo                                                             -69.327
## fdn                                                                         -20.209
## fda                                                                         138.820
## lignina                                                                      -2.303
## hemicelulosa                                                                     NA
## almidon                                                                       0.926
## carbohidratos_noes                                                           -1.070
## carbohidratos_solubles                                                        1.035
## energia_digestible                                                          523.448
##                                                                            Pr(>|t|)
## (Intercept)                                                                 < 2e-16
## ingredienteKikuyo - Cenchrus clandestinus - Hoja, Tallo                     < 2e-16
## ingredienteMegathyrsus maximus sp. - Megathyrsus maximus sp. - Hoja, Tallo  < 2e-16
## ingredienteRhodes - Chloris gayana - Hoja, Tallo                            < 2e-16
## ingredienteRyegrass perenne - Lolium perenne - Hoja, Tallo                  < 2e-16
## topografiaOndulada                                                          0.01266
## topografiaPendiente                                                        1.53e-08
## topografiaPlana                                                             0.00815
## textura_de_sueloArenoso                                                    4.21e-11
## textura_de_sueloFranco                                                      0.02346
## textura_de_sueloFranco arcilloso                                           2.99e-06
## textura_de_sueloFranco arenoso                                             1.14e-09
## textura_de_sueloFranco limoso                                               < 2e-16
## textura_de_sueloLimoso                                                      0.58119
## textura_de_sueloND                                                          0.11399
## textura_de_sueloOtro                                                       1.19e-15
## epoca_recoleccionSequía                                                    9.26e-05
## epoca_recoleccionTransición lluvia a sequía                                3.64e-10
## epoca_recoleccionTransición sequía a lluvia                                 0.09959
## altura_corte_cm                                                            1.86e-11
## altura_planta_cm                                                           6.37e-12
## edad_corte_d                                                               2.99e-06
## ceniza                                                                      < 2e-16
## extracto_etereo                                                             < 2e-16
## fdn                                                                         < 2e-16
## fda                                                                         < 2e-16
## lignina                                                                     0.02131
## hemicelulosa                                                                     NA
## almidon                                                                     0.35454
## carbohidratos_noes                                                          0.28456
## carbohidratos_solubles                                                      0.30076
## energia_digestible                                                          < 2e-16
##                                                                               
## (Intercept)                                                                ***
## ingredienteKikuyo - Cenchrus clandestinus - Hoja, Tallo                    ***
## ingredienteMegathyrsus maximus sp. - Megathyrsus maximus sp. - Hoja, Tallo ***
## ingredienteRhodes - Chloris gayana - Hoja, Tallo                           ***
## ingredienteRyegrass perenne - Lolium perenne - Hoja, Tallo                 ***
## topografiaOndulada                                                         *  
## topografiaPendiente                                                        ***
## topografiaPlana                                                            ** 
## textura_de_sueloArenoso                                                    ***
## textura_de_sueloFranco                                                     *  
## textura_de_sueloFranco arcilloso                                           ***
## textura_de_sueloFranco arenoso                                             ***
## textura_de_sueloFranco limoso                                              ***
## textura_de_sueloLimoso                                                        
## textura_de_sueloND                                                            
## textura_de_sueloOtro                                                       ***
## epoca_recoleccionSequía                                                    ***
## epoca_recoleccionTransición lluvia a sequía                                ***
## epoca_recoleccionTransición sequía a lluvia                                .  
## altura_corte_cm                                                            ***
## altura_planta_cm                                                           ***
## edad_corte_d                                                               ***
## ceniza                                                                     ***
## extracto_etereo                                                            ***
## fdn                                                                        ***
## fda                                                                        ***
## lignina                                                                    *  
## hemicelulosa                                                                  
## almidon                                                                       
## carbohidratos_noes                                                            
## carbohidratos_solubles                                                        
## energia_digestible                                                         ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.448 on 17441 degrees of freedom
## Multiple R-squared:  0.9928, Adjusted R-squared:  0.9928 
## F-statistic: 8.067e+04 on 30 and 17441 DF,  p-value: < 2.2e-16

Al modelo_completo suprimimos las 6 variables con más correlación con la variable respuesta, el carácter predictivo del modelo_1 descendio de 100% a 88%.

Con sólo insertar una de las variables sustraidas en el modelo_12 el R-cuadrado aumentó a 0.9928, un 99,28% de poder predictivo

Concluimos que los modelos que incorporen algunas de las varaibles digestibilidad_ms, energia_digestible, energia_metabolizable, energia_neta_manten, energia_neta_ganancia, energia_neta_lactancia podrían tener mayor capacidad predictiva

Modelo_2

modelo_2 <- lm(proteina ~  fda + energia_metabolizable, data = datos_modelo)
summary(modelo_2)
## 
## Call:
## lm(formula = proteina ~ fda + energia_metabolizable, data = datos_modelo)
## 
## Residuals:
##       Min        1Q    Median        3Q       Max 
## -0.155979 -0.076907 -0.000551  0.077419  0.156554 
## 
## Coefficients:
##                         Estimate Std. Error t value Pr(>|t|)    
## (Intercept)           -5.973e+01  1.725e-02   -3462   <2e-16 ***
## fda                    3.941e-01  2.433e-04    1619   <2e-16 ***
## energia_metabolizable  3.067e+01  5.165e-03    5937   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.08908 on 17469 degrees of freedom
## Multiple R-squared:  0.9997, Adjusted R-squared:  0.9997 
## F-statistic: 3.082e+07 on 2 and 17469 DF,  p-value: < 2.2e-16

Con las variables fda y energia_metabolizable, el modelo_2 arrojó un R-cuadrado de 0.9997. Un carácter predictivo del 99.97%

AIC

AIC(modelo_2, modelo_12, modelo_completo)
##                 df        AIC
## modelo_2         4  -34913.78
## modelo_12       32   21556.22
## modelo_completo 37 -141725.34

Vif

vif(modelo_2)
##                   fda energia_metabolizable 
##              2.731306              2.731306

El modelo_2 presenta un AIC bajo de -34913.78 y el factor de inflación de varianza (vif) para las dos variables arroja rangos menores de 5, lo que sugiere la carencia de colinealidad entre ellas.

Análisis supuestos estadísticos para modelo_2

Lignina con relación a la edad de corte y a la altura.

datos_lignina <- datos_modelo %>% 
  select(-ingrediente, -textura_de_suelo, -topografia, -lignina, lignina) 
datos_lignina %>% 
  names()
##  [1] "epoca_recoleccion"      "altura_corte_cm"        "altura_planta_cm"      
##  [4] "edad_corte_d"           "ceniza"                 "extracto_etereo"       
##  [7] "fdn"                    "fda"                    "hemicelulosa"          
## [10] "almidon"                "carbohidratos_noes"     "carbohidratos_solubles"
## [13] "digestibilidad_ms"      "energia_digestible"     "energia_metabolizable" 
## [16] "energia_neta_manten"    "energia_neta_ganancia"  "energia_neta_lactancia"
## [19] "proteina"               "lignina"

Matrices de Correlación:lignina

datos_ml1 <- datos_lignina %>% 
  select(altura_corte_cm:almidon, lignina)

ggpairs(data = datos_ml1, lower = list(continuous = "smooth"))

datos_ml2 <- datos_lignina %>% 
  select(carbohidratos_noes:proteina, lignina)

ggpairs(data = datos_ml2, lower = list(continuous = "smooth"))

La variable lignina presenta correlaciones más fuertes con otras variables que con la altura_corte_cm (36.9%) y altura_planta_cm(14,3%)

Modelos lineales para variable lignina.

Modelo_1l: lignina + edad_corte + altura_corte_cm

modelo_1l <- lm(lignina ~ altura_corte_cm + edad_corte_d, data = datos_lignina)
summary(modelo_1l)
## 
## Call:
## lm(formula = lignina ~ altura_corte_cm + edad_corte_d, data = datos_lignina)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -5.1821 -0.8697  0.0313  0.8869  5.3779 
## 
## Coefficients:
##                   Estimate Std. Error t value Pr(>|t|)    
## (Intercept)      7.0770610  0.0275282  257.08   <2e-16 ***
## altura_corte_cm  0.0498705  0.0009443   52.81   <2e-16 ***
## edad_corte_d    -0.0124993  0.0006223  -20.09   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 1.412 on 17469 degrees of freedom
## Multiple R-squared:  0.1554, Adjusted R-squared:  0.1553 
## F-statistic:  1607 on 2 and 17469 DF,  p-value: < 2.2e-16

Modelo_2l: lignina + fda + fdn

modelo_2l <- lm(lignina ~ fda + fdn , data = datos_lignina)
summary(modelo_2l)
## 
## Call:
## lm(formula = lignina ~ fda + fdn, data = datos_lignina)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -3.7816 -0.4352 -0.0157  0.4257  3.0507 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -4.222480   0.042823  -98.60   <2e-16 ***
## fda          0.058015   0.002185   26.55   <2e-16 ***
## fdn          0.157312   0.001377  114.24   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.6803 on 17469 degrees of freedom
## Multiple R-squared:  0.8039, Adjusted R-squared:  0.8039 
## F-statistic: 3.58e+04 on 2 and 17469 DF,  p-value: < 2.2e-16

Para construir un modelo que prediga la variable lignina usaría como predictoras las variables fdn y fda con valor R-cuadrado de 0.80 (80%) en vez de las variables altura_corte_cm, edad_corte_d que arrojan R-cuadrado de 0.15 (22%).

Mejor edad para corte

Variable promedio proteína

datos_epoca_recoleccion <- datos_modelo %>%  
  select(c(epoca_recoleccion, proteina, ingrediente)) 
datos_epoca_recoleccion %>% 
  head()
## # A tibble: 6 x 3
##   epoca_recoleccion          proteina ingrediente                               
##   <chr>                         <dbl> <chr>                                     
## 1 Transición sequía a lluvia     18.4 Ryegrass perenne - Lolium perenne - Hoja,~
## 2 Transición sequía a lluvia     26.8 Ryegrass perenne - Lolium perenne - Hoja,~
## 3 Lluvia                         12.4 Ryegrass perenne - Lolium perenne - Hoja,~
## 4 Lluvia                         12.1 Ryegrass perenne - Lolium perenne - Hoja,~
## 5 Lluvia                         11.7 Ryegrass perenne - Lolium perenne - Hoja,~
## 6 Lluvia                         11.7 Ryegrass perenne - Lolium perenne - Hoja,~
datos_epoca_recoleccion %>%
  group_by(epoca_recoleccion, ingrediente) %>%
  summarise(promedio_proteina = mean(proteina,na.rm = TRUE)) %>%
  ggplot(aes(x = epoca_recoleccion, y = promedio_proteina, color = ingrediente)) +
  theme(axis.text.x = element_text(angle = 45, hjust = 1)) +
  geom_point() +
  geom_line(aes(group = ingrediente))
## `summarise()` has grouped output by 'epoca_recoleccion'. You can override using the `.groups` argument.

datos_epoca_recoleccion %>% 
  group_by(epoca_recoleccion) %>%
  summarise( 
    pro_proteina = mean(proteina),
    des_proteina = sd(proteina)
  ) %>% 
  
  ungroup() %>% 
  ggplot (aes(
    x = epoca_recoleccion,
    y = pro_proteina,
    ymin = pro_proteina - des_proteina,
    ymax = pro_proteina + des_proteina
   )) + 
  theme(axis.text.x = element_text(angle = 20, hjust = 1))+
  geom_point() +
  geom_errorbar(width = 0.2) +
  geom_hline (yintercept = promedio_proteina, lty = 2, color = "pink", size = 1 )

La epoca de recolección que transcurre en la transición de sequía a lluvia el promedio de proteína aumenta para los forrajes Rhodes - Chloris gayana, Buffel - Cenchrus ciliaris y Megathyrsus maximus sp.- Megathyrsus maximus sp. Para el forraje Ryegrass perenne - Lolium perenne la epoca de recolección conveniente es la transición de lluvia a sequía y para Kikuyo - Cenchrus clandestinus la mejor época de cosecha es en sequía

Recomendaríamos que se realice la recolección en la época de transición de sequía a lluvia, porque en esta los promedios de proteínas son mayores en los forrajes estudiados