El contenido de proteína es de vital importancia para garantizar la nutrición balanceada del ganado. El objetivo es asegurar la salud y el buen desarrollo fisiológico del animal asegurando rendimientos en los sistemas de producción de carne, lechero o de doble propósito. Un análisis bromatológico ofrecerá, con detalle, la composición química y valor nutricional de las pasturas: lignina, almidón, carbohidratos solubles, fibra detergente neutra (fdn), proteína, etc. Con información secundaria obtenida del sistema Alimen Tro creado por Agrosavia y emitidos en la página datos abiertos de Colombia en el mes de noviembre del año 2020, se pretende determinar por medio de modelos de regresión lineal,la variables con mayor incidencia en la predicción de la proteína en las pasturas: Ryegrass perenne - Lolium perenne, Kikuyo - Cenchrus clandestinus, Buffel - Cenchrus ciliaris, Rhodes - Chloris gayana y Megathyrsus maximus sp. - Megathyrsus maximus sp. El ambiente utilizado para el análisis de los datos fue Rstudio.
Determinar por medio de modelos de regresión lineal,la variables con mayor incidencia en la predicción de la proteína en las pasturas: Ryegrass perenne - Lolium perenne, Kikuyo - Cenchrus clandestinus, Buffel - Cenchrus ciliaris, Rhodes - Chloris gayana y Megathyrsus maximus sp. - Megathyrsus maximus sp.
Se inició la exploración de los datos a través de grupos que involucraban a la variable proteína y a las variables: ingrediente, época de recolección, textura del suelo, altura de corte y departamento. Los gráficos y funciones identificaban a los ingredientes Kikuyo - Cenchrus clandestinus y Ryegrass perenne - Lolium perenne como los forrajes con mayor promedio de proteína 17,79 (con sd de 3,88) y 17,97 (con sd de 4,21) respectivamente, superando el valor del promedio general de 13.19 (también presentaron las mayores variaciones en sus datos). Nos preguntamos que si incluir a la variable ingrediente en los modelos sería clave para mejorar su carácter predictivo. Luego, a través Las matrices de correlación atisbamos a un conjunto de variables que guardaban estrecha relación de varianza con la proteína y entre ellas. Porcentajes de correlación entre 97% y 100%: Digestibilidad_ms, energia_digestible, energia_metabolizable, energia_neta_manten, energia_neta_ganancia y energia_neta_lactancia. Nos preguntamos que si incluir alguna de estás variables a los modelos sería clave para mejorar su carácter predictivo. Para la construcción de modelos inciamos con aquel que incluyera todas las variables numéricas y excluyera a las variable categóricas municipio y departamento. El modelo_1 global arrojón un R-cuadrado ajustado de 1 (100%). El modelo_2, en el que no se incluyó a la varaible ingrediente, obtuvo un R-cuadrado ajustado de 1 (100%) lo que refutó nuestra apreciación de su carácter predictiva. El modelo_3, sin variables con alta correlación, mostró un R- cuadrado ajustado de 0.88 (88%). El modelo_4, conformado por variables con poca correlación y una con alta correlación (energia_digestible) aumentó su R-cuadrado al 0,99 (99%).
El modelo_5, confomado por las variables de alta correlación fda y energía_metabolizable, marcó un R-cuadrado de 0.9997 (99.97%). Usando modelos multiplicativos o cuadráticos en los que se involucrara una de las seis variables con alta correlación, no varió su alto R-cuadrado como en el aditivo. El modelo_5 presentó el segundo AIC (Criterio de información de Akaike) más bajo (-34913.78), después del modelo_1 que contaba con todas las variables (-141725.34).El modelo_5 mostró rangos menores de 5 para el factor de inflación de varianza (vif) (2.731306 ), lo que indica la no colinealidad entre éstas. El valor p del modelo fue de (2.2e-16), es menor al nivel de significancia de 0.05, existe evidencia para rechazar la hipótesis nula los residuales del modelo no se distribuyen de forma normal (prueba Anderson-Darling) el modelo no es confiable.
Identificar las variables que poseen una mayor correlación con la proteína y su influencia para predecirla, permitirá al investigador y propietario de la empresa ganadera enfocar sus recursos en ellas y determinarlas, monitoreando aquellas que pueden influenciar en sus valores. Varibales como la edad del corte, época de corte y la lignina.
Los altos porcentajes de correlación entre variables son útiles como indicador para tenerse en cuenta en la estructuración de un modelo preductivo.
Las variables químicas relacionadas con la presencia de energía presentan una correlación más alta con la proteína.
Determinar los factores físicos ambientales y de manejo que influyen en los valores energéticos de las pasturas servirá como vía de inferencia para establecer el valor nutritivo de ésta. Establecer estándares e indices que describan y controlen el estado óptimo de las variables físicas, otorgrará mayores probabilidades de producir pasturas con altos niveles de proteína.