PROPUESTA DE MODELO DE REGRESIÓN LINEAL PARA PREDECIR EL PESO DE LOS POLLOS DE ENGORDE EN UNA EMPRESA AVÍCOLA

Planteamiento del problema

Conocer el peso del ave es crucial para establecer la programación de sacrificio y transporte del pollo de engorde en las empresas del sector avícola. Una mala programación puede traer consecuencias significativas en la gestión de recursos, bienestar animal, calidad del producto, rentabilidad y eficiencia operativa.

Actualmente, la empresa objeto de estudio realiza la programación de sacrificio y transporte de forma manual estimando el peso del pollo de engorde en base al consumo de alimento en los últimos días, asumiendo que para la fecha del sacrificio el aumento de peso es constante.

Aunque esta metodología le ha permitido a la empresa dar cumplimiento a los requerimientos de producción de la planta beneficio, se destaca la notable incertidumbre que este método de proyección de peso del ave en las granjas de pollo de engorde deriva teniendo en cuenta que esta variable depende de múltiples factores.

En la industria avícola el peso del pollo de engorde está directamente relacionado con factores de salud, genéticos, nutricionales, ambientales, entre otros. Estos factores interactúan entre sí de manera compleja y juegan un papel crucial en el crecimiento y desarrollo de las aves, afectando directamente su peso final al momento del sacrificio.

De acuerdo con lo anterior, el presente trabajo tiene como objetivo la siguiente pregunta de investigación: ¿Cómo estimar de forma adecuada los pesos de las aves para su procesamiento en una planta de beneficio? Se destaca la importancia de diseñar, implementar e integrar modelos predictivos en los procesos de programación y proyección de las empresas para minimizar errores y los impactos que estos derivan. Por tanto, el presente trabajo propone un modelo de regresión lineal para predecir el peso de los pollos de engorde.

Objetivo

Desarollo metodológico

Inicialmente se realiza la importación de los datos, los cuales son la base para la construcción de la propuesta. En la base de datos importada, se encuentra información general acerca de las características de las aves de la granja objeto de estudio, por ejemplo, cantidad de aves, consumo de alimento de las aves, peso promedio ave, edad, entre otros.

library("visdat")
library("ggplot2")
library("easypackages")
lib_req<-c("car","lmtest","visdat","corrplot","MASS","olsrr","readxl")
easypackages::packages(lib_req)
datos<-read_excel("C:/Users/jhonf/Downloads/Datos.xlsx")
str(datos)
## tibble [96 × 25] (S3: tbl_df/tbl/data.frame)
##  $ Granja       : chr [1:96] "GRANJA 1" "GRANJA 1" "GRANJA 1" "GRANJA 1" ...
##  $ Sexo         : chr [1:96] "M" "M" "M" "M" ...
##  $ Línea        : chr [1:96] "LINEA 1" "LINEA 1" "LINEA 1" "LINEA 1" ...
##  $ TipoPollo    : chr [1:96] "C" "C" "C" "C" ...
##  $ Gal          : num [1:96] 3 3 3 3 3 3 4 4 4 4 ...
##  $ Div          : num [1:96] 1 1 1 1 1 1 1 1 1 1 ...
##  $ Edad         : num [1:96] 7 14 21 28 35 42 7 14 21 28 ...
##  $ AvesEncaseta : num [1:96] 51650 51650 51650 51650 51650 ...
##  $ ExistAves    : num [1:96] 51099 50620 50314 50058 49375 ...
##  $ Mort         : num [1:96] 551 358 306 256 683 784 517 339 252 253 ...
##  $ PocMort      : num [1:96] 1.07 0.69 0.59 0.5 1.32 1.52 0.98 0.64 0.48 0.48 ...
##  $ Elim         : num [1:96] 0 121 0 0 0 0 0 125 0 0 ...
##  $ ElimPor      : num [1:96] 0 0.23 0 0 0 0 0 0.24 0 0 ...
##  $ BajasPorSem  : num [1:96] 1.07 0.93 0.59 0.5 1.32 1.52 0.98 0.88 0.48 0.48 ...
##  $ MortTotal    : num [1:96] 551 909 1215 1471 2154 ...
##  $ MortPorTotal : num [1:96] 1.07 1.76 2.35 2.85 4.17 5.69 0.98 1.62 2.1 2.58 ...
##  $ ElimTotal    : num [1:96] 0 121 121 121 121 121 0 125 125 125 ...
##  $ ElimPorTotal : num [1:96] 0 0.23 0.23 0.23 0.23 0.23 0 0.24 0.24 0.24 ...
##  $ BajasPorTotal: num [1:96] 1.07 1.99 2.59 3.08 4.4 5.92 0.98 1.86 2.34 2.82 ...
##  $ ConsAlimDia  : num [1:96] 0.026 0.062 0.094 0.131 0.161 0.142 0.026 0.058 0.084 0.118 ...
##  $ ConsAlimSem  : num [1:96] 0.182 0.431 0.661 0.916 1.13 0.992 0.183 0.403 0.589 0.825 ...
##  $ ConsAlimTot  : num [1:96] 0.182 0.615 1.279 2.201 3.362 ...
##  $ PesoAve      : num [1:96] 0.185 0.518 1.1 1.755 2.455 ...
##  $ SEMANA       : num [1:96] 9 10 11 12 13 14 9 10 11 12 ...
##  $ AMBIENTE     : chr [1:96] "CONT" "CONT" "CONT" "CONT" ...

Una vez importados los datos, se realiza una revisión general, validando estructura, datos faltantes y estadísticas.

A continuación, se establecen los parámetros para mostrar los gráficos relacionados con la variable (PesoAve) respecto al diseño definido en la matriz M. Dentro de los gráficos a mostrar se incluyen un histograma con densidad estimada, una línea de densidad estimada y un diagrama de caja horizontal, los cuales se construyen a partir de la información contenida en la base de datos importada.

Posteriormente, se realiza un diagrama de caja para las variables de los datos. Esto permite explorar la distribución y variabilidad de las variables de manera simultánea, facilitando la comparación visual entre las mismas a partir de la identificación de valores atípicos y comparando la dispersión y la tendencia central.

Para el análisis, se realiza una regresión lineal simple donde se explora la relación entre las variables del peso de las aves (PesoAve) y el consumo de alimento semanal (ConsAlimSem) a partir de una gráfica de dispersión, calculando la correlación Spearman entre las variables. Así pues, en primer lugar se visualiza la relación entre las variables mediante un gráfico de dispersión y se calcula el coeficiente de correlación se Spearman que corresponde a r=0.87, lo que garantiza una buena muestra de datos.

A continuación, se visualiza la relación entre las variables a partir de un gráfico de dispersión que incluye la línea de regresión ajustada. Esto permite entender la relación lineal entre las variables y evaluar la significancia y ajuste del modelo.

El modelo 1 muestra que el consumo de alimento semanal (ConsAlimSem(Kg/a)) tiene un efecto altamente significativo en el peso promedio de las aves (PesoAve). A medida que aumenta el consumo de alimento semanal, se espera un aumento significativo en el peso promedio de las aves. El modelo explica aproximadamente el 72.98% de la variabilidad en el peso promedio de las aves, lo que sugiere que es un buen ajuste para los datos disponibles.

Además, es importante visualizar gráficamente el diagnóstico de los residuos del modelo de regresión lineal del modelo 1, ya que esto permite verificar la validez del modelo de regresión, tomar decisiones sobre su utilidad e interpretar los resultados. Estos gráficos son de utilidad para evaluar la adecuación del modelo y verificar supuestos clave como la normalidad de los residuos y la constancia de la varianza a lo largo de los valores ajustados y las variables independientes. Así, el primer gráfico muestra los residuos versus los valores ajustados del modelo, permitiendo identificar posibles patrones no aleatorios en los residuos. Y, el segundo gráfico muestra los residuos versus la variable del consumo de alimentos semanal.

De acuerdo con las gráficas se puede afirmar que:

  1. La mayoría de los residuos se distribuyen alrededor de la línea horizontal en 0, pero hay una leve curva visible en la línea azul suavizada, sugiriendo una posible relación no lineal entre los valores ajustados y los residuos
  2. No hay un patrón claro de “embudo”, lo que sugiere que la varianza de los errores es razonablemente constante.
  3. Hay varios puntos con residuos estandarizados mayores a 2, lo que indica la presencia de puntos atípicos.

Posteriormente, se realiza un ajuste del modelo de regresión lineal incluyendo una transformación logarítmica de la variable de consumo de alimento semanal (ConsAlimSem). Luego se visualiza con el modelo 2 la relación entre las variables mediante un gráfico de dispersión donde se muestran los puntos observados y las valores ajustados por el modelo. Este análisis es útil para explorar cómo la transformación logarítmica de una variable puede afectar el ajuste y la interpretación de un modelo de regresión lineal.

Se compara el modelo 1 y 2 mediante la taba de Análisis de Varianza (ANOVA), que permite afirmar lo siguiente:

  1. La transformación logarítmica de “ConsAlimSem” proporciona información adicional útil para predecir el “PesoAve” que no se obtiene solo con “ConsAlimSem”, lo cual mejora el ajuse del modelo.
  2. Esto se refleja en la reducción de la suma de los cuadrados residuales de 24.324 a 23.118.
  3. El estadístico F de 4.8499 y el valor p de 0.03012 indican que esta mejora es significativa al nivel del 5%.
anova(Model_s1,Model_s2)
## Analysis of Variance Table
## 
## Model 1: PesoAve ~ ConsAlimSem
## Model 2: PesoAve ~ ConsAlimSem + I(log(ConsAlimSem))
##   Res.Df    RSS Df Sum of Sq      F  Pr(>F)  
## 1     94 24.324                              
## 2     93 23.118  1    1.2056 4.8498 0.03012 *
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Con el objetivo de explorar cómo las variables independientes afectan a la variable dependiente PesoAve y cómo el modelo de regresión lineal múltiple se ajusta a los datos, se realiza un ajuste del modelo de regresión lineal múltiple que incluye la variable ConsAlimSem, su transformación logarítmica y la variable Edad y, posteriormente se visualizan los resultados obtenidos en el modelo 3.

Se compara el modelo 2 y 3 mediante la taba de Análisis de Varianza (ANOVA), que permite afirmar lo siguiente:

  1. La variable “Edad” proporciona una cantidad considerable de información adicional para predecir el “PesoAve” más allá de lo que ya se puede predecir usando ConsAlimSem y su logaritmo. Por lo tanto, incluir la variable “Edad” al modelo mejora significativamente el ajuste.
  2. Se reduce la suma de los cuadrados residuales de 23.1182 a 1.9261.
  3. El estadístico F muy alto (1012.2) y el valor p extremadamente bajo (p < 2.2e-16) indican que esta mejora es altamente significativa.
anova(Model_s2,Model_s3)
## Analysis of Variance Table
## 
## Model 1: PesoAve ~ ConsAlimSem + I(log(ConsAlimSem))
## Model 2: PesoAve ~ ConsAlimSem + I(log(ConsAlimSem)) + Edad
##   Res.Df     RSS Df Sum of Sq      F    Pr(>F)    
## 1     93 23.1182                                  
## 2     92  1.9261  1    21.192 1012.2 < 2.2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Además, se realiza un análisis multivariado represantado en la matriz de correlación de los datos entre las variables cuantitativas. Esta matriz permite identificar relaciones lineales entre pares de variables del conjunto de datos.

De acuerdo con los resultados de la matriz se puede afirmar que:

  1. PesoAve y Edad: Alta correlación positiva, indicando que a medida que aumenta la edad, el peso promedio del ave también aumenta.
  2. Mort y ConsAlimDia: Hay una correlación negativa notable, lo que indica que a medida que la mortalidad aumenta, el consumo diario de alimento puede disminuir.
  3. Semana: Tiene una correlación moderada positiva con variables como Edad y PesoAve, lo cual es lógico, ya que estas variables aumentan con el tiempo (semana).
  4. BajasPorSem: Tiene correlaciones positivas con Mort y ElimPor, lo que indica que a medida que la mortalidad y las eliminaciones por semana aumentan, también lo hace el número de bajas por semana.

Conclusiones

Los modelos predictivos ayudan a las organizaciones a tomar decisiones informadas basadas en el ánalisis de datos. Especificamente en la empresa objeto de estudio, permite mejorar la eficienca operativa de la siguiente manera:

  1. Planificación de la cadena de suministro: Predecir el peso esperado del ave permite ajustar adecuadamente los programas de producción y distribución en las diferentes etapas de crecimiento del ave.
  2. Reducción de costos: Al predecir el peso de las aves de manera más precisa, se pueden reducir los costos operativos asociados con el exceso de alimentación, el manejo ineficiente de las existencias y los desperdicios.

El modelo de regresión lineal propuesto permite predecir el peso del ave de acuerdo con las variables de consumo de alimento del ave semanal y la edad del ave de forma satisfactoria.