Modelo de Regresión Lineal Simple

La anterior base de datos contiene 13 variables financieras o contables de la empresa Colombina, que sirven para dar un diagnostico y poder conocer un poco más acerca de la salud financiera de la empresa. Las variables que serán utilizadas para realizar un modelo de regresión lineal simple serán:

Variable dependiente: Utilidad operacional

Variables independientes: Activos, Ingresos, Pasivos, ROA y Margen Operativo.

##  Utilidad_Oper          Ingresos            Activos         
##  Min.   :-59035586   Min.   :163512863   Min.   :1.285e+09  
##  1st Qu.:-12974618   1st Qu.:237536802   1st Qu.:1.327e+09  
##  Median : 12480093   Median :272271507   Median :1.372e+09  
##  Mean   : 19671620   Mean   :301467863   Mean   :1.394e+09  
##  3rd Qu.: 49198538   3rd Qu.:369201324   3rd Qu.:1.449e+09  
##  Max.   :109988564   Max.   :511499413   Max.   :1.589e+09  
##     Pasivos               ROA           Margen_Oper     
##  Min.   :8.243e+08   Min.   :-8.2700   Min.   :-23.680  
##  1st Qu.:8.992e+08   1st Qu.:-3.3300   1st Qu.: -5.430  
##  Median :9.493e+08   Median : 1.4200   Median :  5.390  
##  Mean   :9.397e+08   Mean   : 0.5265   Mean   :  3.485  
##  3rd Qu.:9.784e+08   3rd Qu.: 4.3000   3rd Qu.: 15.100  
##  Max.   :1.030e+09   Max.   : 6.6200   Max.   : 22.470
## Warning in breaks[-1L] + breaks[-nB]: NAs producidos por enteros excedidos

Análisis Univariado

La Utilidad Operativa muestra una distribución con ligera simetría hacia valores positivos, aunque existen observaciones con pérdidas operativas significativas (mínimo de -59 millones). La media es de aproximadamente 19.6 millones, pero con una dispersión notable, lo que indica variabilidad considerable en la rentabilidad operativa de la empresa a lo largo del tiempo. El histograma refuerza esta lectura al mostrar una concentración moderada en torno al valor central, pero con colas hacia ambos extremos.

Los Ingresos, por su parte, presentan una distribución sesgada a la derecha, con una media de $301 millones y un valor máximo de más de $511 millones. Esto sugiere que en ciertos periodos la empresa ha tenido ingresos excepcionalmente altos, elevando la media respecto a la mediana ($272 millones). Esta diferencia entre media y mediana también aparece reflejada en el histograma, que tiene mayor densidad en los valores bajos y una cola hacia la derecha.

En cuanto a los Activos, se observa un comportamiento similar: media de $1.394 billones, con algunos valores altos que podrían estar influyendo en la asimetría. El histograma indica una distribución con mayor densidad en la parte inferior, lo que confirma cierta concentración en activos bajos comparado con el rango total (hasta $1.589 billones).

Los Pasivos reflejan una estructura financiera relativamente estable, con menor dispersión en comparación con activos. La mediana y la media son bastante cercanas ($949 y $939 millones respectivamente), lo que indica simetría y estabilidad. El histograma también muestra una concentración de frecuencias más compacta.

En relación al ROA (Return on Assets), los datos son más preocupantes: se observan valores negativos significativos, con un mínimo de -8.27%, lo que implica que en varios periodos la empresa no ha sido capaz de generar retorno positivo sobre sus activos. La media apenas supera el 0.5%, indicando un desempeño limitado. Sin embargo, el tercer cuartil (4.3%) muestra que en algunos momentos sí se han logrado retornos aceptables.

Finalmente, el Margen Operativo muestra un comportamiento también heterogéneo, con valores que van desde -23.68% hasta 22.47%, reflejando que en algunos periodos las operaciones fueron deficitarias. La media (3.48%) y la mediana (5.39%) sugieren una rentabilidad operativa baja pero mayormente positiva. El histograma confirma esta distribución dispersa, con observaciones tanto en márgenes negativos como positivos.

Correlación entre las variables

## Warning: package 'corrplot' was built under R version 4.4.3
## corrplot 0.95 loaded

La matriz de correlación revela fuertes vínculos positivos entre la Utilidad Operativa, los Ingresos y los Activos, sugiriendo que mayor tamaño y actividad se traducen en mejor rendimiento operativo. El Margen Operativo también se relaciona positivamente con la Utilidad Operativa y el ROA, indicando que la eficiencia en costos impulsa la rentabilidad. Sorprende la baja correlación de los Pasivos con la Utilidad Operativa y los Activos, aunque se observa una ligera relación negativa con el ROA.

Los Ingresos y los Activos muestran una alta correlación mutua y con la Utilidad Operativa. El ROA, por su parte, está fuertemente ligado al Margen Operativo y la Utilidad Operativa, pero no tanto al tamaño (Activos e Ingresos). Esto enfatiza que la eficiencia en la gestión y la rentabilidad operativa son más cruciales para el retorno sobre los activos que el volumen de activos o ventas por sí solos.

Modelos de regresión lineal simple

Modelo 1 (Utilidad Operativa - Ingresos)

## 
## Call:
## lm(formula = Utilidad_Oper ~ Ingresos, data = data)
## 
## Residuals:
##       Min        1Q    Median        3Q       Max 
## -60214222  -8111415   2619614  11179861  40740992 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -8.952e+07  1.156e+07  -7.742 4.32e-09 ***
## Ingresos     3.622e-01  3.653e-02   9.915 1.06e-11 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 21430000 on 35 degrees of freedom
## Multiple R-squared:  0.7374, Adjusted R-squared:  0.7299 
## F-statistic: 98.31 on 1 and 35 DF,  p-value: 1.06e-11
## `geom_smooth()` using formula = 'y ~ x'

El modelo de regresión lineal simple desarrollado entre los Ingresos (variable independiente) y la Utilidad Operativa (variable dependiente) muestra una relación positiva y estadísticamente significativa. El coeficiente estimado para los Ingresos es de 0.3622, lo que indica que por cada unidad monetaria adicional en ingresos, la utilidad operativa aumenta en promedio en 0.36 unidades monetarias. Este resultado es altamente significativo, con un valor p de 1.06e-11, lo cual implica una probabilidad prácticamente nula de que esta relación se deba al azar. Además, el modelo tiene un R-cuadrado de 0.7374, lo que indica que aproximadamente el 74% de la variación en la utilidad operativa puede explicarse por los ingresos. Este nivel de explicación es bastante alto para un modelo con una sola variable. El intercepto del modelo, aunque negativo (-89.52 millones), no debe interpretarse literalmente, ya que representa la utilidad esperada cuando los ingresos son cero, lo cual no es un escenario realista para empresas en funcionamiento. El gráfico de dispersión con la línea de regresión (en rojo) refuerza esta fuerte asociación positiva, mostrando cómo a medida que aumentan los ingresos, también lo hace consistentemente la utilidad operativa, aunque con cierta dispersión de los residuos alrededor de la línea. En conjunto, estos resultados sugieren que los ingresos son un factor clave y altamente predictivo de la utilidad operativa, lo cual tiene implicaciones importantes para la gestión empresarial: aumentar los ingresos puede ser una de las formas más efectivas de impulsar las ganancias operativas.

Modelo 2 (Utilidad Operativa - Activos)

## 
## Call:
## lm(formula = Utilidad_Oper ~ Activos, data = data)
## 
## Residuals:
##       Min        1Q    Median        3Q       Max 
## -94391924 -28383372   2679356  22414275  84974771 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)   
## (Intercept) -2.809e+08  1.077e+08  -2.609  0.01327 * 
## Activos      2.156e-01  7.709e-02   2.796  0.00834 **
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 37800000 on 35 degrees of freedom
## Multiple R-squared:  0.1826, Adjusted R-squared:  0.1593 
## F-statistic:  7.82 on 1 and 35 DF,  p-value: 0.008337
## `geom_smooth()` using formula = 'y ~ x'

El segundo modelo de regresión lineal simple analiza cómo los Activos influyen en la Utilidad Operativa de la empresa. El coeficiente estimado para los Activos es de 0.2156, lo que sugiere que, en promedio, por cada unidad monetaria adicional en activos, la utilidad operativa aumenta en aproximadamente 0.22 unidades monetarias. Este coeficiente es estadísticamente significativo (p = 0.00834), lo cual indica que existe evidencia suficiente para afirmar que los activos tienen un impacto positivo sobre la utilidad operativa. Sin embargo, el R-cuadrado del modelo es de 0.1826, lo que significa que solo el 18.26% de la variabilidad de la utilidad operativa puede ser explicada por los activos. Aunque la relación es significativa, es débil en términos explicativos, lo que sugiere que los activos por sí solos no bastan para predecir con precisión la utilidad operativa.

El intercepto, de -280.9 millones, tiene un valor p de 0.013, lo cual indica que también es estadísticamente significativo, aunque su interpretación práctica (como utilidad negativa cuando los activos son cero) carece de sentido económico, pues no es realista. En el gráfico de dispersión, se observa una ligera tendencia ascendente de la línea de regresión (en rojo), pero con una amplia dispersión de los puntos, lo que respalda la baja capacidad predictiva del modelo.

En conclusión, si bien existe una relación positiva entre los activos y la utilidad operativa, esta es mucho menos fuerte que la observada con los ingresos. Por tanto, aunque los activos pueden influir en la rentabilidad operativa, no son el principal impulsor de esta en el contexto de este conjunto de datos. La empresa debería considerar a los activos como un componente importante, pero no suficiente, en su estrategia de maximización de utilidad.

Modelo 3 (Utilidad Operativa - Margen Operativo)

## 
## Call:
## lm(formula = Utilidad_Oper ~ Margen_Oper, data = data)
## 
## Residuals:
##       Min        1Q    Median        3Q       Max 
## -13079954 -10355840  -4096347   5838261  31637337 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  8900535    2165314   4.111 0.000227 ***
## Margen_Oper  3090819     166399  18.575  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 12690000 on 35 degrees of freedom
## Multiple R-squared:  0.9079, Adjusted R-squared:  0.9053 
## F-statistic:   345 on 1 and 35 DF,  p-value: < 2.2e-16
## `geom_smooth()` using formula = 'y ~ x'

El tercer modelo de regresión lineal simple muestra una fuerte y significativa relación positiva entre el Margen Operativo y la Utilidad Operativa. El coeficiente estimado para el Margen Operativo es de 3,090,819, lo que implica que por cada punto porcentual adicional en el margen operativo, la utilidad operativa incrementa, en promedio, en más de 3 millones de unidades monetarias. Este coeficiente es altamente significativo (p < 2e-16), lo que indica una relación estadísticamente muy sólida entre ambas variables.

El R-cuadrado del modelo es de 0.9079, lo que significa que aproximadamente el 90.8% de la variabilidad en la utilidad operativa se explica por el margen operativo. Este es un resultado notablemente superior a los modelos anteriores, y sugiere que el margen operativo es un fuerte predictor de la rentabilidad operativa. El gráfico refuerza esta interpretación, ya que la nube de puntos está muy concentrada alrededor de la línea de regresión (en rojo), con una banda de confianza estrecha, lo cual indica poca dispersión de los errores.

El intercepto también es significativo (p = 0.000227), y tiene un valor de aproximadamente 8.9 millones, lo que representa la utilidad operativa estimada cuando el margen operativo es cero.

En resumen, este modelo es el más robusto de los tres analizados. El margen operativo no solo tiene un alto poder explicativo, sino también una relación lineal clara con la utilidad operativa. Esto sugiere que mejorar el margen operativo es una estrategia clave y efectiva para aumentar las ganancias operativas en las empresas analizadas. Desde un punto de vista práctico, el margen operativo debería ser una variable central en la toma de decisiones financieras y estratégicas.

Mejor modelo:

Tras analizar los tres modelos propuestos que buscan explicar la Utilidad Operativa a partir de distintas variables —Ingresos (Modelo 1), Activos (Modelo 2) y Margen Operativo (Modelo 3)—, el Modelo 3 es claramente el mejor, tanto estadística como gráficamente.

Este modelo presenta un R² ajustado de 0.9053, lo que significa que el 90.5% de la variabilidad en la utilidad operativa se explica únicamente por el margen operativo, una cifra notablemente más alta que en los otros dos modelos (Modelo 1: 72.99%, Modelo 2: 15.93%). Además, la pendiente del modelo es altamente significativa (p < 2e-16), lo que indica una relación fuerte y confiable.

Visualmente, el gráfico del Modelo 3 muestra los puntos muy bien ajustados a la línea de regresión, con una banda de confianza estrecha, lo cual evidencia una menor dispersión en los errores. Por el contrario, en los modelos 1 y 2 se observa mayor dispersión, lo que indica una menor precisión predictiva.

En conclusión, el Modelo 3 no solo ofrece el mejor poder explicativo, sino también el mejor ajuste visual, lo que lo convierte en la mejor opción para explicar y predecir la utilidad operativa de las empresas en la muestra.

Validación cruzada del modelo 3 (poder predictivo):

## MAE del modelo (validación cruzada LOOCV): 10883241

MAE (Error Absoluto Medio):

Este MAE representa el error promedio esperado en las predicciones del modelo, lo cual es un valor razonablemente bajo si se compara con el rango de la Utilidad Operativa observada (de aproximadamente -59 millones a 110 millones). Esto indica que el modelo tiene una buena capacidad de generalización y podría ser útil para realizar estimaciones futuras o evaluar escenarios.

Regresión Lineal Múltiple

Modelo 1:

## 
## Call:
## lm(formula = Utilidad_Oper ~ Ingresos + Margen_Oper, data = data)
## 
## Residuals:
##       Min        1Q    Median        3Q       Max 
## -18591985  -5680400  -2085530   4535711  21187747 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -2.912e+07  7.044e+06  -4.134  0.00022 ***
## Ingresos     1.352e-01  2.441e-02   5.541 3.41e-06 ***
## Margen_Oper  2.302e+06  1.877e+05  12.265 4.90e-14 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 9334000 on 34 degrees of freedom
## Multiple R-squared:  0.9516, Adjusted R-squared:  0.9488 
## F-statistic: 334.2 on 2 and 34 DF,  p-value: < 2.2e-16

El modelo muestra un excelente poder explicativo sobre la variable dependiente. El R² ajustado es de 0.9488, lo cual indica que aproximadamente el 94.88% de la variabilidad en la utilidad operativa puede ser explicada conjuntamente por los ingresos y el margen operativo. Esta es una mejora considerable respecto a los modelos simples analizados anteriormente.

Ambas variables independientes son estadísticamente significativas, lo cual indica que tienen un efecto real y confiable sobre la utilidad operativa. El coeficiente para Ingresos es positivo (0.1352), lo que implica que un aumento de una unidad monetaria en los ingresos se asocia, en promedio, con un aumento de 13.52 centavos en la utilidad operativa, manteniendo constante el margen operativo. Por su parte, el Margen Operativo tiene un coeficiente de aproximadamente 2.3 millones, lo que significa que por cada punto porcentual adicional en el margen operativo, la utilidad operativa se incrementa en 2.3 millones de pesos, manteniendo constantes los ingresos.

El modelo también presenta un error estándar residual bajo (9.33 millones) comparado con el nivel de las utilidades, lo que sugiere buena precisión en las predicciones. En conjunto, este modelo es robusto, estadísticamente sólido y altamente explicativo, por lo que puede considerarse una excelente herramienta para entender y proyectar el comportamiento de la utilidad operativa en función de variables financieras clave.

Modelo 2:

## 
## Call:
## lm(formula = Utilidad_Oper ~ Ingresos + Margen_cat, data = data)
## 
## Residuals:
##       Min        1Q    Median        3Q       Max 
## -44519400  -9371142  -2394203  14341247  32231458 
## 
## Coefficients:
##                             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)               -8.408e+07  1.038e+07  -8.100 1.91e-09 ***
## Ingresos                   2.778e-01  4.148e-02   6.697 1.09e-07 ***
## Margen_catMargen_Positivo  2.847e+07  8.751e+06   3.253  0.00258 ** 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 18980000 on 34 degrees of freedom
## Multiple R-squared:  0.7998, Adjusted R-squared:  0.788 
## F-statistic:  67.9 on 2 and 34 DF,  p-value: 1.337e-12

El segundo modelo también presenta resultados sólidos, aunque menos robustos en comparación con el primer modelo. En este caso, se ha incluido una variable categórica, Margen_cat, que clasifica los registros según si su margen operativo es positivo o no (por ejemplo, “Margen_Positivo” vs. “Margen_Negativo”).

El R² ajustado es de 0.788, lo cual indica que el modelo explica el 78.8% de la variabilidad en la utilidad operativa, lo cual sigue siendo una proporción considerable, aunque menor que el modelo anterior (94.88%). El error estándar residual es de aproximadamente 18.98 millones, lo que indica una mayor dispersión de los residuos y por tanto, menor precisión en las predicciones comparado con el primer modelo.

Ambas variables predictoras son estadísticamente significativas:

- `Ingresos` tiene un coeficiente positivo de 0.2778, lo que sugiere que, manteniendo constante la categoría del margen, cada unidad adicional en ingresos está asociada con un aumento promedio de 27.78 centavos en la utilidad operativa.

- `Margen_catMargen_Positivo` tiene un coeficiente de 28.47 millones, lo que indica que, en promedio, las empresas con margen operativo positivo tienen una utilidad operativa 28.47 millones mayor que aquellas con margen negativo o nulo, manteniendo constantes los ingresos.

Este modelo es valioso en tanto que introduce una perspectiva categórica, lo que puede ser útil desde el punto de vista gerencial o estratégico (por ejemplo, para segmentar las empresas en función de su rentabilidad operativa). No obstante, su capacidad explicativa es considerablemente inferior al modelo que incluye la variable continua Margen Operativo, lo que sugiere que la información detallada del margen como variable numérica aporta más precisión que su versión categorizada.

En conclusión, aunque este modelo es útil para comparaciones entre grupos y tiene significancia estadística clara, el modelo 1 sigue siendo superior en capacidad predictiva y ajuste general.

Mejor modelo:

## 
## Call:
## lm(formula = Utilidad_Oper ~ Ingresos + Margen_Oper, data = data)
## 
## Residuals:
##       Min        1Q    Median        3Q       Max 
## -18591985  -5680400  -2085530   4535711  21187747 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -2.912e+07  7.044e+06  -4.134  0.00022 ***
## Ingresos     1.352e-01  2.441e-02   5.541 3.41e-06 ***
## Margen_Oper  2.302e+06  1.877e+05  12.265 4.90e-14 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 9334000 on 34 degrees of freedom
## Multiple R-squared:  0.9516, Adjusted R-squared:  0.9488 
## F-statistic: 334.2 on 2 and 34 DF,  p-value: < 2.2e-16

El modelo de regresión lineal múltiple que incluye las variables Ingresos y Margen Operativo como predictoras de la Utilidad Operativa presenta un excelente desempeño estadístico. El R² ajustado es de 0.9488, lo que indica que el 94.88% de la variabilidad en la utilidad operativa es explicada por estas dos variables, lo cual evidencia un poder explicativo muy alto. Ambos coeficientes son estadísticamente significativos con valores p menores a 0.001, lo que respalda la relevancia de estas variables en la estimación del modelo. Específicamente, por cada unidad adicional en ingresos, se espera un incremento de aproximadamente $0.135 millones en la utilidad operativa, manteniendo constante el margen operativo. Asimismo, un aumento de un punto en el margen operativo se asocia con un incremento aproximado de $2.3 millones en la utilidad operativa, lo cual demuestra su fuerte impacto. El error estándar residual del modelo es de $9.33 millones, lo que sugiere una precisión adecuada en las predicciones. En conjunto, estos resultados permiten concluir que se trata de un modelo robusto y confiable para estimar la utilidad operativa a partir de los ingresos y el margen operativo.

Validación de supuestos:

## 
##  Shapiro-Wilk normality test
## 
## data:  resid(modelo_mejor)
## W = 0.9574, p-value = 0.1669

1. Supuesto de homocedasticidad (varianza constante):
El gráfico de residuos versus valores ajustados permite evaluar la presencia de homocedasticidad. En un modelo ideal, los residuos deberían distribuirse de forma aleatoria alrededor de la línea horizontal (cero) sin formar patrones claros. En este caso, se observa una ligera forma de “U” en la distribución de los residuos, lo cual sugiere una posible heterocedasticidad: la varianza de los errores tiende a aumentar con el nivel de los valores ajustados. Aunque esta desviación no es excesivamente pronunciada, sí es una señal de alerta sobre una posible violación del supuesto de varianza constante.

2. Supuesto de normalidad de los residuos:
El QQ-Plot muestra que la mayoría de los residuos siguen una línea recta, lo cual es un indicio de que se distribuyen aproximadamente de manera normal. Sin embargo, hay algunas desviaciones leves en los extremos (colas), lo que podría sugerir la presencia de outliers o cierta asimetría. A pesar de esto, el resultado de la prueba de Shapiro-Wilk (W = 0.9574, p-value = 0.1669) indica que no se puede rechazar la hipótesis nula de normalidad de los residuos al 5% de significancia. Por tanto, este supuesto se considera cumplido estadísticamente.

3. Histograma de los residuos:
El histograma presenta una forma que se aproxima a la distribución normal, aunque con cierta asimetría hacia la derecha. Esta observación es coherente con las leves desviaciones vistas en el QQ-Plot. A pesar de estas pequeñas diferencias, la forma general del histograma respalda el resultado del test de Shapiro-Wilk, reafirmando que los residuos siguen una distribución cercana a la normal.

Conclusión general:
El modelo cumple adecuadamente con el supuesto de normalidad de los residuos, respaldado tanto por los gráficos como por el test estadístico. En cuanto a la homocedasticidad, hay una ligera indicación de heterocedasticidad que podría requerir atención en análisis más exigentes, pero no invalida completamente el modelo.

¿Conviene realizar una transformación al modelo?

El análisis gráfico anterior mostró indicios de heterocedasticidad leve (varianza creciente de los residuos), lo cual justifica explorar transformaciones que estabilicen la varianza y mejoren la linealidad. Una opción clásica es aplicar logaritmo natural a la variable dependiente.

## Warning in log(Utilidad_Oper): Se han producido NaNs
## 
## Call:
## lm(formula = log(Utilidad_Oper) ~ Ingresos + Margen_Oper, data = data)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -2.28491 -0.20265  0.09952  0.46478  0.58115 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 1.442e+01  5.678e-01  25.391  < 2e-16 ***
## Ingresos    2.580e-09  2.000e-09   1.290     0.21    
## Margen_Oper 1.553e-01  2.528e-02   6.142 2.89e-06 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.6832 on 23 degrees of freedom
##   (11 observations deleted due to missingness)
## Multiple R-squared:  0.7853, Adjusted R-squared:  0.7666 
## F-statistic: 42.05 on 2 and 23 DF,  p-value: 2.074e-08
## Warning: package 'Metrics' was built under R version 4.5.0
## Warning in actual - predicted: longitud de objeto mayor no es múltiplo de la
## longitud de uno menor
## [1] 42045050

Se realizó una transformación logarítmica a la variable dependiente Utilidad_Oper con el fin de mejorar los supuestos del modelo lineal, especialmente la homocedasticidad (varianza constante).

Aunque la transformación ayudó a mejorar algunos aspectos como la posible heterocedasticidad, el modelo transformado pierde capacidad explicativa (menor R² ajustado), presenta un predictor no significativo y empeora considerablemente en términos de MAE. Por tanto, NO es conveniente usar el modelo transformado para pronosticar la variable dependiente. El modelo original es más adecuado y preciso.

Utilidad del modelo

El mejor modelo seleccionado, que predice la Utilidad Operativa a partir de los Ingresos y el Margen Operativo, tiene una utilidad práctica significativa en el ámbito empresarial, especialmente en sectores donde la planeación financiera y el control de eficiencia operativa son clave. Este modelo sería particularmente útil para empresas del sector manufacturero, de servicios o comercial, donde el margen operativo refleja directamente la eficiencia en la gestión de costos frente a los ingresos. En la práctica, este modelo permite proyectar de manera confiable la utilidad operativa a partir de variables que son fácilmente medibles y disponibles en los estados financieros, facilitando así la toma de decisiones estratégicas, evaluación de escenarios, presupuestación y valoración de empresas. Por ejemplo, una compañía podría utilizarlo para evaluar cómo mejorar su rentabilidad al modificar sus precios o estructuras de costos, o un inversionista podría usarlo para estimar el desempeño futuro de una empresa. En conclusión, este modelo no solo contribuye a una mejor comprensión de los determinantes financieros de la utilidad, sino que también se convierte en una herramienta valiosa para la planificación, análisis de desempeño y toma de decisiones financieras basadas en datos.

En el caso específico de Colombina S.A., el modelo seleccionado representa una herramienta valiosa para la gestión financiera de la compañía. Colombina, al ser una empresa del sector de alimentos con una amplia línea de productos tanto en el mercado nacional como internacional, se enfrenta constantemente a retos relacionados con el control de costos, eficiencia operativa y rentabilidad en distintos segmentos del negocio. Este modelo le permite estimar con alto grado de precisión cuál sería su utilidad operativa esperada bajo diferentes escenarios de ingresos y márgenes, facilitando así una planeación financiera más precisa y fundamentada.

Además, el modelo puede ser de gran utilidad para la evaluación de estrategias comerciales, como el lanzamiento de nuevos productos, ajustes de precios o decisiones de expansión en nuevos mercados. Por ejemplo, si Colombina proyecta un aumento en ingresos gracias a una nueva línea de exportación, el modelo puede predecir cómo esa variación —junto con un margen operativo objetivo— impactaría directamente la utilidad operativa. Esto mejora la toma de decisiones a nivel gerencial y estratégico, promoviendo un uso más eficiente de los recursos y aumentando la capacidad de anticiparse a resultados financieros. En síntesis, el modelo se convierte en un instrumento clave para el análisis financiero y la toma de decisiones estratégicas en Colombina, con una aplicación directa en presupuestación, planificación de rentabilidad y evaluación de desempeño operativo.