library(ggplot2)
library(plotly)
## Warning: package 'plotly' was built under R version 4.4.3
##
## Adjuntando el paquete: 'plotly'
## The following object is masked from 'package:ggplot2':
##
## last_plot
## The following object is masked from 'package:stats':
##
## filter
## The following object is masked from 'package:graphics':
##
## layout
El presente análisis se desarrolla a partir de una base de datos de naturaleza financiera, correspondiente a la empresa Celsia S.A., una compañía del sector energético colombiano. La información utilizada proviene de los estados de resultados y balances generales con periodicidad trimestral, lo cual permite observar de forma detallada la evolución del desempeño financiero de la organización. A partir de esta base, se seleccionaron diversas variables contables y financieras clave para llevar a cabo un análisis cuantitativo mediante modelos de regresión lineal.
La variable dependiente elegida para el desarrollo de los modelos fue el Precio de Cierre de la acción. Esta elección se justifica porque el precio de la acción refleja directamente la percepción que los inversionistas tienen sobre el valor de la empresa, siendo el resultado de múltiples factores internos y externos. Además, este indicador suele verse influenciado por el comportamiento de variables operativas, de rentabilidad, de liquidez y de riesgo financiero. Por tanto, resulta ideal para estudiar cómo diferentes métricas contables pueden incidir en la valoración bursátil de la empresa.
Para construir los modelos de regresión, se seleccionaron como variables independientes aquellos indicadores que capturan distintos componentes del desempeño financiero de Celsia S.A. Entre ellas se encuentran el ROA, que mide la eficiencia de la empresa en la generación de utilidades a partir de sus activos; el Quick Ratio, que representa la capacidad de la compañía para atender sus obligaciones de corto plazo sin depender de los inventarios; los Activos Totales y Pasivos Totales, que permiten evaluar el tamaño del balance y el nivel de apalancamiento financiero; y finalmente los Ingresos Totales, como una medida de la actividad operativa.
## # A tibble: 6 × 13
## Fecha precioc EBITDA Quick_Ratio Margen_EBITDA Margen_Bruto
## <dttm> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 2012-09-01 00:00:00 4975 145379000 1.8 38.8 34.4
## 2 2012-12-01 00:00:00 5340 51816000 2.37 33.8 30.7
## 3 2013-03-01 00:00:00 5600 149925000 1.81 22.1 34.8
## 4 2013-06-01 00:00:00 4850 205520000 2.09 22.3 38.2
## 5 2013-09-01 00:00:00 6210 176862000 2.27 22.1 36.2
## 6 2013-12-01 00:00:00 5680 292712000 2.97 22.6 32.3
## # ℹ 7 more variables: Margen_Oper <dbl>, ROA <dbl>, ROE <dbl>, Ingresos <dbl>,
## # Utilidad_Oper <dbl>, Activos <dbl>, Pasivos <dbl>
## precioc ROA Quick_Ratio Pasivos
## Min. :2579 Min. :-0.690 Min. :0.4900 Min. :2.416e+09
## 1st Qu.:3920 1st Qu.: 2.340 1st Qu.:0.6000 1st Qu.:5.170e+09
## Median :4342 Median : 3.145 Median :0.6800 Median :5.904e+09
## Mean :4336 Mean : 3.396 Mean :0.9804 Mean :5.874e+09
## 3rd Qu.:4725 3rd Qu.: 4.820 3rd Qu.:0.9975 3rd Qu.:7.001e+09
## Max. :6210 Max. : 8.320 Max. :2.9700 Max. :9.719e+09
## Activos Ingresos
## Min. :6.808e+09 Min. :5.215e+08
## 1st Qu.:9.734e+09 1st Qu.:7.786e+08
## Median :1.041e+10 Median :8.765e+08
## Mean :1.101e+10 Mean :1.001e+09
## 3rd Qu.:1.283e+10 3rd Qu.:1.278e+09
## Max. :1.526e+10 Max. :2.098e+09
## precioc ROA Quick_Ratio Pasivos Activos Ingresos
## 9.046247e+02 2.065830e+00 6.401657e-01 1.978845e+09 2.497259e+09 3.782770e+08
Para iniciar el análisis estadístico, se realizó una exploración univariada de las variables seleccionadas en el estudio: Precio de Cierre, ROA, Quick Ratio, Pasivos, Activos e Ingresos. El objetivo fue comprender el comportamiento individual de cada una, a través de sus principales medidas estadísticas y representaciones gráficas.
En primer lugar, la variable dependiente Precio de Cierre mostró un rango entre 2.579 y 6.210, con una media aproximada de 4.336 y una mediana de 4.342.La desviación estándar, cercana a 904 sugiere una variabilidad moderada en torno al promedio. El histograma revela una asimetría, con una mayor concentración de observaciones entre 4.000 y 4.500. El boxplot confirma esta tendencia, sin evidenciar valores extremos fuera del rango esperado.
En cuanto a la rentabilidad sobre activos ROA, esta varió entre –0,69% y 8,32%, con una media de aproximadamente 3,91%. Aunque existe un valor negativo, el grueso de los datos se concentra entre 2% y 6%, como lo indica el histograma. Su desviación estándar de 2,06% refleja una dispersión considerable, típica de entornos con rentabilidades muy variadas entre empresas.
Respecto al Quick Ratio, sus valores fluctúan entre –0,49 y 2,97, con una media cercana a 0,98 y y una mediana de 0,68.Esto indica que, aunque en la mayoría de los periodos la liquidez inmediata ha sido inferior a 1 (lo que podría señalar dificultades para cubrir obligaciones de corto plazo sin recurrir a inventarios), existen algunos trimestres con valores notablemente altos que elevan el promedio. El histograma evidencia una clara asimetría positiva, con la mayoría de los casos concentrados entre 0,6 y 1,0.
La variable Pasivos presenta un rango amplio, desde 2.416 millones hasta 9.719 millones. La media se sitúa en 5.874 millones, mientras que la desviación estándar es de aproximadamente 1.979 millones. El histograma refleja una distribución más concentrada en los valores intermedios, aunque con cierta asimetría.
Por otro lado, los Activos exhiben el mayor nivel de dispersión de todas las variables analizadas, con valores entre 6.808 millones y 15.260 millones. La media alcanza los 10.308 millones, mientras que la desviación estándar se eleva a 2.497 millones. El histograma muestra ciertas agrupaciones, lo cual podría indicar distintos niveles de inversión o crecimiento en diferentes periodos.
Finalmente, los Ingresos varían entre 521 millones y 2.098 millones, con una media cercana a 876 millones. Su histograma revela una distribución ligeramente asimétrica a la derecha, con la mayoría de observaciones concentradas en los primeros cuartiles. La desviación estándar, de 378 millones, indica una variabilidad considerable, reflejo de diferencias importantes en la generación de ingresos, posiblemente por estacionalidad o eventos extraordinarios.
## `geom_smooth()` using method = 'loess' and formula = 'y ~ x'
## [1] -0.8016069
La variable Pasivos mostró una correlación negativa fuerte con el precio de la acción (–0.80). Esta relación indica que a medida que aumenta el nivel de endeudamiento de la empresa, el valor de mercado de su acción tiende a disminuir. Este comportamiento es coherente desde una perspectiva financiera, ya que un mayor volumen de pasivos puede percibirse como un aumento en el riesgo financiero de la empresa, lo cual reduce su atractivo para los inversionistas y, por ende, su valoración bursátil.
## `geom_smooth()` using method = 'loess' and formula = 'y ~ x'
## [1] -0.7740833
Los Activos también presentan una correlación negativa fuerte (–0.77) con el precio de cierre. Si bien se podría esperar que un mayor nivel de activos represente mayor capacidad productiva o financiera, en este caso la relación negativa sugiere que el aumento de activos no se ha traducido en un aumento proporcional de valor para el accionista. Esto puede deberse a que los activos no están siendo utilizados eficientemente, o que están apalancados con deuda en exceso, lo que disminuye la rentabilidad sobre ellos.
##Exploración Bivariada
g3= ggplot(data=Base,mapping = aes(x=Ingresos,y=precioc))+geom_point()+theme_bw()+
geom_smooth()
ggplotly(g3)
## `geom_smooth()` using method = 'loess' and formula = 'y ~ x'
## [1] -0.7355717
En el caso de los Ingresos, la correlación con el precio de la acción fue también negativa y fuerte (–0.73). Este resultado puede parecer contraintuitivo, ya que mayores ingresos generalmente se asocian con mayor valor de mercado. Sin embargo, una posible explicación es que el crecimiento de los ingresos no está acompañado por un aumento en la rentabilidad o en la eficiencia operativa, lo que genera dudas sobre la sostenibilidad del desempeño de la empresa, reflejándose en un menor precio de la acción, de todas formas es un supuesto.
## `geom_smooth()` using method = 'loess' and formula = 'y ~ x'
## [1] 0.6150561
La variable ROA mostró una correlación positiva moderada (+0.61) con el precio de cierre. Este hallazgo es lógico desde el punto de vista financiero: a mayor rentabilidad sobre los activos, mayor es el atractivo de la empresa para los inversionistas, lo cual contribuye al aumento del valor de mercado de la acción. Esto refleja que cuando Celsia logra utilizar sus activos de forma eficiente para generar utilidades, el mercado responde positivamente.
## `geom_smooth()` using method = 'loess' and formula = 'y ~ x'
## [1] 0.5665581
El Quick Ratio presentó una correlación positiva moderada (+0.57). Este indicador de liquidez muestra que, en la medida en que la empresa tiene una mejor capacidad para cubrir sus obligaciones a corto plazo sin necesidad de vender inventarios, el precio de su acción tiende a incrementarse. Una posición de liquidez sólida es generalmente interpretada por los inversionistas como un signo de estabilidad financiera, lo cual puede traducirse en una mayor valoración en el mercado.
A continuación se proponen tres modelos de regresión lineal simple entre el precio de la acción en función a los pasivos, el ROA, y Quick Ratio.Cabe aclarar que, dentro de la base de datos seleccionada no se incluyen variables categóricas, por lo tanto, todos los modelos de regresión lineal simple fueron desarrollados con variables cuantitativas.
##
## Call:
## lm(formula = precioc ~ Pasivos, data = Base)
##
## Residuals:
## Min 1Q Median 3Q Max
## -1514.61 -468.19 18.16 420.03 1274.02
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 6.488e+03 2.443e+02 26.563 < 2e-16 ***
## Pasivos -3.665e-07 3.945e-08 -9.289 2.67e-12 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 546.4 on 48 degrees of freedom
## Multiple R-squared: 0.6426, Adjusted R-squared: 0.6351
## F-statistic: 86.29 on 1 and 48 DF, p-value: 2.672e-12
En el primer modelo de regresión lineal simple se analizó la relación entre el precio de la acción y el nivel de pasivos de la empresa. Esta variable fue seleccionada como predictor debido a que presentó la correlación más alta en valor absoluto con el precio de cierre (–0.80), lo cual sugiere una relación inversa fuerte entre ambas. Desde el punto de vista financiero, esta elección se sustenta en que un mayor nivel de endeudamiento puede generar una percepción de mayor riesgo, afectando negativamente la valoración bursátil por parte de los inversionistas.
El modelo estimado fue: precioc = 6488 – (0.0000003665 × Pasivos)
β₀ (intercepto) = 6488.00 β₁ (coeficiente de Pasivos) = –0.0000003665
Este coeficiente indica que, por cada peso adicional en los pasivos de la empresa, el precio de la acción disminuye en promedio $0.0000003665 COP. Si se desea expresar esto en una escala más manejable, puede interpretarse que por cada 1.000 millones de pesos adicionales en deuda, el precio de la acción se reduciría aproximadamente en $366,5 COP. Esta relación negativa es coherente con la teoría financiera, que advierte que un aumento del apalancamiento puede afectar la percepción de sostenibilidad financiera, y en consecuencia, el valor de mercado.
Desde el punto de vista estadístico, los resultados del modelo también respaldan su validez. El coeficiente de los pasivos es altamente significativo. Además, el modelo tiene un R² de 0.6426, lo que significa que aproximadamente el 64.3% de la variación del precio de la acción puede ser explicada únicamente por el nivel de pasivos. Este es un resultado notablemente alto para un modelo con una sola variable explicativa, lo que refuerza el papel determinante del endeudamiento en la valoración de la acción de Celsia.
##
## Call:
## lm(formula = precioc ~ ROA, data = Base)
##
## Residuals:
## Min 1Q Median 3Q Max
## -1914.2 -363.9 160.2 511.4 1390.5
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 3420.97 197.57 17.315 < 2e-16 ***
## ROA 269.33 49.84 5.404 2.01e-06 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 720.7 on 48 degrees of freedom
## Multiple R-squared: 0.3783, Adjusted R-squared: 0.3653
## F-statistic: 29.21 on 1 and 48 DF, p-value: 2.009e-06
En el segundo modelo de regresión lineal simple se examinó la relación entre el precio de la acción y la rentabilidad sobre los activos (ROA). Esta variable fue seleccionada como predictor debido a que presentó una correlación positiva moderada (+0.61) con el precio de cierre. Desde una perspectiva financiera, esta elección está fundamentada en el hecho de que una mayor rentabilidad sobre los activos indica una mayor eficiencia operativa, lo que puede traducirse en mayor atractivo para los inversionistas y, en consecuencia, en una valorización del precio de la acción.
El modelo estimado fue:
precioc = 3420.97 + (269.33 × ROA)
β₀ (intercepto) = 3420.97
β₁ (coeficiente de ROA) = 269.33
Este coeficiente sugiere que, por cada punto porcentual adicional en el ROA, el precio de la acción de Celsia se incrementaría en promedio en $269.33 COP. Esta relación positiva es coherente con la teoría financiera, que establece que un mayor retorno sobre los activos suele ser interpretado como una señal de solidez y rentabilidad empresarial, factores valorados positivamente por el mercado.
El coeficiente asociado al ROA tiene un valor p muy bajo, lo cual indica que su efecto sobre el precio de la acción es estadísticamente significativo. El coeficiente de determinación (R² = 0.3783) muestra que aproximadamente el 37.8% de la variabilidad del precio de la acción puede ser explicada por la rentabilidad sobre los activos. Si bien no es un valor elevado, es razonable para un modelo con una sola variable explicativa y sugiere que el ROA tiene un rol relevante, aunque no exclusivo, en la explicación del comportamiento del precio.
##
## Call:
## lm(formula = precioc ~ Ingresos, data = Base)
##
## Residuals:
## Min 1Q Median 3Q Max
## -1124.4 -372.7 -118.0 249.1 1418.5
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 6.096e+03 2.499e+02 24.398 < 2e-16 ***
## Ingresos -1.759e-06 2.338e-07 -7.523 1.17e-09 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 619.2 on 48 degrees of freedom
## Multiple R-squared: 0.5411, Adjusted R-squared: 0.5315
## F-statistic: 56.59 on 1 and 48 DF, p-value: 1.168e-09
En el tercer modelo de regresión lineal simple se exploró la relación entre el precio de la acción y los ingresos de la empresa. Esta variable fue seleccionada como predictor debido a que presentó una correlación negativa fuerte con el precio de cierre (–0.73). Si bien este resultado puede parecer contraintuitivo como se ha mencionado anteriormente, ya que se esperaría que mayores ingresos conduzcan a una mayor valoración bursátil, una posible explicación es que el incremento en ingresos no se está traduciendo en una mejora de la rentabilidad o eficiencia operativa. Esto podría generar escepticismo en los inversionistas sobre la calidad o sostenibilidad del crecimiento, afectando negativamente el precio de la acción.
El modelo estimado fue:
precioc = 6096 – (0.000001759 × Ingresos)
β₀ (intercepto) = 6096 β₁ (coeficiente de Pasivos) = –0.000001759
El coeficiente sugiere que por cada peso adicional en ingresos, el precio de la acción se reduciría en promedio $0.000001759 COP. Expresado de forma más comprensible, por cada 1.000 millones de pesos adicionales en ingresos, el precio de la acción caería aproximadamente $1.759 COP. Esta relación negativa, aunque poco usual desde una perspectiva tradicional, podría ser consistente con situaciones donde el crecimiento de ingresos está acompañado de un aumento desproporcionado de los costos, márgenes decrecientes, o inversiones ineficientes, lo cual el mercado podría estar penalizando.
Desde el punto de vista estadístico, el modelo ofrece resultados robustos. El coeficiente de los ingresos es altamente significativo, indicando que su relación con el precio de la acción no es producto del azar. Además, el coeficiente de determinación (R² = 0.5411) indica que aproximadamente el 54.1% de la variabilidad en el precio de la acción puede explicarse por los ingresos.
## `geom_smooth()` using formula = 'y ~ x'
Tras analizar los tres modelos de regresión lineal simple propuestos para explicar el precio de la acción de Celsia, se concluye que el Modelo 1, que utiliza los pasivos como variable predictora, es el mejor. Esta decisión se sustenta en varios factores. En primer lugar, este modelo presentó el mayor coeficiente de determinación (R² = 0.6426), lo cual indica que explica aproximadamente el 64.3% de la variabilidad del precio de la acción, superando con claridad a los modelos basados en ROA y en ingresos. En segundo lugar, la relación negativa entre los pasivos y el precio de la acción es estadísticamente significativa y coherente con la teoría financiera, que señala que un mayor nivel de endeudamiento puede generar una percepción de mayor riesgo, reduciendo la valoración bursátil por parte del mercado.
A continuación vamos a realizar una validación cruzada para evaluar el poder predictivo del modelo. Usaremos un escenario 80-20 (modelar-validar) como se observa:
## [1] 426.68
Para validar el poder predictivo del modelo se segmentaron los datos en un 80% para ajustar el modelo y un 20% para validar su desempeño. Luego, se ajustó el modelo de regresión lineal con el conjunto de entrenamiento (80%) y se predijeron los precios de la acción en el conjunto de validación (20%). La comparación entre los valores reales y predichos permitió calcular el Error Absoluto Medio (MAE), que resultó ser aproximadamente 426.68 COP.
Este valor indica que, en promedio, el modelo se equivoca en la predicción del precio de la acción en unos $427 pesos colombianos. Considerando que el precio de las acciones en la muestra oscila en un rango amplio, este error se puede considerar relativamente bajo, lo que implica que el modelo tiene un buen poder predictivo y es útil para estimar de manera confiable el precio de la acción a partir del nivel de pasivos.
A continuación se proponen dos modelos de regresión lineal múltiple. Sin embargo, teniendo en cuenta que se debe incluir una variable categórica y en este caso, la base de datos utilizada no cuenta con ninguna, se realiza primero una transformación de la variable ROA numérica en una variable categórica tipo factor con dos niveles:
“Positivo” si ROA > 0 “Negativo” si ROA ≤ 0
##
## Negativo Positivo
## 4 46
Con el objetivo de mejorar el modelo para explicar y predecir el precio de cierre de la acción de Celsia, se eligieron como variables predictoras adicionales los Pasivos, los Ingresos y una versión categorizada de la variable ROA (positiva o negativa)
##
## Call:
## lm(formula = precioc ~ Pasivos + ROA_cat + Ingresos, data = Base)
##
## Residuals:
## Min 1Q Median 3Q Max
## -838.02 -435.68 36.07 358.42 1136.84
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 5.743e+03 3.332e+02 17.236 < 2e-16 ***
## Pasivos -3.117e-07 6.961e-08 -4.478 4.95e-05 ***
## ROA_catPositivo 8.151e+02 2.626e+02 3.104 0.00327 **
## Ingresos -3.259e-07 3.650e-07 -0.893 0.37652
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 500.6 on 46 degrees of freedom
## Multiple R-squared: 0.7125, Adjusted R-squared: 0.6938
## F-statistic: 38 on 3 and 46 DF, p-value: 1.653e-12
El modelo estimado fue:
precioc = 5743 – (0.0000003117 × Pasivos) + (815.1 × ROA_catPositivo) – (0.0000003259 × Ingresos)
Donde:
β₀ (intercepto) = 5743 Representa el precio de la acción esperado cuando los pasivos e ingresos son cero y el ROA es negativo (categoría de referencia).
β₁ (coeficiente de Pasivos) = –0.0000003117 β₂ (coeficiente de ROA positivo) = 815.1 β₃ (coeficiente de Ingresos) = –0.0000003259
El modelo de regresión lineal múltiple que incorpora como variables predictoras los Pasivos, la variable categórica ROA_cat (Positivo vs. Negativo) y los Ingresos muestra un buen nivel de ajuste, con un R² ajustado de 0.6938. Esto indica que aproximadamente el 69.4% de la variabilidad en el precio de la acción puede ser explicada por la combinación de estas tres variables.
En cuanto a la interpretación de betas, se puede observar que el coeficiente de los pasivos es -3.117e-07, lo que implica que por cada peso adicional en pasivos, el precio de la acción disminuye en promedio $0.0000003117 COP. Si se interpreta a mayor escala, por cada 1.000 millones de pesos en pasivos adicionales, el precio de la acción se reduciría en $311.7 COP, manteniendo constantes las demás variables. Este efecto es negativo y altamente significativo.
La categoría “Positivo” de ROA tiene un coeficiente de 815.1, lo que significa que, manteniendo constantes los pasivos e ingresos, las empresas con un ROA positivo tienden a tener un precio de acción $815 COP más alto en promedio que aquellas con ROA negativo. Este efecto es estadísticamente significativo (p ≈ 0.003), lo que sugiere que el mercado valora favorablemente las empresas con rentabilidad sobre activos positiva.
Por otro lado, el coeficiente de los ingresos es -3.259e-07. Aunque es negativo, este efecto no resulta estadísticamente significativo (p ≈ 0.377), lo cual sugiere que, una vez controlados los pasivos y la rentabilidad, el nivel de ingresos por sí solo no tiene un impacto claro sobre el precio de la acción. Esto puede indicar que el mercado percibe que ingresos altos no necesariamente se traducen en eficiencia o rentabilidad si no están acompañados de una buena gestión de costos o márgenes operativos.
En conclusión, este modelo de regresión lineal múltiple mejora el poder explicativo respecto a los modelos simples propuestos anteriormente. Adicionalmente,los resultados respaldan que el endeudamiento y la rentabilidad efectiva (no solo el nivel de ingresos) son los factores más relevantes para los inversionistas a la hora de valorar una acción.
Para construir este segundo modelo, se mantuvieron las variables Pasivos y la versión categorizada de ROA (ROA_cat) debido a su capacidad explicativa comprobada en modelos anteriores. Se reemplazó Ingresos por Activos para explorar si el tamaño total de la empresa influye directamente en el precio de la acción. Además, se incorporó la variable de liquidez Quick_Ratio, bajo la hipótesis de que una mejor posición de liquidez podría generar mayor confianza en los inversionistas, afectando positivamente el precio de mercado.
##
## Call:
## lm(formula = precioc ~ Pasivos + ROA_cat + Activos + Quick_Ratio,
## data = Base)
##
## Residuals:
## Min 1Q Median 3Q Max
## -762.51 -409.72 25.51 428.50 1081.25
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 6.270e+03 5.386e+02 11.640 3.62e-15 ***
## Pasivos -1.542e-07 1.897e-07 -0.813 0.420554
## ROA_catPositivo 1.026e+03 2.909e+02 3.527 0.000979 ***
## Activos -1.768e-07 1.385e-07 -1.277 0.208166
## Quick_Ratio -2.693e+01 1.700e+02 -0.158 0.874838
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 499.4 on 45 degrees of freedom
## Multiple R-squared: 0.7201, Adjusted R-squared: 0.6953
## F-statistic: 28.95 on 4 and 45 DF, p-value: 6.192e-12
El modelo estimado fue:
precioc= 6270−(0.0000001542×Pasivos)+(1026×ROA_catPositivo)−(0.0000001768×Activos) −(26.93×Quick_Ratio)
β₀ (Intercepto): 6270 β₁ (Pasivos): –0.0000001542 β₂ (ROA_catPositivo): 1026 β₃ (Activos): –0.0000001768 β₄ (Quick Ratio): –26.93
En el modelo estimado, el intercepto es de aproximadamente 6,270, lo que representa el valor esperado del precio de la acción cuando todas las variables predictoras son iguales a cero. Aunque es de resaltar que este valor no tiene una interpretación práctica directa.
La variable categórica ROA_cat, muestra un coeficiente de 1,026. Esto indica que, en promedio, las empresas con un ROA positivo tienen un precio de acción 1,026 pesos más alto en comparación con aquellas con ROA negativo, manteniendo constantes las demás variables. Este coeficiente es estadísticamente significativo, lo que confirma la relevancia del rendimiento operativo en la determinación del valor de mercado.
Por otro lado, los coeficientes de las variables Pasivos, Activos y Quick_Ratio resultaron no significativos desde el punto de vista estadístico. Aunque sus signos sugieren una relación negativa con el precio de la acción, estos resultados no son concluyentes y deben interpretarse con cautela, ya que podrían deberse a multicolinealidad o a una muestra limitada.
Ahora bien, el modelo presenta un R² ajustado de 0.6953, lo cual indica que aproximadamente el 69.5% de la variabilidad en el precio de la acción puede ser explicada por las variables incluidas. Este valor es relativamente alto y evidencia una buena capacidad explicativa del modelo en su conjunto. Además, el error estándar residual es de aproximadamente 499.4, lo que refleja una magnitud moderada de los errores de predicción.
Para identificar cuál de los dos modelos múltiples estimados ofrece mejor capacidad explicativa y eficiencia estadística, se utilizó el método de selección de variables paso a paso basado en el criterio AIC.
# Selección paso a paso para Modelo 1
modelo_categ_step <- step(modelo_categ)
## Start: AIC=625.41
## precioc ~ Pasivos + ROA_cat + Ingresos
##
## Df Sum of Sq RSS AIC
## - Ingresos 1 199827 11727508 624.27
## <none> 11527681 625.41
## - ROA_cat 1 2413726 13941407 632.92
## - Pasivos 1 5024811 16552492 641.50
##
## Step: AIC=624.27
## precioc ~ Pasivos + ROA_cat
##
## Df Sum of Sq RSS AIC
## <none> 11727508 624.27
## - ROA_cat 1 2604913 14332420 632.30
## - Pasivos 1 25531637 37259145 680.07
##
## Call:
## lm(formula = precioc ~ Pasivos + ROA_cat, data = Base)
##
## Residuals:
## Min 1Q Median 3Q Max
## -828.76 -406.57 31.04 382.68 1207.87
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 5.704e+03 3.297e+02 17.302 < 2e-16 ***
## Pasivos -3.648e-07 3.607e-08 -10.115 2.21e-13 ***
## ROA_catPositivo 8.414e+02 2.604e+02 3.231 0.00225 **
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 499.5 on 47 degrees of freedom
## Multiple R-squared: 0.7075, Adjusted R-squared: 0.6951
## F-statistic: 56.85 on 2 and 47 DF, p-value: 2.836e-13
## Start: AIC=626.07
## precioc ~ Pasivos + ROA_cat + Activos + Quick_Ratio
##
## Df Sum of Sq RSS AIC
## - Quick_Ratio 1 6258 11228401 624.10
## - Pasivos 1 164793 11386936 624.80
## - Activos 1 406648 11628790 625.85
## <none> 11222142 626.07
## - ROA_cat 1 3102956 14325099 636.28
##
## Step: AIC=624.1
## precioc ~ Pasivos + ROA_cat + Activos
##
## Df Sum of Sq RSS AIC
## - Pasivos 1 179916 11408317 622.89
## <none> 11228401 624.10
## - Activos 1 499107 11727508 624.27
## - ROA_cat 1 3097325 14325726 634.28
##
## Step: AIC=622.89
## precioc ~ ROA_cat + Activos
##
## Df Sum of Sq RSS AIC
## <none> 11408317 622.89
## - ROA_cat 1 4663145 16071462 638.03
## - Activos 1 25850828 37259145 680.07
##
## Call:
## lm(formula = precioc ~ ROA_cat + Activos, data = Base)
##
## Residuals:
## Min 1Q Median 3Q Max
## -779.42 -399.54 17.32 385.26 1026.98
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 6.512e+03 3.799e+02 17.142 < 2e-16 ***
## ROA_catPositivo 1.131e+03 2.580e+02 4.383 6.53e-05 ***
## Activos -2.922e-07 2.831e-08 -10.320 1.15e-13 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 492.7 on 47 degrees of freedom
## Multiple R-squared: 0.7155, Adjusted R-squared: 0.7034
## F-statistic: 59.1 on 2 and 47 DF, p-value: 1.483e-13
En el Modelo 1, el procedimiento de selección eliminó la variable Ingresos por su baja contribución al modelo ( aumento del AIC), resultando en una versión más simple: precioc ~ Pasivos + ROA_cat. Este modelo final obtuvo un AIC de 624.27, un R² ajustado de 0.6951 y coeficientes significativos para ambas variables.
En el Modelo 2, el proceso eliminó inicialmente Quick_Ratio, luego Pasivos, conservando finalmente las variables ROA_cat y Activos. Este modelo resultante (precioc ~ ROA_cat + Activos) presentó un menor AIC de 622.89 y un R² ajustado de 0.7034, ligeramente superior al del modelo 1.
Comparando ambos modelos ajustados tras la selección, se concluye que el Modelo 2 optimizado es el más eficiente y explicativo, ya que presenta el menor AIC y el mayor R² ajustado.
par(mfrow=c(2,2))
plot(modelo_categ2_step)
Los residuos se distribuyen de manera relativamente aleatoria alrededor de la línea cero, sin mostrar un patrón claro que indica una relación no lineal entre las variables. La homocedasticidad, que implica una variación constante de los residuos, parece cumplirse razonablemente, aunque hay algunos puntos atípicos que podrían sugerir variaciones. El gráfico “Scale-Location” refuerza esta idea, mostrando una línea mayormente horizontal con un nivel de tendencia al aumento en valores ajustados altos, lo que indica que la variación es mayormente constante, aunque no perfectamente uniforme.
La normalidad de los residuos se analiza mediante el gráfico QQ. Los puntos se alinean bien con la línea diagonal en la mayor parte del rango, lo que sugiere que los errores del modelo siguen aproximadamente una distribución normal. Sin embargo, se observan desviaciones en las colas (extremos superior e inferior), indicando que los residuos tienen colas más pesadas de lo esperado.
Esto requiere que se realice una transformación logaritmica.
##
## Call:
## lm(formula = log(precioc) ~ Pasivos + ROA_cat + Activos + Quick_Ratio,
## data = Base)
##
## Residuals:
## Min 1Q Median 3Q Max
## -0.21427 -0.09897 0.01459 0.11487 0.19049
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 8.911e+00 1.349e-01 66.077 < 2e-16 ***
## Pasivos -3.484e-11 4.749e-11 -0.734 0.466920
## ROA_catPositivo 2.688e-01 7.284e-02 3.690 0.000603 ***
## Activos -5.013e-11 3.467e-11 -1.446 0.155081
## Quick_Ratio -5.045e-02 4.256e-02 -1.185 0.242090
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.125 on 45 degrees of freedom
## Multiple R-squared: 0.698, Adjusted R-squared: 0.6712
## F-statistic: 26.01 on 4 and 45 DF, p-value: 3.323e-11
Validamos supuestos nuevamente:
La transformación logarítmica mejoró notablemente los supuestos de la regresión lineal. Los residuos muestran una relación más lineal, una varianza más constante, una distribución más normal y una menor influencia de observaciones atípicas, haciendo el modelo más confiable para inferencias y predicciones.
La comparación entre el modelo inicial ( modelo_categ2_step ) y el modelo transformado ( modelo_categ2_log ) revela que el primero es más adecuado para pronosticar precio . El modelo inicial tiene todos sus coeficientes significativos, un R² ajustado mayor (0.7034 frente a 0.6712) que explica mejor la variabilidad, y un ajuste más confiable, aunque su MAE estimado es mayor (10.05 frente a 0.00255 en escala logarítmica). El modelo transformado, pese a mejorar la homocedasticidad y normalidad, presenta varios coeficientes no significativos (como Pasivos, Activos y Quick_Ratio) y un R² ajustado menor, lo que reduce su poder predictivo en la escala original. Por lo tanto, el modelo inicial se selecciona como el mejor para predicciones, ofreciendo un equilibrio superior entre significancia estadística y capacidad explicativa.
## Predicción para ROA_catPositivo = 1, Activos = 5,000,000: 7641.539
## Predicción para ROA_catPositivo = 0, Activos = 10,000,000: 6509.078
## Predicción para ROA_catPositivo = 1, Activos = 7,500,000: 7640.809
Las predicciones del modelo modelo_categ2_step nos dan estimaciones del precio ( precioc ) basadas en diferentes combinaciones hipotéticas de las variables ROA_catPositivo (si el ROA es positivo o no) y Activos.
ROA_catPositivo = 1, Activos = 5.000.000: 7641,54 Esto significa que, si una empresa tiene un ROA positivo y activos por 5 millones, su precio estimado sería de aproximadamente 7641,54. El ROA positivo ayuda a aumentar el precio, mientras que los activos reducen un poco el precio debido a un efecto negativo pequeño.
ROA_catPositivo = 0, Activos = 10,000,000: 6509.08 Aquí, si la empresa no tiene un ROA positivo y tiene 10 millones en activos, el precio estimado baja a 6509.08. Sin un ROA positivo, el precio es menor, y los activos más altos siguen reduciendo un poco el valor total.
ROA_catPositivo = 1, Activos = 7.500.000: 7640,81 Para una empresa con ROA positivo y 7,5 millones en activos, el precio estimado es 7640,81. Es un poco menor que el primer caso porque los activos más altos bajan ligeramente el precio, pero el ROA positivo sigue siendo un factor positivo importante.
En general el modelo muestra que tener un ROA positivo aumenta el precio en unas 1131 unidades, mientras que los activos tienen un efecto negativo muy pequeño (disminuyen el precio en 0.0000002922 por unidad). Estas predicciones ayudan a entender cómo estas variables influyen en el precio, pero hay que tener en cuenta que otros factores no incluidos en el modelo también podrían afectar los resultados.
El modelo modelo_categ2_step es útil para predecir el precio de cierre de la acción de Celsia SA ( precioc ), una empresa del sector energético en Colombia, usando variables como el ROA positivo y los activos totales. Con un buen ajuste (R² ajustado de 0.7034), este modelo permite estimar cuánto podría valer la acción al cierre, basándose en datos trimestrales de los estados financieros de Celsia.
Este modelo es especialmente útil en el sector energético, donde Celsia enfrenta retos como cambios en la demanda, costos de operación y reglas del gobierno. Predecir el precio de la acción al cierre permite a la empresa planificar mejor sus movimientos, por ejemplo, decidir si es un buen momento para emitir más acciones o invertir en proyectos como plantas de energía renovable. El modelo muestra que un ROA positivo sube el precio de la acción en 1131 unidades, lo que sugiere que mejorar la rentabilidad puede hacer que la acción valga más, mientras que tener más activos bajo un poco el precio.
Celsia puede usar estas predicciones en su planificación, para anticipar el precio de cierre de su acción y ajustar sus decisiones financieras. También puede probar diferentes escenarios de ROA y activos para ver cómo podrían cambiar el valor de la acción, ayudando a identificar si es un buen momento para crecer o atraer inversionistas. Además, compartir estas predicciones con los accionistas puede darles más confianza en la empresa, aunque siempre hay que considerar otros factores externos.