De acuerdo a la encuesta manufacturera del año 2019, publicada por el Departamento Administrativo Nacional de Estadística - DANE. Se han seleccionado 4 actividades economicas para analizar el comportamiento de la producción frente al nivel consumo de las fuentes de energia, en el que se permita identificar las causas de su mayor o menor consumo.
Para ello se estudía un total de 969 datos con las siguientes variables:
2511: Fabricación de productos metálicos para uso estructural.
2712: Fabricación de aparatos de distribución y control de la energía eléctrica.
3290: Otras industrias manufactureras n.c.p.
2599: Fabricación de otros productos elaborados de metal n.c.p.
## CIIU
## 2511 2599 2712 3290
## 172 247 44 506
## [1] 0.8860132
## [1] 0.6197558
## [1] -0.003253768
Partiendo de los resultados de correlación, cuyo fin es identificar la existencia de asociación entre las variables en función de la producción bruta. Se evidencia que la variable Valor Gasolina tiene una correlación negativa, por lo cual se excluye para el análisis de la regresión lineal.
En el Grafico 1 y 2, presentan homogeneidad de las variables, es decir; desde el punto de vista de correlación hay asociación de las variables.
Dado a lo anterior, se profundiza la significancia que puede tener este comportamiento a traves de la estimación de una regresión lineal.
##
## Call:
## lm(formula = PRODBR2 ~ GASNV + EELEC + as.factor(ciiu4), data = Base1)
##
## Residuals:
## Min 1Q Median 3Q Max
## -643857459 -15952693 -8655850 -3802574 900973386
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 1.018e+07 5.560e+06 1.831 0.0673 .
## GASNV 1.570e+02 1.849e+00 84.921 <2e-16 ***
## EELEC -7.958e+00 1.828e-01 -43.538 <2e-16 ***
## as.factor(ciiu4)2599 -2.109e+06 7.241e+06 -0.291 0.7709
## as.factor(ciiu4)2712 2.063e+06 1.232e+07 0.167 0.8671
## as.factor(ciiu4)3290 7.497e+06 6.450e+06 1.162 0.2455
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 72910000 on 963 degrees of freedom
## Multiple R-squared: 0.9276, Adjusted R-squared: 0.9273
## F-statistic: 2469 on 5 and 963 DF, p-value: < 2.2e-16
x = PRODBR2: PRODUCCIÓN BRUTA
y = GASNV: Valor de Gas natural
z = EELEC: Energia Electrica
F(x) = 1.018e+07 + 1.570e+02 (y) + -7.958e+00 (z)
De acuerdo al resultado se tienen los siguiente aspectos relevantes:
Para el caso Valor Gas natural, se entiende por incremento al nivel de consumo, teniendo un comportamiento lineal positivo, es decir; por un costo adicional que tenga de gas, el valor de las ventas tendrá incremento estimado de 1.570e+02.
Para esta regresión, se adicionó como variable categorica la clasificación de las actividades (CIIU), sin embargo, el estudio muestra que no tiene significancia o influencia alguna la sectorización económica.
El R-ajustado es de (0.9273) lo que quiere decir que la función creada, el valor estimado tiene un porcetanje alto de explicación a la regresión planteada.
La variable energia electrica actua para este caso inversamente proporcional a la producción bruta.
Dado que la categorización por codigo de actividad no tuvo el nivel de significancia que se esperaba, es necesario citar la segunda variable categorica llamada dpto.
##
## Call:
## lm(formula = PRODBR2 ~ GASNV + EELEC + as.factor(dpto), data = Base1)
##
## Residuals:
## Min 1Q Median 3Q Max
## -638904204 -16128818 -5095725 459188 887512731
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 2.957e+07 5.819e+06 5.082 4.51e-07 ***
## GASNV 1.559e+02 2.096e+00 74.374 < 2e-16 ***
## EELEC -7.708e+00 2.365e-01 -32.591 < 2e-16 ***
## as.factor(dpto)8 -2.635e+07 1.226e+07 -2.149 0.031870 *
## as.factor(dpto)11 -2.402e+07 7.295e+06 -3.292 0.001031 **
## as.factor(dpto)13 -1.650e+07 1.329e+07 -1.242 0.214425
## as.factor(dpto)15 7.832e+06 1.544e+07 0.507 0.612025
## as.factor(dpto)17 -1.105e+07 1.518e+07 -0.728 0.466891
## as.factor(dpto)19 2.331e+07 1.665e+07 1.400 0.161859
## as.factor(dpto)20 -1.169e+07 2.334e+07 -0.501 0.616534
## as.factor(dpto)23 -9.607e+07 4.146e+07 -2.317 0.020725 *
## as.factor(dpto)25 -1.266e+07 9.969e+06 -1.270 0.204541
## as.factor(dpto)41 5.656e+07 1.936e+07 2.922 0.003558 **
## as.factor(dpto)47 -4.983e+07 1.998e+07 -2.493 0.012821 *
## as.factor(dpto)50 -3.712e+07 1.880e+07 -1.974 0.048626 *
## as.factor(dpto)52 -2.637e+07 1.880e+07 -1.403 0.160910
## as.factor(dpto)54 -2.361e+07 1.665e+07 -1.418 0.156543
## as.factor(dpto)63 -1.111e+07 1.997e+07 -0.556 0.578055
## as.factor(dpto)66 -3.621e+07 1.374e+07 -2.636 0.008535 **
## as.factor(dpto)68 -1.792e+07 1.357e+07 -1.320 0.187059
## as.factor(dpto)70 -1.119e+08 3.252e+07 -3.442 0.000603 ***
## as.factor(dpto)73 -1.552e+07 1.571e+07 -0.988 0.323517
## as.factor(dpto)76 -2.201e+07 9.218e+06 -2.388 0.017139 *
## as.factor(dpto)85 4.331e+07 3.622e+07 1.196 0.232015
## as.factor(dpto)99 -9.957e+06 2.453e+07 -0.406 0.684902
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 71490000 on 944 degrees of freedom
## Multiple R-squared: 0.9318, Adjusted R-squared: 0.9301
## F-statistic: 537.5 on 24 and 944 DF, p-value: < 2.2e-16
En este caso, se logra identificar de manera distintiva los Departamentos que estan siendo parte del análisis y en el que se observa que hay significancia categorica con los siguientes Departamentos:
(dpto)11: Bogotá D.C
(dpto)23: Cordoba
(dpto)41: Huila
(dpto)70: Sucre
Cabe resaltar que en estos departamentos es donde mayor nivel de producción hay segun muestra el Grafico No. 3.
De esta manera, la nueva función creada, presenta un incremento en el valor estimado de la venta de gas natural y desaparece la variable EELEC en lo que se podría concluir que el consumo de energia electrica no fue suficiente significativa para explicar en función del incremento de la producción.
El R ajustado de reduje a 0.8488, pero el nivel de significancia sigue siendo alto.
Para el Departamento # 23 (Cordoba), en el Grafico No. 4 refleja la ubicación de sectores economicos con mayor consumo de Gas Natural en función de la Producción Bruta.
##
## Shapiro-Wilk normality test
##
## data: Modelo2$residuals
## W = 0.42823, p-value < 2.2e-16
Dado que el valor estimado de los residuos (p-value < 2.2e-16 ) es menor al 0,05, se rechaza la hipotesis de distribuación normal. Pör lo tanto esta regresión no explica para todos los casos y sectores económicos.
##
## studentized Breusch-Pagan test
##
## data: Modelo2
## BP = 20.943, df = 24, p-value = 0.6421
La varianción constante de los residuos es de (p-value = 2.166e-11 ) menor al 0.05, por tanto se rechaza la hipotesis. Por lo que la regresión no es suficiente para el alcance de explicación al comportamiento de todos los sectores económicos.