COMPORTAMIENTO DE LAS FUENTES DE ENERGIA EN LA PRODUCCIÓN BRUTA.

De acuerdo a la encuesta manufacturera del año 2019, publicada por el Departamento Administrativo Nacional de Estadística - DANE. Se han seleccionado 4 actividades economicas para analizar el comportamiento de la producción frente al nivel consumo de las fuentes de energia, en el que se permita identificar las causas de su mayor o menor consumo.

Para ello se estudía un total de 969 datos con las siguientes variables:

  • EELEC: Energía Eléctrica en kw
  • GASNC: Cantidad de Gas natural
  • GASNV: Valor de Gas natural
  • PRODBR2: Producción Bruta
  • GASOLV: Valor de Gasolina
  • dpto: Departamento
  • CIUU:

2511: Fabricación de productos metálicos para uso estructural.

2712: Fabricación de aparatos de distribución y control de la energía eléctrica.

3290: Otras industrias manufactureras n.c.p.

2599: Fabricación de otros productos elaborados de metal n.c.p.

## CIIU
## 2511 2599 2712 3290 
##  172  247   44  506

1. Coeficiente de Correlación

  • Producción Bruta vs Ventas Gas Natural
## [1] 0.8860132
  • Producción Bruta vs Energia Electrica
## [1] 0.6197558
  • Producción Bruta vs Ventas Gasolina
## [1] -0.003253768

Partiendo de los resultados de correlación, cuyo fin es identificar la existencia de asociación entre las variables en función de la producción bruta. Se evidencia que la variable Valor Gasolina tiene una correlación negativa, por lo cual se excluye para el análisis de la regresión lineal.

En el Grafico 1 y 2, presentan homogeneidad de las variables, es decir; desde el punto de vista de correlación hay asociación de las variables.

Dado a lo anterior, se profundiza la significancia que puede tener este comportamiento a traves de la estimación de una regresión lineal.

2. Regresión Modelo No. 1

## 
## Call:
## lm(formula = PRODBR2 ~ GASNV + EELEC + as.factor(ciiu4), data = Base1)
## 
## Residuals:
##        Min         1Q     Median         3Q        Max 
## -643857459  -15952693   -8655850   -3802574  900973386 
## 
## Coefficients:
##                        Estimate Std. Error t value Pr(>|t|)    
## (Intercept)           1.018e+07  5.560e+06   1.831   0.0673 .  
## GASNV                 1.570e+02  1.849e+00  84.921   <2e-16 ***
## EELEC                -7.958e+00  1.828e-01 -43.538   <2e-16 ***
## as.factor(ciiu4)2599 -2.109e+06  7.241e+06  -0.291   0.7709    
## as.factor(ciiu4)2712  2.063e+06  1.232e+07   0.167   0.8671    
## as.factor(ciiu4)3290  7.497e+06  6.450e+06   1.162   0.2455    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 72910000 on 963 degrees of freedom
## Multiple R-squared:  0.9276, Adjusted R-squared:  0.9273 
## F-statistic:  2469 on 5 and 963 DF,  p-value: < 2.2e-16

x = PRODBR2: PRODUCCIÓN BRUTA

y = GASNV: Valor de Gas natural

z = EELEC: Energia Electrica

F(x) = 1.018e+07 + 1.570e+02 (y) + -7.958e+00 (z)

De acuerdo al resultado se tienen los siguiente aspectos relevantes:

  1. Para el caso Valor Gas natural, se entiende por incremento al nivel de consumo, teniendo un comportamiento lineal positivo, es decir; por un costo adicional que tenga de gas, el valor de las ventas tendrá incremento estimado de 1.570e+02.

  2. Para esta regresión, se adicionó como variable categorica la clasificación de las actividades (CIIU), sin embargo, el estudio muestra que no tiene significancia o influencia alguna la sectorización económica.

  3. El R-ajustado es de (0.9273) lo que quiere decir que la función creada, el valor estimado tiene un porcetanje alto de explicación a la regresión planteada.

  4. La variable energia electrica actua para este caso inversamente proporcional a la producción bruta.

Dado que la categorización por codigo de actividad no tuvo el nivel de significancia que se esperaba, es necesario citar la segunda variable categorica llamada dpto.

3. Regresión Modelo No. 2

## 
## Call:
## lm(formula = PRODBR2 ~ GASNV + EELEC + as.factor(dpto), data = Base1)
## 
## Residuals:
##        Min         1Q     Median         3Q        Max 
## -638904204  -16128818   -5095725     459188  887512731 
## 
## Coefficients:
##                     Estimate Std. Error t value Pr(>|t|)    
## (Intercept)        2.957e+07  5.819e+06   5.082 4.51e-07 ***
## GASNV              1.559e+02  2.096e+00  74.374  < 2e-16 ***
## EELEC             -7.708e+00  2.365e-01 -32.591  < 2e-16 ***
## as.factor(dpto)8  -2.635e+07  1.226e+07  -2.149 0.031870 *  
## as.factor(dpto)11 -2.402e+07  7.295e+06  -3.292 0.001031 ** 
## as.factor(dpto)13 -1.650e+07  1.329e+07  -1.242 0.214425    
## as.factor(dpto)15  7.832e+06  1.544e+07   0.507 0.612025    
## as.factor(dpto)17 -1.105e+07  1.518e+07  -0.728 0.466891    
## as.factor(dpto)19  2.331e+07  1.665e+07   1.400 0.161859    
## as.factor(dpto)20 -1.169e+07  2.334e+07  -0.501 0.616534    
## as.factor(dpto)23 -9.607e+07  4.146e+07  -2.317 0.020725 *  
## as.factor(dpto)25 -1.266e+07  9.969e+06  -1.270 0.204541    
## as.factor(dpto)41  5.656e+07  1.936e+07   2.922 0.003558 ** 
## as.factor(dpto)47 -4.983e+07  1.998e+07  -2.493 0.012821 *  
## as.factor(dpto)50 -3.712e+07  1.880e+07  -1.974 0.048626 *  
## as.factor(dpto)52 -2.637e+07  1.880e+07  -1.403 0.160910    
## as.factor(dpto)54 -2.361e+07  1.665e+07  -1.418 0.156543    
## as.factor(dpto)63 -1.111e+07  1.997e+07  -0.556 0.578055    
## as.factor(dpto)66 -3.621e+07  1.374e+07  -2.636 0.008535 ** 
## as.factor(dpto)68 -1.792e+07  1.357e+07  -1.320 0.187059    
## as.factor(dpto)70 -1.119e+08  3.252e+07  -3.442 0.000603 ***
## as.factor(dpto)73 -1.552e+07  1.571e+07  -0.988 0.323517    
## as.factor(dpto)76 -2.201e+07  9.218e+06  -2.388 0.017139 *  
## as.factor(dpto)85  4.331e+07  3.622e+07   1.196 0.232015    
## as.factor(dpto)99 -9.957e+06  2.453e+07  -0.406 0.684902    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 71490000 on 944 degrees of freedom
## Multiple R-squared:  0.9318, Adjusted R-squared:  0.9301 
## F-statistic: 537.5 on 24 and 944 DF,  p-value: < 2.2e-16

En este caso, se logra identificar de manera distintiva los Departamentos que estan siendo parte del análisis y en el que se observa que hay significancia categorica con los siguientes Departamentos:

  • (dpto)11: Bogotá D.C

  • (dpto)23: Cordoba

  • (dpto)41: Huila

  • (dpto)70: Sucre

Cabe resaltar que en estos departamentos es donde mayor nivel de producción hay segun muestra el Grafico No. 3.

De esta manera, la nueva función creada, presenta un incremento en el valor estimado de la venta de gas natural y desaparece la variable EELEC en lo que se podría concluir que el consumo de energia electrica no fue suficiente significativa para explicar en función del incremento de la producción.

El R ajustado de reduje a 0.8488, pero el nivel de significancia sigue siendo alto.

Para el Departamento # 23 (Cordoba), en el Grafico No. 4 refleja la ubicación de sectores economicos con mayor consumo de Gas Natural en función de la Producción Bruta.

4. Distribución Normal para el Modelo No. 2

## 
##  Shapiro-Wilk normality test
## 
## data:  Modelo2$residuals
## W = 0.42823, p-value < 2.2e-16

Dado que el valor estimado de los residuos (p-value < 2.2e-16 ) es menor al 0,05, se rechaza la hipotesis de distribuación normal. Pör lo tanto esta regresión no explica para todos los casos y sectores económicos.

5. Varianza constante para el Modelo No. 3

## 
##  studentized Breusch-Pagan test
## 
## data:  Modelo2
## BP = 20.943, df = 24, p-value = 0.6421

La varianción constante de los residuos es de (p-value = 2.166e-11 ) menor al 0.05, por tanto se rechaza la hipotesis. Por lo que la regresión no es suficiente para el alcance de explicación al comportamiento de todos los sectores económicos.