##Contexto del sector: El departamento del Valle del Cauca en Colombia tiene una presencia significativa en la industria de fabricación y refinación de azúcar. El Valle del Cauca es una región agrícola importante con extensas áreas dedicadas al cultivo de caña de azúcar. Durante el 2010-2015, la producción de caña de azúcar fue una actividad económica fundamental en la región. Siendo de utilidad como materia prima para la elaboración del azúcar. El sector de fabricación y refinación de azúcar tiene una importante contribución a la economía local. Además de generar empleo en la zona, estas actividades impactan positivamente en otros sectores relacionados, como el transporte y la logística.

Industria Azucarera: La región cuenta con varias empresas dedicadas a la fabricación y refinación de azúcar. Estas empresas pueden ser tanto ingenios azucareros grandes como pequeñas plantas dedicadas a la producción de azúcar y sus derivados.

##Resumen

El presente informe de la Encuesta Anual Manufacturera (EAM), de los años 2010 al 2015 se enfoca en la actividad fabricación y refinación de azucar(CIIU3: 1571, CIIU4: 1071) referente a industrias manufactureras, especificamente en el análisis a desarrollar se enfoca en el departamento del Valle Del Cauca.

##Objetivo El objetivo del presente informe es modelar, estructurar y organizar una base de datos panel, y por consiguiente plantear un modelo, y realizar el debido análisis de este, por medio de tres modelos considerados para datos paneles (Pool, Efectos Fijos, Efectos Aleatorios) escogiendo el mejor modelo justificándolo a tráves de las respectivas pruebas.

Construcción del panel

Se cargan las respectivas librerias que se necesitan para la realización del panel

library(haven)
library(reshape)   
library(readr)
library(tidyverse)
## ── Attaching packages ─────────────────────────────────────── tidyverse 1.3.2 ──
## ✔ ggplot2 3.3.5     ✔ dplyr   1.1.2
## ✔ tibble  3.2.1     ✔ stringr 1.4.0
## ✔ tidyr   1.2.0     ✔ forcats 0.5.1
## ✔ purrr   1.0.1     
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ tidyr::expand() masks reshape::expand()
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag()    masks stats::lag()
## ✖ dplyr::rename() masks reshape::rename()
library(dplyr)
library(arsenal)

#Posteriormente se cuándo las bases se encuentren ya importadas y nombradas se procede a convertirlas como un “data frame”, esto con el fin de facilitar la manipulación y análisis de herramientas que trabajan con un “data frame” dentro del mismo software y de la integración con otras estructuras de datos para realizar tipos de análisis más complejos

el código empleado para dicha función es: “EAM_2010 <- as.data.frame(EAM_2010)” el cual se aplica de la misma forma para el resto de años.

## [1] 9945  381
## [1] 9809  381
## [1] 9489  388
## [1] 9471  391
## [1] 9260  388
## [1] 9015  390

#El siguiente paso es el de filtrar cada una de las bases de datos por el CIIU establecido en este caso el número 1571 el cual hace referencia a la actividad económica de Fabricación y refinación de azúcar. El objetivo principal de la Clasificación Internacional Industrial Uniforme (CIIU) es ofrecer una serie de categorías de actividades que se pueden utilizar para recopilar y presentar informes estadísticos basados en dichas actividades

EAM_2010 <- filter(EAM_2010, EAM_2010$ciiu3 == "1571")
dim(EAM_2010)
## [1]  14 381
EAM_2011 <- filter(EAM_2011, EAM_2011$CIIU3 == "1571")
dim(EAM_2011)
## [1]  14 381
EAM_2012 <- filter(EAM_2012, EAM_2012$ciiu4 == "1071")
dim(EAM_2012)
## [1]  14 388
EAM_2013 <- filter(EAM_2013, EAM_2013$ciiu_4 == "1071")
dim(EAM_2013)
## [1]  14 391
EAM_2014 <- filter(EAM_2014, EAM_2014$CIIU4 == "1071")
dim(EAM_2014)
## [1]  14 388
EAM_2015 <- filter(EAM_2015, EAM_2015$ciiu4 == "1071")
dim(EAM_2015)
## [1]  15 390

#Se nombran las variables de la misma manera

colnames(EAM_2010) <- colnames(EAM_2011)
colnames(EAM_2012) <- colnames(EAM_2011)
colnames(EAM_2013) <- colnames(EAM_2011)
colnames(EAM_2014) <- colnames(EAM_2011)
colnames(EAM_2015) <- colnames(EAM_2011)

##escoger variables

EAM_2010<-EAM_2010%>%
  select(1:5,"C3R2C3","C3R35C1","VALORVEN","PORCVT","VALORCX","VALORCOM","VALAGRI")

EAM_2011<-EAM_2011%>%
  select(1:5,"C3R2C3","C3R35C1","VALORVEN","PORCVT","VALORCX","VALORCOM","VALAGRI")

EAM_2012<-EAM_2012%>%
  select(1:5,"C3R2C3","C3R35C1","VALORVEN","PORCVT","VALORCX","VALORCOM","VALAGRI")

EAM_2013<-EAM_2013%>%
  select(1:5,"C3R2C3","C3R35C1","VALORVEN","PORCVT","VALORCX","VALORCOM","VALAGRI")

EAM_2014<-EAM_2014%>%
  select(1:5,"C3R2C3","C3R35C1","VALORVEN","PORCVT","VALORCX","VALORCOM","VALAGRI")

EAM_2015<-EAM_2015%>%
  select(1:5,"C3R2C3","C3R35C1","VALORVEN","PORCVT","VALORCX","VALORCOM","VALAGRI")

##Selección del departamento del Valle del Cauca

EAM_2010 <- filter(EAM_2010, EAM_2010$DPTO == "76") #Ahora tiene 11 obs
dim(EAM_2010)
## [1] 11 12
EAM_2011 <- filter(EAM_2011, EAM_2011$DPTO == "76") #Ahora tiene 11 obs
dim(EAM_2011)
## [1] 11 12
EAM_2012 <- filter(EAM_2012, EAM_2012$DPTO == "76") #Ahora tiene 11 obs
dim(EAM_2012)
## [1] 11 12
EAM_2013 <- filter(EAM_2013, EAM_2013$DPTO == "76") #Ahora tiene 11 obs
dim(EAM_2013)
## [1] 11 12
EAM_2014 <- filter(EAM_2014, EAM_2014$DPTO == "76") #Ahora tiene 11 obs
dim(EAM_2014)
## [1] 11 12
EAM_2015 <- filter(EAM_2015, EAM_2015$DPTO == "76") #Ahora tiene 12 obs
dim(EAM_2015)
## [1] 12 12

##En este punto de la actividad después de filtrar las bases datos por la actividad económica para cada uno de los años, es posible que dicha actividad económica cuente con diversas empresas identificadas en la variable “nordemp”, la cual por obvias razones pueden contar con varios tipos de establecimientos por cada empresa, dicho número de establecimientos se ven reflejados en la variable llamada “nordest” y es conveniente a la hora de integrar las bases de datos que dichas unidades empresariales se denoten de manera singular en cada una de las bases de datos, por ende, el siguiente paso es crear una variable nueva llamada “id” la cual se encargara de agrupar los nombres de la empresas con el de los establecimientos, el código para dicha acción es el siguiente:

El siguiente paso a seguir es el de realizar una revisión de incorporación del mismo número de unidades empresariales para cada uno de los 5 años, en pocas palabras, identificar los valores “id” que se encuentran en la base EAM_2010 y no en la base EAM_2011 y viceversa, dicha acción se realiza con el siguiente comando.

EAM_2010$id <- paste(EAM_2010$nordemp, EAM_2010$nordest, sep = "")
names(EAM_2010)
##  [1] "nordemp"  "nordest"  "DPTO"     "CIIU3"    "PERIODO"  "C3R2C3"  
##  [7] "C3R35C1"  "VALORVEN" "PORCVT"   "VALORCX"  "VALORCOM" "VALAGRI" 
## [13] "id"
EAM_2011$id <- paste(EAM_2011$nordemp, EAM_2011$nordest, sep = "")
names(EAM_2011)
##  [1] "nordemp"  "nordest"  "DPTO"     "CIIU3"    "PERIODO"  "C3R2C3"  
##  [7] "C3R35C1"  "VALORVEN" "PORCVT"   "VALORCX"  "VALORCOM" "VALAGRI" 
## [13] "id"
EAM_2012$id <- paste(EAM_2012$nordemp, EAM_2012$nordest, sep = "")
names(EAM_2012)
##  [1] "nordemp"  "nordest"  "DPTO"     "CIIU3"    "PERIODO"  "C3R2C3"  
##  [7] "C3R35C1"  "VALORVEN" "PORCVT"   "VALORCX"  "VALORCOM" "VALAGRI" 
## [13] "id"
EAM_2013$id <- paste(EAM_2013$nordemp, EAM_2013$nordest, sep = "")
names(EAM_2013)
##  [1] "nordemp"  "nordest"  "DPTO"     "CIIU3"    "PERIODO"  "C3R2C3"  
##  [7] "C3R35C1"  "VALORVEN" "PORCVT"   "VALORCX"  "VALORCOM" "VALAGRI" 
## [13] "id"
EAM_2014$id <- paste(EAM_2014$nordemp, EAM_2014$nordest, sep = "")
names(EAM_2014)
##  [1] "nordemp"  "nordest"  "DPTO"     "CIIU3"    "PERIODO"  "C3R2C3"  
##  [7] "C3R35C1"  "VALORVEN" "PORCVT"   "VALORCX"  "VALORCOM" "VALAGRI" 
## [13] "id"
EAM_2015$id <- paste(EAM_2015$nordemp, EAM_2015$nordest, sep = "")
names(EAM_2015)
##  [1] "nordemp"  "nordest"  "DPTO"     "CIIU3"    "PERIODO"  "C3R2C3"  
##  [7] "C3R35C1"  "VALORVEN" "PORCVT"   "VALORCX"  "VALORCOM" "VALAGRI" 
## [13] "id"

#miramos que variables hacen falta en cada año y viceversa para luego filtrarlas Se hace la revision de a dos bases para los 6 años, se inicia pegando el 2010 con el 2015

EAM_2010$id[EAM_2010$id %in% EAM_2011$id ==FALSE]
## character(0)
EAM_2011$id[EAM_2011$id %in% EAM_2010$id ==FALSE]
## character(0)

#se crea una base con el mismo numero de observaciones En este caso la base tiene el mimso numero de variables y de observaciones, es decir, ambas bases cuentan con la misma cantidad de empresas y son exactamente las mismas segun su id, por lo que se combinan ambas bases.

EAM_1<-rbind(EAM_2010,EAM_2011)

#Se hace el mismo procedimiento para cada año juntando las bases con el año siguiente y filtrando en caso de ser necesario

EAM_2012$id[EAM_2012$id %in% EAM_1$id ==FALSE]
## character(0)
EAM_1$id[EAM_1$id %in% EAM_2012$id ==FALSE]
## character(0)
EAM_2<-rbind(EAM_1,EAM_2012)

EAM_2013$id[EAM_2013$id %in% EAM_2$id ==FALSE]
## character(0)
EAM_2$id[EAM_2$id %in% EAM_2013$id ==FALSE]
## character(0)
EAM_3<-rbind(EAM_2,EAM_2013)

EAM_2014$id[EAM_2014$id %in% EAM_3$id ==FALSE]
## character(0)
EAM_3$id[EAM_3$id %in% EAM_2014$id ==FALSE]
## character(0)
EAM_4<-rbind(EAM_3,EAM_2014)

EAM_2015$id[EAM_2015$id %in% EAM_4$id ==FALSE]
## [1] "141806141064"
EAM_4$id[EAM_4$id %in% EAM_2015$id ==FALSE]
## character(0)

Para el año 2015, existe una empresa, se procede a filtrar luego de filtrar las bases se debe identificar que las bases cumplan con dicha condición de igualdad de observaciones. Y se procede a pegar las bases

EAM_2015 <- filter(EAM_2015, EAM_2015$id != "141806141064")

EAM_final<-rbind(EAM_4,EAM_2015)

Se comprueba que cada valor de la variable (id) se repite seis veces.

base_veces <- EAM_final %>% count(id, name = "repeated", sort = TRUE)
base_veces <- subset(base_veces, repeated==6)
Datos_final <-filter(EAM_final, id %in% base_veces$id,)
Datos_final<-EAM_final %>%
  arrange(id)
dim(Datos_final)
## [1] 66 13

##Variables escogidas para efectuar los modelos

#VALORVEN = valor ventas
#C3R2C3 = total sueldos y salarios del personal permanente 
#C3R35C1 = costo y gasto de producción total
#PORCVT= porcentaje vendido al exterior 
#VALORCX = valor compras de materia prima en el exterior 
#VALORCOM = valor materia prima comprada 
#VALAGRI = valor agregado

#Datos Panel

Despues de la correcta limpieza con el fin de poder hacer un estudio con un panel balanceado, es decir, cada empresa tiene el mismo numero de observaciones. Ademas se puede decir que este es un panel corto dado que el numero de empresas, N, es mayor que el numero de periodos, T.

Instalo las librerias necesarias y se declara como paneles la base.

### Instalar librerias necesarias
installed.packages("plm")
##      Package LibPath Version Priority Depends Imports LinkingTo Suggests
##      Enhances License License_is_FOSS License_restricts_use OS_type Archs
##      MD5sum NeedsCompilation Built
library(plm)
## 
## Attaching package: 'plm'
## The following objects are masked from 'package:dplyr':
## 
##     between, lag, lead
installed.packages("haven")
##      Package LibPath Version Priority Depends Imports LinkingTo Suggests
##      Enhances License License_is_FOSS License_restricts_use OS_type Archs
##      MD5sum NeedsCompilation Built
library(haven)

#Declarar dato panel
datos_panel <- pdata.frame(EAM_final, index = c("id", "PERIODO"))
attach(datos_panel)

##Modelo de coeficientes constantes

Se estima un modelo de coeficientes constantes, el cual indica como los coeficientes de regresion son iguales para todas las empresas. Es decir, una empresa es tan buena como otra. VALORVEN es la variable dependiente y VALAGRI, VALORCOM, VALORCX, PORCVT, C3R35C1, C3R2C3, son las variables explicatorias, las cuales se asumen no aleatorias en muestreos repetidos y, de serlo, son exógenas estrictamente, es decir, no estan correlacionadas con los errores contemporaneos, pasados y futuros. Finalmente se asume que los errores son independientes e identicamente distribuidos con media 0 y varianza constante.

#Modelo econometrico####
##modelo pool
Modelo_Pool <- plm(VALORVEN~ VALAGRI + VALORCOM + VALORCX + PORCVT + C3R35C1 + C3R2C3, 
                   data = datos_panel, model= "pooling")
summary(Modelo_Pool)
## Pooling Model
## 
## Call:
## plm(formula = VALORVEN ~ VALAGRI + VALORCOM + VALORCX + PORCVT + 
##     C3R35C1 + C3R2C3, data = datos_panel, model = "pooling")
## 
## Balanced Panel: n = 11, T = 6, N = 66
## 
## Residuals:
##      Min.   1st Qu.    Median      Mean   3rd Qu.      Max. 
## -1.14e+08 -1.87e+07  1.72e+06  0.00e+00  1.50e+07  1.19e+08 
## 
## Coefficients:
##                Estimate  Std. Error t-value  Pr(>|t|)    
## (Intercept)  8.4034e+06  6.9979e+06  1.2009    0.2346    
## VALAGRI      4.5359e-01  4.9284e-02  9.2036 5.239e-13 ***
## VALORCOM     1.8441e+00  1.8332e-01 10.0593 2.059e-14 ***
## VALORCX     -2.2906e-02  1.7484e-02 -1.3101    0.1952    
## PORCVT       3.1965e-01  2.7261e-01  1.1726    0.2457    
## C3R35C1      6.9757e-01  5.3097e-01  1.3138    0.1940    
## C3R2C3      -5.9421e+00  1.2328e+00 -4.8199 1.045e-05 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Total Sum of Squares:    1.5298e+18
## Residual Sum of Squares: 5.6075e+16
## R-Squared:      0.96334
## Adj. R-Squared: 0.95962
## F-statistic: 258.426 on 6 and 59 DF, p-value: < 2.22e-16

#Modelo de efectos fijos

La estimacion por MCO de coeficientes constantes asume que los impactos que tienen las variables explicatorias son medidos a traves de las pendientes, ası como el intercepto, son comunes a todas las unidades, como ya fue dicho anteriormente, se considera que no existe heterogeneidad entre las unidades; de existir heterogeneidad medida por una variable no observable, esta se estarıa omitiendo e irıa a parar al error, lo cual generarıa que los estimadores MCO fuesen sesgados e inconsistentes, lo que significa que los valores esperados de los estimadores no seran iguales a los parametros poblacionales, y, aunque el tamaño de muestra crezca, los estimadores no van a tender a los parametros poblacionales

Por lo cual se establece un modelo de efectos fijos

##Modelo de efectos fijos 

Modelo_EF <- plm(VALORVEN~ VALAGRI + VALORCOM + VALORCX + PORCVT + C3R35C1 + C3R2C3, 
                 data = datos_panel, model= "within")
summary(Modelo_EF)
## Oneway (individual) effect Within Model
## 
## Call:
## plm(formula = VALORVEN ~ VALAGRI + VALORCOM + VALORCX + PORCVT + 
##     C3R35C1 + C3R2C3, data = datos_panel, model = "within")
## 
## Balanced Panel: n = 11, T = 6, N = 66
## 
## Residuals:
##      Min.   1st Qu.    Median      Mean   3rd Qu.      Max. 
## -1.14e+08 -7.77e+06  1.02e+06  0.00e+00  1.04e+07  1.02e+08 
## 
## Coefficients:
##           Estimate Std. Error t-value  Pr(>|t|)    
## VALAGRI   0.444666   0.064310  6.9144 9.001e-09 ***
## VALORCOM  1.737355   0.210388  8.2579 7.728e-11 ***
## VALORCX  -0.031442   0.026023 -1.2082  0.232755    
## PORCVT    0.443047   0.314110  1.4105  0.164713    
## C3R35C1   0.323680   0.627451  0.5159  0.608269    
## C3R2C3   -6.688551   1.938652 -3.4501  0.001162 ** 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Total Sum of Squares:    1.1895e+18
## Residual Sum of Squares: 4.9852e+16
## R-Squared:      0.95809
## Adj. R-Squared: 0.9444
## F-statistic: 186.692 on 6 and 49 DF, p-value: < 2.22e-16

##Se define con cual de los dos modelos se queda por medio de las hipótesis

Para decidir entre el modelo pool y efectos fijos se realiza un prueba que tienen hipotesis H0 : α2 = α3 = α4 = α5 = . . . = α39 = 0 (se prefiere el modelo Pool) H1 : Al menos un αi /= 0 (Se prefieren los efectos fijos)

pooltest(Modelo_Pool, Modelo_EF)
## 
##  F statistic
## 
## data:  VALORVEN ~ VALAGRI + VALORCOM + VALORCX + PORCVT + C3R35C1 +  ...
## F = 0.61165, df1 = 10, df2 = 49, p-value = 0.7964
## alternative hypothesis: unstability
##Se queda con el modelo pool

Esta es una prueba F de minimos cuadrados restringidos, si se rechaza la hipotesis nula, entonces el modelo adecuado es el de efectos fijos

Es importante aclarar que el modelo de efectos fijos considerado es unidireccional, porque se esta asumiendo que existe un solo efecto diferencial y que este es atribuible a las unidades o empresas; no obstante, podrıa tambien existir un efecto atribuible al tiempo y, en este caso, el modelo de efectos fijos ser´ıa bidireccional

Se concluye que el modelo adecuado es el de efectos fijos por existir al menos un efecto diferencial distinto de 0. Ahora po otro lado se hara un analisis de metodos de efectos aleatorios en comparacion con el de efectos fijos para analizar cual es el mas adecuado.

#Modelo de efectos aleatorios

El modelo de efectos aleatorios es una de las formas de abordar la heterogeneidad no observada entre las unidades individuales en el análisis. En este tipo de modelo, se asume que los efectos individuales son aleatorios y se distribuyen normalmente. A diferencia del modelo de efectos fijos, el modelo de efectos aleatorios no asume que los efectos son constantes para cada unidad individual. La variabilidad en los efectos aleatorios permite capturar la heterogeneidad no observada entre las unidades individuales. Los efectos aleatorios se asumen no correlacionados con las variables explicativas y el error .

Modelo_EA <- plm(VALORVEN~ VALAGRI + VALORCOM + VALORCX + PORCVT + C3R35C1 + C3R2C3, 
                 data = datos_panel,model="random")
summary(Modelo_EA)
## Oneway (individual) effect Random Effect Model 
##    (Swamy-Arora's transformation)
## 
## Call:
## plm(formula = VALORVEN ~ VALAGRI + VALORCOM + VALORCX + PORCVT + 
##     C3R35C1 + C3R2C3, data = datos_panel, model = "random")
## 
## Balanced Panel: n = 11, T = 6, N = 66
## 
## Effects:
##                     var   std.dev share
## idiosyncratic 1.017e+15 3.190e+07     1
## individual    0.000e+00 0.000e+00     0
## theta: 0
## 
## Residuals:
##      Min.   1st Qu.    Median      Mean   3rd Qu.      Max. 
## -1.14e+08 -1.87e+07  1.72e+06  0.00e+00  1.50e+07  1.19e+08 
## 
## Coefficients:
##                Estimate  Std. Error z-value  Pr(>|z|)    
## (Intercept)  8.4034e+06  6.9979e+06  1.2009    0.2298    
## VALAGRI      4.5359e-01  4.9284e-02  9.2036 < 2.2e-16 ***
## VALORCOM     1.8441e+00  1.8332e-01 10.0593 < 2.2e-16 ***
## VALORCX     -2.2906e-02  1.7484e-02 -1.3101    0.1902    
## PORCVT       3.1965e-01  2.7261e-01  1.1726    0.2410    
## C3R35C1      6.9757e-01  5.3097e-01  1.3138    0.1889    
## C3R2C3      -5.9421e+00  1.2328e+00 -4.8199 1.436e-06 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Total Sum of Squares:    1.5298e+18
## Residual Sum of Squares: 5.6075e+16
## R-Squared:      0.96334
## Adj. R-Squared: 0.95962
## Chisq: 1550.56 on 6 DF, p-value: < 2.22e-16

Al comparar el modelo de panel agrupado con coeficientes constantes y el de efectos aleatorios, se observa que su estructura es similar, y si la varianza del error espec ́ıfico es igual a 0, no existir ́ıa diferencia entre ambos modelos y, por tanto, nos quedar ́ıamos con el modelo pool. Para tomar la decisio ́n sobre qu ́e modelo utilizar, se realiza la prueba de multiplicador de Lagrange de Breusch-Pagan para efectos aleatorios. Si la hip ́otesis no se rechaza, el modelo de coeficientes constantes es el adecuado; en caso contrario, se elige el modelo de efectos aleatorios, el cual sera ́ contrastado con el de efectos fijos para seleccionar el adecuado. La prueba de Breusch-Pagan se realiza a trav ́es de la siguiente línea de comando:

plmtest (Modelo_EA, type = "bp")
## 
##  Lagrange Multiplier Test - (Breusch-Pagan)
## 
## data:  VALORVEN ~ VALAGRI + VALORCOM + VALORCX + PORCVT + C3R35C1 +  ...
## chisq = 1.6417, df = 1, p-value = 0.2001
## alternative hypothesis: significant effects
#la hipótesis nula no se rechaza por ende se prefiere el modelo de coeficientes constantes (pool)

#Prueba de Haussman Para realizar la prueba de Hausman en R, se necesita ajustar dos modelos, uno con efectos aleatorios y otro con efectos fijos, y luego compararlos para determinar cuál es más apropiado.

La prueba de Hausman compara la eficiencia relativa de los estimadores de efectos fijos y efectos aleatorios. Si el valor p de la prueba de Hausman es menor que 0.05, se rechaza la hipótesis nula, sugiriendo que los efectos fijos son más apropiados. Si el valor p es mayor, no hay evidencia para rechazar la hipótesis nula, indicando que los efectos aleatorios son preferibles.

phtest(Modelo_EF, Modelo_EA)
## 
##  Hausman Test
## 
## data:  VALORVEN ~ VALAGRI + VALORCOM + VALORCX + PORCVT + C3R35C1 +  ...
## chisq = 2.6818, df = 6, p-value = 0.8476
## alternative hypothesis: one model is inconsistent
#En este caso no hay suficiente evidencia para rechazar la hipótesis nula, sugiriendo que los efectos aleatorios son preferibles. No obstante, al haber comparado efectos aleatorios con pool se prefirió el pool.  

#Resultados del mejor modelo seleccionado

#MODELO POOL
summary(Modelo_Pool)
## Pooling Model
## 
## Call:
## plm(formula = VALORVEN ~ VALAGRI + VALORCOM + VALORCX + PORCVT + 
##     C3R35C1 + C3R2C3, data = datos_panel, model = "pooling")
## 
## Balanced Panel: n = 11, T = 6, N = 66
## 
## Residuals:
##      Min.   1st Qu.    Median      Mean   3rd Qu.      Max. 
## -1.14e+08 -1.87e+07  1.72e+06  0.00e+00  1.50e+07  1.19e+08 
## 
## Coefficients:
##                Estimate  Std. Error t-value  Pr(>|t|)    
## (Intercept)  8.4034e+06  6.9979e+06  1.2009    0.2346    
## VALAGRI      4.5359e-01  4.9284e-02  9.2036 5.239e-13 ***
## VALORCOM     1.8441e+00  1.8332e-01 10.0593 2.059e-14 ***
## VALORCX     -2.2906e-02  1.7484e-02 -1.3101    0.1952    
## PORCVT       3.1965e-01  2.7261e-01  1.1726    0.2457    
## C3R35C1      6.9757e-01  5.3097e-01  1.3138    0.1940    
## C3R2C3      -5.9421e+00  1.2328e+00 -4.8199 1.045e-05 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Total Sum of Squares:    1.5298e+18
## Residual Sum of Squares: 5.6075e+16
## R-Squared:      0.96334
## Adj. R-Squared: 0.95962
## F-statistic: 258.426 on 6 and 59 DF, p-value: < 2.22e-16

-Muestra información sobre la estructura del panel. En este caso, hay 11 unidades individuales, 6 períodos de tiempo y un total de 66 observaciones. Indica que el panel está equilibrado.

-VALAGRI (Valor agregado) Interpretación: Un aumento de una unidad en valor agregado se asocia, en promedio, con un aumento de 0.45359 unidades en la variable VALORVEN (valor de las ventas), manteniendo constantes las demás variables.

-VALORCOM (Valor materia prima comprada) Interpretación: Un aumento de una unidad en Valor materia prima comprada se asocia, en promedio, con un aumento de 1.8441 unidades en las ventas totales, manteniendo constantes las demás variables.

-VALORCX (valor compras de materia prima en el exterior) Interpretación: Un aumento de una unidad en valor compras de materia prima en el exterior se asocia, en promedio, con una disminución de 0.022906 unidades en las ventas totales, manteniendo constantes las demás variables. Sin embargo, el coeficiente no es estadísticamente significativo

-PORCVT (porcentaje vendido al exterior) Interpretación: Un aumento de una unidad en porcentaje vendido al exterior se asocia, en promedio, con un aumento de 0.31965 unidades en las ventas totales, manteniendo constantes las demás variables. Sin embargo, el coeficiente no es estadísticamente significativo (p-value > 0.05).

-C3R35C1 (costo y gasto de producción total) Interpretación: Un aumento de una unidad en costo y gasto de producción total se asocia, en promedio, con un aumento de 0.69757 unidades en las ventas totales, manteniendo constantes las demás variables. Sin embargo, el coeficiente no es estadísticamente significativo (p-value > 0.05).

-C3R2C3 (total sueldos y salarios del personal permanente) Interpretación: Un aumento de una unidad en total sueldos y salarios del personal permanente se asocia, en promedio, con una disminución de 5.9421 unidades en la variable de ventas, manteniendo constantes las demás variables. Este coeficiente es estadísticamente significativo.

Referencias

Dane (2020). Encuesta Anual Manufacturera – EAM - 2010 A 2015. Recuperado de https://microdatos.dane.gov.co/index.php/catalog/494#metadata-metadata_production