La industria manufacturera se define como la transformación mecánica o química de sustancias orgánicas e inorgánicas en productos nuevos, elaborados bien sea a mano o con maquinaria. En este contexto, la Encuesta Anual Manufacturera (EAM) busca obtener información básica del sector industrial para conocer su estructura, características y evolución.
El presente análisis se basa en los datos de la Encuesta Anual Manufacturera EAM 2023, elaborada por el Departamento Administrativo Nacional de Estadística (DANE), que recopila información sobre el comportamiento, desempeño y composición del sector industrial en Colombia. Esta encuesta permite conocer variables como las ventas, la producción, el empleo, el consumo de materias primas, la energía y el valor agregado.
Este estudio tiene como objetivo principal analizar, a partir de una muestra de establecimientos industriales colombianos, cuáles de los indicadores seleccionados generan un mayor impacto en el valor de ventas al exterior y cómo se relacionan entre sí. Para ello, se utiliza un modelo de regresión lineal múltiple, así como herramientas estadísticas descriptivas para examinar las relaciones entre las distintas variables del sector manufacturero.
El análisis de regresión lineal múltiple se aplicó para estudiar los factores que inciden en el valor de ventas al exterior (PORCVT) de la muestra de establecimientos industriales colombianos, con el fin de identificar las variables más relevantes.
Los datos fueron extraídos de la Encuesta Anual Manufacturera (EAM) 2023, elaborada por el DANE, y se seleccionaron las columnas correspondientes a las variables de interés:
Cuantitativos:
Categóricos:
Para garantizar la consistencia del análisis, se eliminaron los registros con PORCVT igual a cero y se convirtieron todas las variables a tipo numérico.
La ecuación general del modelo es:
PORCVT= β0 +β1 (EELEC) + β2(PRODBR2) + β3 (VALAGRI) + β4(PERTOTAL) + β5(dpto) + ε
Donde:
Para la validación del modelo se hizo la evaluación de los siguientes supuestos:
Adicionalmente, se implementaron diversas herramientas visuales y analíticas para examinar las relación entre el valor de ventas al exterior y las variables, incluyendo gráficos de caja (boxplot) para identificar distribuciones, matrices de correlación para cuantificar las asociaciones lineales, visualizaciones geográficas y tablas resumen.
Inicialmente, se filtró la base de datos según la variable cualitativa “dpto”, que representa el departamento de ubicación del establecimiento manufacturero. Se seleccionaron cuatro territorios: 5 - Antioquia, 11 - Bogotá, 25 - Cundinamarca y 76 - Valle del Cauca, los cuales aportan aproximadamente el 74.5% de los datos totales. De esta manera, se obtuvo una muestra inicial de 5.063 establecimientos industriales. Sin embargo, al definir la variable dependiente, se decidió eliminar los registros con valores iguales a cero, ya que afectaban el análisis, obteniéndose finalmente una base de datos con 1.638 establecimientos industriales con información completa.
Las variables incluidas en este conjunto de datos se resumen en la siguiente tabla:
En esta sección se presentan las principales características de las variables cuantitativas en términos de sus medidas de tendencia central y la descripción de su comportamiento general. Cada una cuenta con su respectivo diagrama de cajas, el cual permite identificar cómo se distribuyen estas variables, visualizando su valor central, los cuartiles y la presencia de posibles valores atípicos.
Dado que algunas variables presentan valores extremadamente altos en comparación con otras observaciones, como es habitual en datos económicos y de producción, los gráficos se representaron en escala logarítmica (base 10). Este ajuste no modifica las relaciones estadísticas entre las variables, pero permite visualizar con mayor claridad la dispersión y estructura central de los datos, evitando que los valores muy grandes afecten la claridad del gráfico.
Estos gráficos facilitan así una comprensión más precisa de la dispersión y las diferencias entre los establecimientos industriales analizados.
Esta variable refleja el grado de internacionalización y competitividad de las empresas manufactureras. Representa el valor de los bienes vendidos fuera del país, y es un indicador clave del desempeño económico de la empresa y su nivel de participación en mercados internacionales. Su análisis permite evaluar la capacidad exportadora y la inserción de la industria en el comercio global.
En el gráfico se observa una alta dispersión en los valores de ventas externas, lo que indica que existen diferencias significativas entre establecimientos industriales. Algunos pocos registran montos de exportación muy elevados, mientras que la mayoría presenta valores moderados o bajos.
Para mejorar la visualización, el diagrama se presentó en escala logarítmica (base 10), debido a las amplias diferencias de magnitud entre empresas.
En conjunto, los resultados muestran que la actividad exportadora se concentra en menor medida en establecimientos con gran capacidad productiva y acceso a mercados internacionales, mientras que la mayoría participa de forma limitada en las ventas externas.
Mide la cantidad total de energía eléctrica utilizada por los establecimientos manufactureras en sus procesos productivos durante el año. Representa el grado de actividad industrial, así como la intensidad del uso de maquinaria y equipos eléctricos, constituyéndose en un indicador clave para evaluar la eficacia de la producción y la capacidad operativa del sector.
En el gráfico se observa una alta variabilidad en los niveles de consumo de energía, lo que evidencia diferencias significativas entre los establecimientos industriales. Mientras una minoría de empresas presenta consumos muy elevados, la mayoría muestra niveles moderados o bajos, asociados a una menor escala de producción o a procesos menos intensivos en energía.
En conjunto, la distribución muestra una asimetría positiva, lo que sugiere que el consumo energético se concentra en un grupo reducido de grandes establecimientos manufactureros, cuya alta capacidad productiva y nivel de automatización incrementan significativamente la demanda de energía eléctrica dentro del sector.
Hace referencia al valor total de los bienes producidos por el establecimiento en el año de referencia. Es un indicador clave del tamaño económico y del nivel de productividad de las empresas manufactureras, y permite examinar la relación entre el volumen de producción y el desempeño exportador del sector.
El gráfico muestra una distribución asimétrica, donde la mayoría de los establecimientos tiene valores medios de producción, mientras que un grupo reducido alcanza niveles considerablemente más altos. Los valores atípicos superiores indican la presencia de grandes industrias con una capacidad productiva y tecnológica más avanzada, mientras que los valores inferiores podrían corresponder a establecimientos de menor escala o eficiencia productiva. En general, esto sugiere una alta heterogeneidad en la estructura productiva del sector manufacturero colombiano, con fuerte concentración en un pequeño grupo de empresas de gran tamaño.
La variable de valor agregado se refiere a la riqueza generada por una empresa durante su proceso productivo. Este indicador refleja la contribución directa de la empresa a la economía nacional y permite evaluar su eficiencia en la transformación de insumos en productos finales.
Su análisis resulta clave para determinar si las empresas que generan un mayor valor agregado también tienden a tener un mejor desempeño exportador.
En el gráfico se observa que, aunque la mayoría de los establecimientos industriales presentan niveles moderados de valor agregado, un grupo reducido alcanza valores significativamente más altos. Esto sugiere que no todos los establecimientos logran transformar sus insumos con la misma eficiencia o valor económico, evidenciando desigualdades en la productividad dentro del sector manufacturero.
Mide el número total de personas vinculadas al establecimiento, incluyendo personal permanente, temporal directo, propietarios y trabajadores contratados a través de otras empresas. Representa el tamaño laboral de la unidad productiva y permite caracterizar su capacidad operativa y nivel de empleo generado.
El gráfico muestra una alta concentración de valores en la parte baja del rango, con una mediana de 111 empleados y un primer cuartil de 46, lo que indica que la mitad de los establecimientos manufactureros emplean menos de 112 personas. Sin embargo, existen valores atípicos significativos, alcanzando hasta 2.017 empleados, correspondientes a grandes empresas industriales.
La asimetría positiva evidencia que el sector manufacturero colombiano está compuesto principalmente por pequeñas y medianas empresas, mientras que una proporción mucho menor concentra la mayor parte del empleo. Esta dispersión también sugiere una estructura productiva desigual, donde las grandes industrias tienen un impacto considerable en la generación total de empleo formal dentro del sector.
Con el fin de resumir los valores representados anteriormente se presentan las principales medidas de tendencia central para las variables cuantitativas analizadas: media, mediana, moda y percentiles.
La variable “dpto” identifica el departamento donde se encuentra ubicado cada establecimiento manufacturero. Para el análisis se seleccionaron cuatro territorios con alta relevancia industrial en el país: Antioquia, Bogotá D.C., Cundinamarca y Valle del Cauca.
El siguiente conjunto de gráficos de dispersión muestra la relación entre el valor de las ventas al exterior (PORCVT) y las variables electas asociadas a la actividad manufacturera: consumo de energía eléctrica (EELEC), personal total ocupado (PERTOTAL), producción bruta (PRODBR2) y valor agregado (VALAGRI).
En general, se observa una tendencia positiva entre estas variables y el valor de las ventas al exterior, lo que indica que los establecimientos industriales con mayores niveles de producción, valor agregado, consumo energético y personal ocupado tienden a alcanzar mayores valores de exportación.
La concentración de puntos en la parte inicial de los ejes refleja que la mayoría de los establecimientos industriales presentan niveles bajos tanto en las variables electas como en ventas externas, lo que evidencia una estructura productiva desigual dominada por pequeñas y medianas empresas con limitada capacidad exportadora.
Las variables de producción bruta y valor agregado muestran la correlación más clara con las ventas al exterior, lo que sugiere que el incremento en la capacidad productiva y en la generación de valor se traduce directamente en un mejor desempeño exportador. Por su parte, el consumo de energía eléctrica y el personal ocupado presentan una relación positiva más dispersa, indicando que un mayor tamaño o un uso intensivo de energía no garantizan por sí solos un aumento en las exportaciones, sino que este depende también de la eficiencia productiva y la orientación comercial de cada establecimiento.
Esto indica que el tamaño y la capacidad productiva de las industrias influyen en el valor de sus exportaciones y en su participación dentro del mercado internacional.
Se presenta la matriz de correlación entre las variables seleccionadas.
Como se puede observar todas las correlaciones son positivas, lo que indica que el valor de las exportaciones tiende a aumentar a medida que se incrementan los niveles de producción, valor agregado, consumo de energía y personal ocupado. Se destaca la fuerte relación entre el valor agregado y la producción bruta (0.93), evidenciando que ambas variables están estrechamente vinculadas en el proceso productivo de forma que a mayor volúmen de producción, mayor es el valor económico generado.
Las correlaciones entre las demás variables también resultan moderadamente altas (entre 0.44 y 0.68), lo que sugiere una coherencia dentro del sector manufacturero, puesto que indicarían que los establecimientos más productivos y con mayor uso de energía o empleo tienden a registrar un mejor desempeño exportador.
El intercepto del modelo es β₀ = 7.059e+06, el cual representa el valor estimado de las ventas al exterior cuando todas las variables independientes toman el valor de cero. Sin embargo, es importante aclarar que al tratarse de variables económicas y productivas (energía, producción, valor agregado, personal ocupado y departamento), este valor no tiene una interpretación práctica, ya que en la realidad no existen establecimientos industriales con todos estos valores nulos.
El R² ajustado del modelo es 0.429, lo que significa que aproximadamente el 42.9% de la variabilidad en el valor de las ventas al exterior es explicada por las variables independientes incluidas en el modelo. Aunque este nivel de ajuste se considera moderado, resulta adecuado en el contexto de datos económicos con alta dispersión y heterogeneidad entre empresas.
Esto indica que el modelo logra capturar una proporción importante de los factores que influyen en las exportaciones manufactureras, aunque posiblemente existan otros elementos que podrían explicar el resto de la variabilidad no contemplada en el análisis.
Los resultados indican que el modelo es estadísticamente significativo y que varias de las variables explicativas muestran coeficientes positivos con una alta significancia sobre el valor de las ventas al exterior. En particular, el consumo de energía eléctrica, la producción bruta y el personal total ocupado muestran coeficientes positivos y altamente significativos (p < 0.001), lo que sugiere que los establecimientos con mayor producción, consumo energético y empleo tienden a tener un desempeño exportador superior.
Por otro lado, el valor agregado tiene un coeficiente negativo y significativo (p < 0.05) , lo cual podría indicar que un mayor valor agregado no necesariamente traduce en un aumento en las exportaciones. Además, la variable departamento también resulta significativa, lo que evidencia diferencias regionales en el comportamiento exportador, reflejando que algunos territorios industriales tienen una inserción mayor en los mercados internacionales.
Tras la estimación del modelo, se aplicaron las pruebas de Shapiro-Wilk, Breusch-Pagan y VIF (Variance Inflation Factor), cuyos resultados se consolidaron en tablas para facilitar su visualización e interpretación.
El valor p es menor a 0.05, por lo tanto, se rechaza la hipótesis nula de normalidad. Esto indica que los valores residuales del modelo no siguen una distribución normal. Esta situación puede afectar ligeramente la validez de las inferencias estadísticas del modelo, sin embargo, el tamaño de la muestra y la consistencia de los coeficientes permiten mantener la confiabilidad general del análisis.
El valor p de la prueba es menor que 0.05, lo que indica que no se cumple el supuesto de homocedasticidad. Esto indica que los errores del modelo presentan una variabilidad no constante, lo cual puede influir en la precisión de las pruebas de significancia de los coeficientes estimados.
Los valores del GVIF ajustado están dentro de límites aceptables, todos por debajo de 5, lo que indica que no existe un problema significativo de multicolinealidad entre las variables independientes del modelo. Aunque las variables producción bruta y valor agregado presentan una relación más estrecha, sus valores no superan el 2.5, por lo que no representan un riesgo para la interpretación de los coeficientes. Todo esto sugiere que las variables son suficientemente independientes entre sí y que el modelo es consistente y confiable.
Puesto que los residuos no siguen una distribución normal y los datos no presentan homocedasticidad, no se cumplen todos los requerimientos necesarios para realizar inferencia estadística con total validez. Por ende, los resultados obtenidos permiten establecer asociaciones entre las variables, pero no inferencias generalizables al conjunto de establecimientos manufactureros a nivel nacional o regional.
Sin embargo, la baja evidencia de multicolinealidad y la consistencia de los coeficientes conservan un poco la coherencia del modelo, permitiendo un análisis descriptivo confiable sobre la relación entre el valor de las ventas al exterior y los principales factores analizados. Es importante recalcar que estos resultados derivan exclusivamente de la muestra de 1.638 establecimientos industriales seleccionados de la base de datos de la EAM 2023.
Con base en el análisis de las variables, se formuló la siguiente hipótesis general:
H₀: Las variables independientes seleccionadas (consumo de energía eléctrica, producción bruta, valor agregado, personal ocupado y departamento) no influyen significativamente en el valor de las ventas al exterior de los establecimientos industriales colombianos.
H₁: Al menos una de las variables independientes seleccionadas influye de manera significativa en el valor de las ventas al exterior de los establecimientos industriales colombianos.
Se rechaza la hipótesis nula (H₀), dado que el modelo en general es estadísticamente significativo y al menos una de las variables explica una parte significativa en la variabilidad en las ventas al exterior (R² ajustado = 0.429).
H₁₁: Un mayor consumo de energía eléctrica (EELEC) se asocia con un aumento en el valor de las ventas al exterior.
H₁₂: Un mayor valor de la producción bruta (PRODBR2) incrementa el valor de las ventas al exterior.
H₁₃: Un mayor número de personas ocupadas (PERTOTAL) se relaciona con mayores ventas al exterior.
Estas tres variables presentan coeficientes positivos y signficativos (p > 0.001), por lo que se confirman las hipótesis anteriores.
Esta variable muestra un coeficiente negativo y significativo (p < 0.05), por lo cual no se cumple la hipótesis anterior, sugiriendo que un myaor valor agregado no necesariamente implica un aumento en las exportaciones.
La variable dpto es significativa, por lo que se acepta esta hipótesis indicando diferencias debido a características relacionadas con la ubicación/región en el comportamiento exportador.
A pesar de las limitaciones que se presentan en el análisis debido a la muestra utilizada, es posible interpretar los resultados del modelo considerándolos en la realidad del sector manufacturero. Los datos numéricos estudiados en todo el documento se pueden traducir en hallazgos que explican pequeños indicadores que inciden en la dinámica de exportación.
Como destacados, los resultados del modelo señalan que el Valle del Cauca consolida la posición más sólida en materia de exportaciones manufactureras, con coeficientes positivos y significativos que superan los de los demás departamentos analizados. Por otra parte, los resultados también permiten inferir que los productos con mayor valor agregado podrían enfrentar barreras más elevadas en los mercados internacionales, como estándares técnicos exigentes, requisitos de certificación complejos o competencia con marcas globales establecidas. Este tipo de aspectos abren la posibilidad de realizar nuevos supuestos y análisis complementarios.
En términos generales, el modelo permite concluir que las características productivas y estructurales tienen un papel relevante en desempeño comercial internacional dentro del conjunto de establecimientos estudiados. Sin embargo, los hallazgos también sugieren la existencia de factores externos no incluidos en el modelo, como por ejemplo las condiciones logísticas, la infraestructura, la política industrial o la orientación regional, que pueden influir significativamente en el desempeño exportador.
Por lo anterior, los resultados deben interpretarse como un aporte exploratorio dentro de la muestra analizada, más que como un modelo predictivo generalizable al sector manufacturero colombiano.
Departamento Administrativo Nacional de Estadística – DANE. (2023). Encuesta Anual Manufacturera (EAM) 2023 - Diccionario de datos. Recuperado de https://microdatos.dane.gov.co/index.php/catalog/871/data-dictionary/F3/
Xie, Y. (2024). R Markdown: The Definitive Guide. Bookdown. Recuperado de https://bookdown.org/yihui/rmarkdown/html-document.html
Barandica, J. (s.f.). Joaqui Barandica - Recursos de programación y análisis de datos. Recuperado de https://www.joaquibarandica.com/
Departamento Administrativo Nacional de Estadística – DANE. (2023). Atlas Estadístico de Colombia, Tomo III: Industria manufacturera. Recuperado de https://geoportal.dane.gov.co/servicios/atlas-estadistico/src/Tomo_III_Economico/1.1.-industria-manufacturera.html
Revista Venezolana de Gerencia (2022). Análisis de la competitividad y desempeño exportador en el sector manufacturero. Recuperado de https://produccioncientificaluz.org/index.php/rvg/article/view/32401