En el transcurso de este informe, se expondrán resultados correspondientes a variables univariadas, permitiendo así una comprensión más detallada del comportamiento de dichas variables. Estos resultados servirán como base para la formulación de un análisis multivariado en el futuro, con el fin de cumplir de manera efectiva con los objetivos propuestos en el presente documento.
Introducción
La camara de comercio regula y ofrece apoyo a diversas empresas dedicadas al sector de alimentos, entre ellas incluye a las que lo producen, procesan, comercializan y/o ofrecen cualquier tipo de servicio relacionado a esto.
Entre las regulaciones se encuentra el registro legal de estas empresas, en el que se emite una matricula o licencia de funcionamiento a operar en el que autoriza a la empresa para que empiecen a operar comercialmente, para esto la camra de comercio verifica ciertos requisitos legales y administrativos, además de recopilar la informacion financiera durante cierto periodo de tiempo, en este caso desde el 2019 al 2023.
La población que será analizada principalmente seran las personas naturales, sin embargo también se mostrará algunas diferencias y reaciones con las personas juridicás para dejar clara la diferencia en el comportamiento de estas y algunas posibles relaciones.
Marco conceptual
Marco de antecedentes
Se encontraron diversos estudios en los cuales se analizó el estado empresarial del sector alimenticio tanto en Antioquia como en Colombia en general. El primer estudio a tener en cuenta es “DIAGNÓSTICO DEL ESTADO ACTUAL DE LAS AGROINDUSTRIAS Y EMPRENDIMIENTOS DEL MUNICIPIO DE SONSÓN”, seleccionado debido a su acercamiento a los emprendimientos en uno de los municipios de Antioquia. En este se destaca la persistencia de los emprendedores locales. Se propone continuar apoyándolos con formación para formalizar sus empresas y cumplir requisitos comerciales. Se identificaron encadenamientos agroindustriales, y se sugiere reactivar industrias sin uso, como cárnicos y lácteos. A pesar de la falta del Registro INVIMA en algunas empresas, se busca asesorar para evitar futuros problemas. La pandemia no impidió la participación en formaciones virtuales y eventos presenciales con protocolos de bioseguridad. Aunque el micrositio web está en desarrollo, se espera su presentación durante este periodo de gobierno.
El segundo estudio es “Análisis del desempeño financiero de empresas innovadoras del sector Alimentos y Bebidas en Colombia”, el cual nos ayudó a comprender más a profundidad la situación financiera del sector alimenticio en Colombia y poder guiarnos activamente en el desarrollo del análisis financiero. En este se mencionan aspectos importantes, como que entre 2000 y 2008, el sector de alimentos y bebidas en Colombia experimentó un crecimiento en ventas, activos y utilidades. Las empresas innovadoras mostraron un mayor crecimiento en ventas y activos, pero tuvieron una caída en 2004, afectando las utilidades. La eficiencia de las innovadoras dependió del uso eficiente de activos, mientras que las no innovadoras se centraron en el manejo de costos. Aunque las innovadoras tuvieron un EVA promedio superior, ingresaron a una franja negativa después de 2004, mientras que las no innovadoras mantuvieron un EVA negativo constante. El EVA del sector se explicó por el rendimiento del activo neto operacional, vinculado al riesgo país. A pesar de contribuir al conocimiento financiero, el estudio tiene limitaciones en la consideración de otras características diferenciadoras en futuras investigaciones.
Marco teórico
El Oriente Antioqueño se destaca como una región prometedora para la inversión en el sector alimenticio, respaldada por diversos factores como su estratégica ubicación, crecimiento demográfico y dinamismo económico.
Desde una perspectiva social y cultural, la región exhibe una arraigada tradición culinaria, enfocada en la preferencia por productos frescos y locales. Además, la creciente conciencia sobre salud y alimentación saludable impulsa la demanda de productos orgánicos y artesanales. La población local, caracterizada por su espíritu emprendedor, muestra disposición a probar nuevas experiencias gastronómicas.
En cuanto a la dimensión poblacional, el crecimiento sostenido de la población amplía el mercado potencial para las empresas del sector alimenticio. La tendencia hacia la urbanización abre oportunidades para la distribución y comercialización de alimentos, especialmente considerando la presencia de una población joven y diversa que favorece la innovación y diversificación de la oferta.
En el ámbito político, el gobierno colombiano respalda el desarrollo del sector agroindustrial mediante políticas públicas, incentivos fiscales y programas de apoyo a las PYMES.
En el aspecto económico, la diversificación económica del Oriente Antioqueño, con un destacado sector industrial y comercial, se ve respaldada por una infraestructura vial y de transporte en constante desarrollo. El crecimiento sostenido del PIB per cápita indica un aumento del poder adquisitivo de la población.
El análisis de la fase de producción de alimentos se enfoca en identificar la demanda de productos, evaluar la rentabilidad y comparar márgenes de ganancia para determinar las áreas con mayor potencial.
El análisis integral de estos aspectos permitirá determinar la viabilidad del Comercio del Oriente Antioqueño como una atractiva opción de inversión en el sector alimenticio.
Definiciones importantes
Activos: Son los recursos económicos que posee una empresa, como efectivo, cuentas por cobrar, inventarios, maquinaria y equipos. Se clasifican en activos corrientes (a corto plazo) y activos no corrientes (a largo plazo).
Pasivos: Son las obligaciones que una empresa tiene con terceros, como proveedores, bancos, empleados y el gobierno. Representan los recursos financieros que la empresa debe a otros y que tendrá que pagar en el futuro.
Patrimonio: Es la diferencia entre los activos y los pasivos de una empresa. Representa el valor neto de la empresa. Se calcula como el total de activos menos el total de pasivos.
Utilidades: Son las ganancias que obtiene una empresa después de descontar los costos y gastos de operación. También se les conoce como beneficios o ganancias netas.
Sector alimenticio: Es el conjunto de actividades económicas que se relacionan con la producción, transformación, distribución y comercialización de alimentos. Abarca desde la agricultura y la ganadería hasta la industria alimentaria y el comercio minorista.
Planteamiento del problema
Considerando los aspectos sociales, culturales, poblacionales, políticos, económicos y éticos: ¿Es el comercio del Oriente Antioqueño una buena opción de inversión en el sector alimenticio si se desea invertir en una empresa en nacimiento o crecimiento?¿Se puede confiar en el progreso de los proyectos que se han ido consolidando y construyendo en los últimos 5 años?
Objetivos
General
Analizar la fase de producción de alimentos gestionada por emprendedores individuales para identificar las oportunidades de inversión con mayor relevancia en el Oriente Antioqueño. Este análisis se basará en los datos recopilados durante los últimos cuatro años.
Específicos
Identificar los tipos de alimentos con mayor demanda y potencial de crecimiento en la región.
Evaluar la rentabilidad y viabilidad económica de las actividades comerciales individuales en el sector alimentario.
Establecer comparativas entre los márgenes de ganancia y retorno de inversión de los diferentes campos del sector alimenticio.
Justificación
El principal propósito de este proyecto es la observación y el análisis de una base de datos para relacionar y procesar información (considerada valiosa), mientras que se busca una solución u optimización de alguna técnica empleada ,que no se haya contemplado disponer en el contexto de las variables implicadas. Se investigó la base de datos de las empresas que se dedican a procesar alimentos registradas en la Cámara de Comercio del Oriente Antioqueño (CCOA) en pro del análisis empresarial previo y a futuro del cómo podían surgir, potencializarse o verse afectadas por diversos factores todas aquellas personas naturales registradas que cuentan con algún tipo de vínculo empresarial o que refieren emprendimientos propios; esto con el propósito de hallar patrones en las pérdidas y ganancias, en la ubicación geográfica de su negocio, ingresos, tipos de activos y pasivos que poseen, entre otros, para luego tratar de relacionar o descartar la relación que existe entre sí.
Adicionalmente, es importante resaltar que se realizó un estudio con esta base de datos específica, ya que toma variables tanto cuantitativas como cualitativas relacionadas con actividades económicas y factores que las rodean, y que, a su vez, resultaron mutuamente interesantes para trabajar, pues al tratar asuntos económicos de la mano de más características importantes financieras o no financieras, se logre evidenciar particularmente una tendencia a dependencia y significancia o imparcialidad y despreciabilidad.
Personas juridicas y naturales
Diagnóstico inicial de variables
Variables e individuos
Dada la naturaleza de nuestro proyecto, nos enfocaremos en colaborar con individuos considerados como personas naturales, excluyendo la participación de grandes empresas, esto con el fin de llevar a cabo un análisis cuantitativo y cualitativo en simultáneo; se determinó que resultaba más factible caracterizar ciertas cualidades en las personas naturales como género o estrato social, que, en comparación con las personas jurídicas, no aplicaban o no brindaban una información categórica útil para el estudio.
En lo concerniente a las variables, se prescindirá de aquellas que contengan información temporal como lo son cualquier tipo de fechas, así como de aquellas que simplemente reproduzcan datos ya existentes como nombre 1 y 2, apellido 1 y 2. Asimismo, se excluirán aquellas variables que posean información trivial, tal como aquellas en las que todos los individuos presenten valores nulos o aquellas con una cantidad significativa de datos faltantes.
En la tabla a continuación se muestran las variables que se utilizaran a lo largo del proyecto.
Ver código
suppressWarnings({suppressMessages({library(knitr)library(kableExtra)})})tabla <-data.frame(Identificador =c("RAZON SOCIAL", "GENERO", "EMPREN.SOCIAL", "NACIONALIDAD", "DIR.COMERCIAL", "MUN.COMERCIAL", "CATEGORIA", "ACTIVIDAD_ECONOMICA_PRINCIPAL", "DOS_O_MAS_ACT_ECON", "CANT.MUJERES", "ING.TAM.EMPRESARIAL", "UBICACION", "PERSONAL", "ACTIVO.CORRIENTE", "ACTIVO.TOTAL", "PASIVO.TOTAL", "PATRIMONIO", "PASIVO+PATRIM", "ING.OPERACIONES", "GAS.OPERACIONALES", "GAS.NO.OPERAC", "COS.VEN", "GAS.IMP", "UTIL.OPERACIONAL", "UTIL.NETA", "CANT.EST.BD", "ACTI 2019", "ACTI 2020", "ACTI 2021", "ACTI 2022", "ACTI 2023"),Tipo =c("Cualitativa", "Cualitativa", "Cualitativa", "Cualitativa", "Cualitativa", "Cualitativa", "Cualitativa", "Cualitativa", "Cualitativa", "Cuantitativa", "Cuantitativa", "Cualitativa", "Cuantitativa", "Cuantitativa", "Cuantitativa", "Cuantitativa", "Cuantitativa", "Cuantitativa", "Cuantitativa", "Cuantitativa", "Cuantitativa", "Cuantitativa", "Cuantitativa", "Cuantitativa", "Cuantitativa", "Cualitativa", "Cuantitativa", "Cuantitativa", "Cuantitativa", "Cuantitativa", "Cuantitativa"), Descripción =c("Tipo de persona", "Masculino o Femenino", "Si aspira a convertise en una franquicia o no", "Nacionalidad", "Dirección donde se realiza la actividad comercial", "Municipio donde se realiza la actividad comercial", "Actividad comercial general", "Subdivición de la categoría, es más específica con la actividad", "Si tiene dos o más actividades económicas", "Cantidad de mujeres que trabajan en", "Ingresos", "Estrato socioeconómico", "Cantidad de personas en total", "Activo corriente", "Activo que incluye los activos corriente, no corriente, fijo, valorizado y otros.", "Pasivo que incluye el pasivo a largo plazo y el corriente.", "Patrimonio", "La suma del patrimonio y el pasivo total", "Ingresos que dejan las operaciones", "Gastos operacionales", "Gastos adicionales sin incluir los impuestos", "Costo total", "Gastos en impuestos", "Utilidad operacional", "Utilidad neta", "Cantidad de establecimientos físicos", "Activos del 2019", "Activos del 2020", "Activos del 2021", "Activos del 2022", "Activos del 2023"))tabla %>%kable("html", col.names =c("Identificador", "Tipo", "Descripción")) %>%kable_styling(full_width =FALSE)
Identificador
Tipo
Descripción
RAZON SOCIAL
Cualitativa
Tipo de persona
GENERO
Cualitativa
Masculino o Femenino
EMPREN.SOCIAL
Cualitativa
Si aspira a convertise en una franquicia o no
NACIONALIDAD
Cualitativa
Nacionalidad
DIR.COMERCIAL
Cualitativa
Dirección donde se realiza la actividad comercial
MUN.COMERCIAL
Cualitativa
Municipio donde se realiza la actividad comercial
CATEGORIA
Cualitativa
Actividad comercial general
ACTIVIDAD_ECONOMICA_PRINCIPAL
Cualitativa
Subdivición de la categoría, es más específica con la actividad
DOS_O_MAS_ACT_ECON
Cualitativa
Si tiene dos o más actividades económicas
CANT.MUJERES
Cuantitativa
Cantidad de mujeres que trabajan en
ING.TAM.EMPRESARIAL
Cuantitativa
Ingresos
UBICACION
Cualitativa
Estrato socioeconómico
PERSONAL
Cuantitativa
Cantidad de personas en total
ACTIVO.CORRIENTE
Cuantitativa
Activo corriente
ACTIVO.TOTAL
Cuantitativa
Activo que incluye los activos corriente, no corriente, fijo, valorizado y otros.
PASIVO.TOTAL
Cuantitativa
Pasivo que incluye el pasivo a largo plazo y el corriente.
PATRIMONIO
Cuantitativa
Patrimonio
PASIVO+PATRIM
Cuantitativa
La suma del patrimonio y el pasivo total
ING.OPERACIONES
Cuantitativa
Ingresos que dejan las operaciones
GAS.OPERACIONALES
Cuantitativa
Gastos operacionales
GAS.NO.OPERAC
Cuantitativa
Gastos adicionales sin incluir los impuestos
COS.VEN
Cuantitativa
Costo total
GAS.IMP
Cuantitativa
Gastos en impuestos
UTIL.OPERACIONAL
Cuantitativa
Utilidad operacional
UTIL.NETA
Cuantitativa
Utilidad neta
CANT.EST.BD
Cualitativa
Cantidad de establecimientos físicos
ACTI 2019
Cuantitativa
Activos del 2019
ACTI 2020
Cuantitativa
Activos del 2020
ACTI 2021
Cuantitativa
Activos del 2021
ACTI 2022
Cuantitativa
Activos del 2022
ACTI 2023
Cuantitativa
Activos del 2023
Resumen comportamiento variables
Ver código
# Seleccionamos el archivo CSV ruta_archivo <-file.choose()# Carga el archivo CSVdatos <-read.csv(ruta_archivo, sep =";")
Tabla con los primeros individuos
RAZON_SOCIAL
GENERO
EMPREN-SOCIAL
NACIONALIDAD
DIR-COMERCIAL
MUN-COMERCIAL
CATEGORIA
ACTIVIDAD_ECONOMICA_PRINCIPAL
DOS_O_MAS_ACT_ECON
CANT-MUJERES
CANT-MUJERES-CAR-DIR
PORCENT-PART-MUJ
ING-TAM-EMPRESARIAL
ESTRATO
PERSONAL
ACTIVO-CORRIENTE
ACTIVO-NO-CORRIENTE
ACTIVO-TOTAL
PASIVO-CORRIENTE
PASIVO-LRG-PLAZO
PASIVO-TOTAL
PATRIMONIO
PASIVO+PATRIM
ING-OPERACIONES
ING-NO-OPERACIONALES
GAS-OPERACIONALES
GAS-NO-OPERAC
COS-VEN
GAS-IMP
UTIL-OPERACIONAL
UTIL-NETA
CANT-EST-BD
ACTIV_2019
ACTIV_2020
ACTIV_2021
ACTIV_2022
ACTIV_2023
NATURAL
F
N
COLOMBIANA
URBANO
05674-SAN VICENTE FERRER
AGROPECUARIA
AGRICULTURA
DOS_O_MAS
0
0
0
72.850.000,00
6
0
3.000.000,00
0
3.000.000,00
0
0
0
3.000.000,00
3.000.000,00
72.850.000,00
0
0
0
0
0
0
0
1
0
0
3.000.000,00
3.000.000,00
3.000.000,00
JURIDICA
N/A
N
N/A
RURAL
05318-GUARNE
AGROPECUARIA
AGRICULTURA
DOS_O_MAS
0
1
67
0
6
0
45.000.000,00
0
45.000.000,00
0
0
0
45.000.000,00
45.000.000,00
0
0
0
0
0
0
0
0
N/A
0
0
0
0
45.000.000,00
JURIDICA
N/A
N
N/A
URBANO
05318-GUARNE
AGROPECUARIA
AGRICULTURA
DOS_O_MAS
1
0
0
0
1
4
1.861.528.809,00
757.378.707,00
2.618.907.516,00
89.558.669,00
3.458.640.558,00
3.548.199.227,00
-929.291.711,00
2.618.907.516,00
0
1.284,00
914.712.722,00
57.575.144,00
0
0
-972.286.582,00
-972.286.582,00
N/A
0
0
200.000.000,00
1.132.046.196,00
2.618.907.516,00
JURIDICA
N/A
N
N/A
URBANO
05607-EL RETIRO
AGROPECUARIA
AGRICULTURA
DOS_O_MAS
3
1
90
601.391.125,00
6
3
639.061.000,00
0
639.061.000,00
502.500.000,00
0
502.500.000,00
136.561.000,00
639.061.000,00
601.391.125,00
130.740,00
433.449.000,00
49.892.000,00
65.901.874,00
0
0
0
N/A
462.690.000,00
515.642.000,00
589.890.442,00
571.723.175,00
639.061.000,00
JURIDICA
N/A
N
N/A
RURAL
05318-GUARNE
AGROPECUARIA
AGRICULTURA
DOS_O_MAS
0
0
60
0
1
0
10.000.000,00
0
10.000.000,00
0
0
0
10.000.000,00
10.000.000,00
0
0
0
0
0
0
0
0
1
0
0
0
0
10.000.000,00
NATURAL
F
S
COLOMBIANA
RURAL
05148-CARMEN DE VIBORAL
AGROPECUARIA
AGRICULTURA
DOS_O_MAS
0
0
0
0
5
0
2.000.000,00
0
2.000.000,00
0
0
0
2.000.000,00
2.000.000,00
0
0
0
0
0
0
0
0
1
0
0
0
0
2.000.000,00
Resumen Básico de las variables
Ver código
suppressWarnings({suppressMessages({library(plotly)library(readxl)library(dplyr)})})# Desactivar notación científicaoptions(scipen =999)# Especifica la ruta del archivo Excelarchivo_excel <-"C:/Users/catam/OneDrive/Escritorio/catval.xlsx"# Leer los datos desde Excel sin especificar col_typesdatos <-read_excel(archivo_excel)# Función para limpiar y convertir las columnas a numéricasclean_and_convert <-function(df) { df[] <-lapply(df, function(column) {if (is.character(column)) { column <-gsub(",", "", column) # Eliminar comas column <-gsub(" ", "", column) # Eliminar espacios column <-as.numeric(column) # Convertir a numérico }return(column) })return(df)}# Aplicar la función a las columnas numéricas# Identifica las columnas que deberían ser numéricas (aquí se asume que las columnas de la 14 a la 37 deberían ser numéricas)columnas_numericas <-c(14,17:37)datos[, columnas_numericas] <-clean_and_convert(datos[, columnas_numericas])# COLUMNAS QUE NECESITAMOS CONVERTIR A CATEGORÍAS:datos$`CANT-EST-BD`<-as.factor(datos$`CANT-EST-BD`)datos$GENERO <-as.factor(datos$GENERO)datos$RAZON_SOCIAL <-as.factor(datos$RAZON_SOCIAL)datos$`EMPREN-SOCIAL`<-as.factor(datos$`EMPREN-SOCIAL`)datos$NACIONALIDAD<-as.factor(datos$NACIONALIDAD)datos$`DIR-COMERCIAL`<-as.factor(datos$`DIR-COMERCIAL`)datos$`MUN-COMERCIAL`<-as.factor(datos$`MUN-COMERCIAL`)datos$CATEGORIA <-as.factor(datos$CATEGORIA)datos$ACTIVIDAD_ECONOMICA_PRINCIPAL <-as.factor(datos$ACTIVIDAD_ECONOMICA_PRINCIPAL)datos$DOS_O_MAS_ACT_ECON <-as.factor(datos$DOS_O_MAS_ACT_ECON)datos$`CANT-MUJERES`<-as.factor(datos$`CANT-MUJERES`)datos$`CANT-MUJERES-CAR-DIR`<-as.factor(datos$`CANT-MUJERES-CAR-DIR`)datos$`PORCENT-PART-MUJ`<-as.factor(datos$`PORCENT-PART-MUJ`)datos$ESTRATO <-as.factor(datos$ESTRATO)datos$PERSONAL <-as.factor(datos$PERSONAL)# Muestra el resumen de los datos importadossummary(datos)
RAZON_SOCIAL GENERO EMPREN-SOCIAL NACIONALIDAD DIR-COMERCIAL
JURIDICA:199 F :286 N:737 ALEMANA : 1 RURAL :195
NATURAL :594 M :308 S: 56 COLOMBIANA :587 URBANO:598
N/A:199 FRANCESA : 1
GUATEMANTECA: 1
N/A :199
VENEZOLANA : 4
MUN-COMERCIAL CATEGORIA
05615 - RIONEGRO :223 ELABORACION DE PRODUCTOS DE CONSUMO:630
05440 - MARINILLA : 94 HOTELERÍA Y TURISMO : 77
05318 - GUARNE : 77 COMERCIO : 48
05148 - CARMEN DE VIBORAL: 76 AGROPECUARIA : 19
05376 - LA CEJA : 74 RECREACION : 7
05607 - EL RETIRO : 33 INVESTIGACION : 3
(Other) :216 (Other) : 9
ACTIVIDAD_ECONOMICA_PRINCIPAL DOS_O_MAS_ACT_ECON
ELABORACION PANADERIA :261 DOS O MÁS ACTIVIDADES ECONOMICAS:525
PRODUCTOS ALIMENTICIOS: 84 N/A :268
PROCESADOS ANIMALES : 83
ELABORACION DE COMIDA : 60
EXPENDIO DE COMIDAS : 38
POR MENOR : 36
(Other) :231
CANT-EST-BD CANT-MUJERES CANT-MUJERES-CAR-DIR PORCENT-PART-MUJ
cero :141 0 :547 0 :708 0 :704
dos_o_mas: 24 1 :112 1 : 60 100 : 28
uno :628 2 : 53 2 : 11 50 : 17
3 : 28 3 : 5 1 : 7
4 : 12 4 : 4 60 : 5
5 : 6 5 : 3 30 : 4
(Other): 35 (Other): 2 (Other): 28
ING-TAM-EMPRESARIAL ESTRATO PERSONAL ACTIVO-CORRIENTE
Min. : 0 1:496 0 :454 Min. : 0
1st Qu.: 1 2: 20 1 :118 1st Qu.: 1950000
Median : 12000000 3: 11 2 : 73 Median : 5000000
Mean : 925095888 4: 22 3 : 37 Mean : 221088078
3rd Qu.: 60000000 5:162 4 : 25 3rd Qu.: 13415870
Max. :188173212000 6: 82 5 : 20 Max. :45846364000
(Other): 66
ACTIVO-NO-CORRIENTE ACTIVO-TOTAL PASIVO-CORRIENTE
Min. : 0 Min. : 0 Min. : 0
1st Qu.: 0 1st Qu.: 2100000 1st Qu.: 0
Median : 0 Median : 5500000 Median : 0
Mean : 526817359 Mean : 747920724 Mean : 277429720
3rd Qu.: 0 3rd Qu.: 15010000 3rd Qu.: 0
Max. :341101547000 Max. :386947911000 Max. :139537308000
PASIVO-LRG-PLAZO PASIVO-TOTAL PATRIMONIO
Min. : 0 Min. : 0 Min. : -929291711
1st Qu.: 0 1st Qu.: 0 1st Qu.: 1600000
Median : 0 Median : 0 Median : 4500000
Mean : 234771833 Mean : 512206145 Mean : 235707336
3rd Qu.: 0 3rd Qu.: 0 3rd Qu.: 12560000
Max. :140334116000 Max. :279871424000 Max. :107076487000
PASIVO+PATRIM ING-OPERACIONES ING-NO-OPERACIONALES
Min. : 0 Min. : 0 Min. : 0
1st Qu.: 2100000 1st Qu.: 1 1st Qu.: 0
Median : 5375000 Median : 12000000 Median : 0
Mean : 747794621 Mean : 925095888 Mean : 7869396
3rd Qu.: 15010000 3rd Qu.: 60000000 3rd Qu.: 0
Max. :386947911000 Max. :188173212000 Max. :1548471000
GAS-OPERACIONALES GAS-NO-OPERAC COS-VEN
Min. : -50439000 Min. :-402723000 Min. : -3704547000
1st Qu.: 0 1st Qu.: 0 1st Qu.: 0
Median : 0 Median : 0 Median : 0
Mean : 122804722 Mean : 15150428 Mean : 697551736
3rd Qu.: 0 3rd Qu.: 0 3rd Qu.: 0
Max. :21148524146 Max. :3256925000 Max. :185624779000
GAS-IMP UTIL-OPERACIONAL UTIL-NETA
Min. : 0 Min. :-972286582 Min. :-1563062000
1st Qu.: 0 1st Qu.: 0 1st Qu.: 0
Median : 0 Median : 0 Median : 0
Mean : 6646098 Mean : 16827244 Mean : 2531860
3rd Qu.: 0 3rd Qu.: 0 3rd Qu.: 0
Max. :1649028000 Max. :3656830739 Max. : 1713918000
ACTIV_2019 ACTIV_2020 ACTIV_2021
Min. : 0 Min. : 0 Min. : 0
1st Qu.: 0 1st Qu.: 0 1st Qu.: 0
Median : 0 Median : 0 Median : 1700000
Mean : 77282965 Mean : 159579975 Mean : 195138061
3rd Qu.: 2610000 3rd Qu.: 5000000 3rd Qu.: 9054000
Max. :8664805786 Max. :31332606000 Max. :29068555000
ACTIV_2022 ACTIV_2023
Min. : 0 Min. : 0
1st Qu.: 600000 1st Qu.: 2010000
Median : 3100000 Median : 5375000
Mean : 392384069 Mean : 747820011
3rd Qu.: 10800000 3rd Qu.: 15010000
Max. :122291864000 Max. :386947911000
En razón social de la base de datos original se encontraban los nombres particulares de cada empresa que recibía una matrícula, esto lo cambiamos por personas naturales o personas jurídicas para poder hacer un análisis adecuado, pues al categorizarlas así, era más sencillo explicar qué tantas empresas eran PYMES, y cuáles eran empresas ya consolidadas con anterioridad en el mercado antioqueño; este se hizo dependiendo de si el nombre terminaba en S.A.S o si solamente se identificaba con su nombre tal y como aparece en la cédula.
Cómo podemos notar, en las variables Género y Nacionalidad la cantidad de individuos que tiene N/A es exactamente la misma que las personas jurídicas, por tanto decidimos no eliminarlo.
En estas dos variables cambiamos las direcciones exactas de los lugares por una clasificación de zona rural o zona urbana, para realizar esto nos guiamos de mapas, las iniciales de las dirrecciones (tales como cra, av, vda, etc), además en la gráfica de los municipios se puede notar que hay una gran concentración de estos establecimientos en Rionegro, que en su mayoría es urbano, y notamos que en general, las empresas se concentran en estas zonas.
En el caso de los estratos, vimos que era fácil identificar que había una mayor cantidad de empresas con estrato 1, lo que se puede interpretar como que son empresas locales o unipersonales.
Inicialmente, la variable CATEGORÍA no existía, nos guiamos de las variables CIIU-1, CIIU-2, CIIU-3 Y CIIU-4 (tratando de pluralizar cada una de estas) que, según la cámara de comercio, exigen al momento de declarar y que también indican a qué operación comercial específica se dedica la empresa y/o establecimiento, pues en varios casos se desarrolla más de una actividad, como por ejemplo: algunos restaurantes no sólo elaboran productos alimenticios (CIIU-1), si no que también los distribuyen (CIIU-2) y ofrecen ventas al por mayor (CIIU-4). Esta recategorización la vinculamos a algunos códigos claves en la base de datos de la CC. Generamos esta nueva variable condicionada por las letras que aparecen al comienzo de cada CIIU, que indican el tipo general de cada empresa (el MACROSECTOR), para analizarlo mejor y a su vez determinar mejor a qué tipo de población general nos enfrentábamos y sus razones.
Ver código
fig <-plot_ly(datos, x=~DOS_O_MAS_ACT_ECON, type='histogram', marker =list(color ='purple'))fig <- fig %>%layout(title ="DOS O MÁS ACTIVIDADES ECONÓMICAS",xaxis=list((title="Actividad")),yaxis=list(title='Frec. abs.'))fig
En esta variable particularmente, tratamos de ubicar aquellas empresas que únicamente se dedicaban a una actividad económica y aquellas que tenían dos o más de ellas, la razón principal es que en cuánto al CIIU 3 y 4 habían muchísimas empresas que en realidad sólo se dedicaban a una o máximo dos actividades económicas.
Dentro de los macrosectores presentados anteriormente, hay otras divisiones específicas que detallan mejor cada actividad económica de cada empresa (teniendo en cuenta su macrosector).
Como podemos notar una gran cantidad de empresas registran tener 0 personas bajo su cargo, esto se puede dar dado a que muchas de éstas pueden ser emprendimientos unipersonales (una sola persona es responsable de todas las decisiones, operaciones y en general de toda la administración del negocio).
A pesar de que en la variable de Género no tuvieramos una diferencia tan significativa entre Femenino y Masculino, podemos ver que en estas últimas tres variables (Cantidad de mujeres, Mujeres en cargos directivos y Porcentaje de Participación femenina) es bastante baja, lo que analizaremos más adelante en relación al tipo de comercio, ingreso, etc
Ver código
fig <-plot_ly(datos, x=~`EMPREN-SOCIAL`, type='histogram', marker =list(color ='purple'))fig <- fig %>%layout(title ="ASPIRA O NO A FRANQUICIA",xaxis=list((title="Franquiciado")),yaxis=list(title='Frec. abs.'))fig
En esta variable hicimos una recategorización acerca de si la empresa aspira o no a franquiciada (en Colombia, una franquicia suele ser asociada a si desea expandirse nacional o internacionalmente y modelar su idea de negocio con el fin de expansión a corto o mediano plazo), lo que nos inidca que la mayoría de empresas únicamente están interesadas en mantenser locales en el oriente Antioqueño.
De las 793 empresas y/o emprendimientos registrados, solo 141 no cuentan con un establecimiento físico, lo que significa que pueden ser emprendimientos que no requieren de atención al cliente frecuente o que solo requieren de distribución.
Diagramas sobre variables cuantitativas
Ver código
# Creación del gráfico de caja y bigotes con ajustes de visualizaciónfig <-plot_ly(data = datos, y =~`ING-TAM-EMPRESARIAL`, # Cambiado a 'y' para un gráfico verticaltype ='box',boxpoints ='all', # Muestra todos los puntos de datosjitter =0.3, # Dispersión de los puntos de datospointpos =-1.8, # Posición de los puntos de datosmarker =list(color ='purple'), # Color de los puntos de datosline =list(color ='black') # Color de las líneas de las cajas)# Ajuste del diseño del gráficofig <- fig %>%layout(title ="Distribución de los Ingresos", yaxis =list(title ="Ingresos (COP)", # Etiqueta del eje Y con formato en COPzeroline =FALSE,tickprefix ="$", # Prefijo de pesos colombianostickformat =",.0f"# Formato de los ticks (sin decimales) ),showlegend =FALSE# Ocultar la leyenda si no es necesaria)# Mostrar el gráficofig
Ver código
# Creación del gráfico de caja y bigotes con la variable 'ACTIVO-TOTAL'fig <-plot_ly(data = datos, y =~`ACTIVO-TOTAL`, # Cambiado a 'y' para un gráfico verticaltype ='box',boxpoints ='all', # Muestra todos los puntos de datosjitter =0.3, # Dispersión de los puntos de datospointpos =-1.8, # Posición de los puntos de datosmarker =list(color ='purple'), # Color de los puntos de datosline =list(color ='black') # Color de las líneas de las cajas)# Ajuste del diseño del gráficofig <- fig %>%layout(title ="ACTIVO TOTAL", yaxis =list(title ="Activo Total (COP)", # Etiqueta del eje Y con formato en COPzeroline =FALSE,tickprefix ="$", # Prefijo de pesos colombianostickformat =",.0f"# Formato de los ticks (sin decimales) ),showlegend =FALSE# Ocultar la leyenda si no es necesaria)# Mostrar el gráficofig
Ver código
# Creación del gráfico de caja y bigotes con la variable 'ACTIVO-CORRIENTE'fig <-plot_ly(data = datos, y =~`ACTIVO-CORRIENTE`, # Cambiado a 'y' para un gráfico verticaltype ='box',boxpoints ='all', # Muestra todos los puntos de datosjitter =0.3, # Dispersión de los puntos de datospointpos =-1.8, # Posición de los puntos de datosmarker =list(color ='purple'), # Color de los puntos de datosline =list(color ='black') # Color de las líneas de las cajas)# Ajuste del diseño del gráficofig <- fig %>%layout(title ="ACTIVO CORRIENTE", yaxis =list(title ="Activo Corriente (COP)", # Etiqueta del eje Y con formato en COPzeroline =FALSE,tickprefix ="$", # Prefijo de pesos colombianostickformat =",.0f"# Formato de los ticks (sin decimales) ),showlegend =FALSE# Ocultar la leyenda si no es necesaria)# Mostrar el gráficofig
Ver código
# Creación del gráfico de caja y bigotes con la variable 'PASIVO-TOTAL'fig <-plot_ly(data = datos, y =~`PASIVO-TOTAL`, # Cambiado a 'y' para un gráfico verticaltype ='box',boxpoints ='all', # Muestra todos los puntos de datosjitter =0.3, # Dispersión de los puntos de datospointpos =-1.8, # Posición de los puntos de datosmarker =list(color ='purple'), # Color de los puntos de datosline =list(color ='black') # Color de las líneas de las cajas)# Ajuste del diseño del gráficofig <- fig %>%layout(title ="PASIVO TOTAL", yaxis =list(title ="Pasivo Total (COP)", # Etiqueta del eje Y con formato en COPzeroline =FALSE,tickprefix ="$", # Prefijo de pesos colombianostickformat =",.0f"# Formato de los ticks (sin decimales) ),showlegend =FALSE# Ocultar la leyenda si no es necesaria)# Mostrar el gráficofig
Ver código
# Creación del gráfico de caja y bigotes con la variable 'PATRIMONIO'fig <-plot_ly(data = datos, y =~PATRIMONIO, # Cambiado a 'y' para un gráfico verticaltype ='box',boxpoints ='all', # Muestra todos los puntos de datosjitter =0.3, # Dispersión de los puntos de datospointpos =-1.8, # Posición de los puntos de datosmarker =list(color ='purple'), # Color de los puntos de datosline =list(color ='black') # Color de las líneas de las cajas)# Ajuste del diseño del gráficofig <- fig %>%layout(title ="PATRIMONIO", yaxis =list(title ="Patrimonio (COP)", # Etiqueta del eje Y con formato en COPzeroline =FALSE,tickprefix ="$", # Prefijo de pesos colombianostickformat =",.0f"# Formato de los ticks (sin decimales) ),showlegend =FALSE# Ocultar la leyenda si no es necesaria)# Mostrar el gráficofig
Ver código
# Creación del gráfico de caja y bigotes con la variable 'ING-OPERACIONES'fig <-plot_ly(data = datos, y =~`ING-OPERACIONES`, # Cambiado a 'y' para un gráfico verticaltype ='box',boxpoints ='all', # Muestra todos los puntos de datosjitter =0.3, # Dispersión de los puntos de datospointpos =-1.8, # Posición de los puntos de datosmarker =list(color ='purple'), # Color de los puntos de datosline =list(color ='black') # Color de las líneas de las cajas)# Ajuste del diseño del gráficofig <- fig %>%layout(title ="INGRESOS OPERACIONALES", yaxis =list(title ="Ingresos Operacionales (COP)", # Etiqueta del eje Y con formato en COPzeroline =FALSE,tickprefix ="$", # Prefijo de pesos colombianostickformat =",.0f"# Formato de los ticks (sin decimales) ),showlegend =FALSE# Ocultar la leyenda si no es necesaria)# Mostrar el gráficofig
Ver código
# Creación del gráfico de caja y bigotes con la variable 'GAS-OPERACIONALES'fig <-plot_ly(data = datos, y =~`GAS-OPERACIONALES`, # Cambiado a 'y' para un gráfico verticaltype ='box',boxpoints ='all', # Muestra todos los puntos de datosjitter =0.3, # Dispersión de los puntos de datospointpos =-1.8, # Posición de los puntos de datosmarker =list(color ='purple'), # Color de los puntos de datosline =list(color ='black') # Color de las líneas de las cajas)# Ajuste del diseño del gráficofig <- fig %>%layout(title ="GASTOS OPERACIONALES", yaxis =list(title ="Gastos Operacionales (COP)", # Etiqueta del eje Y con formato en COPzeroline =FALSE,tickprefix ="$", # Prefijo de pesos colombianostickformat =",.0f"# Formato de los ticks (sin decimales) ),showlegend =FALSE# Ocultar la leyenda si no es necesaria)# Mostrar el gráficofig
Ver código
# Creación del gráfico de caja y bigotes con la variable 'GAS-NO-OPERAC'fig <-plot_ly(data = datos, y =~`GAS-NO-OPERAC`, # Cambiado a 'y' para un gráfico verticaltype ='box',boxpoints ='all', # Muestra todos los puntos de datosjitter =0.3, # Dispersión de los puntos de datospointpos =-1.8, # Posición de los puntos de datosmarker =list(color ='purple'), # Color de los puntos de datosline =list(color ='black') # Color de las líneas de las cajas)# Ajuste del diseño del gráficofig <- fig %>%layout(title ="GASTOS NO OPERACIONALES", yaxis =list(title ="Gastos No Operacionales (COP)", # Etiqueta del eje Y con formato en COPzeroline =FALSE,tickprefix ="$", # Prefijo de pesos colombianostickformat =",.0f"# Formato de los ticks (sin decimales) ),showlegend =FALSE# Ocultar la leyenda si no es necesaria)# Mostrar el gráficofig
Ver código
# Creación del gráfico de caja y bigotes con la variable 'COS-VEN'fig <-plot_ly(data = datos, y =~`COS-VEN`, # Cambiado a 'y' para un gráfico verticaltype ='box',boxpoints ='all', # Muestra todos los puntos de datosjitter =0.3, # Dispersión de los puntos de datospointpos =-1.8, # Posición de los puntos de datosmarker =list(color ='purple'), # Color de los puntos de datosline =list(color ='black') # Color de las líneas de las cajas)# Ajuste del diseño del gráficofig <- fig %>%layout(title ="GASTOS", yaxis =list(title ="Gastos (COP)", # Etiqueta del eje Y con formato en COPzeroline =FALSE,tickprefix ="$", # Prefijo de pesos colombianostickformat =",.0f"# Formato de los ticks (sin decimales) ),showlegend =FALSE# Ocultar la leyenda si no es necesaria)# Mostrar el gráficofig
Ver código
# Creación del gráfico de caja y bigotes con la variable 'GAS-IMP'fig <-plot_ly(data = datos, y =~`GAS-IMP`, # Cambiado a 'y' para un gráfico verticaltype ='box',boxpoints ='all', # Muestra todos los puntos de datosjitter =0.3, # Dispersión de los puntos de datospointpos =-1.8, # Posición de los puntos de datosmarker =list(color ='purple'), # Color de los puntos de datosline =list(color ='black') # Color de las líneas de las cajas)# Ajuste del diseño del gráficofig <- fig %>%layout(title ="GASTO EN IMPUESTOS", yaxis =list(title ="Gasto en Impuestos (COP)", # Etiqueta del eje Y con formato en COPzeroline =FALSE,tickprefix ="$", # Prefijo de pesos colombianostickformat =",.0f"# Formato de los ticks (sin decimales) ),showlegend =FALSE# Ocultar la leyenda si no es necesaria)# Mostrar el gráficofig
Ver código
# Creación del gráfico de caja y bigotes con la variable 'UTIL-OPERACIONAL'fig <-plot_ly(data = datos, y =~`UTIL-OPERACIONAL`, # Cambiado a 'y' para un gráfico verticaltype ='box',boxpoints ='all', # Muestra todos los puntos de datosjitter =0.3, # Dispersión de los puntos de datospointpos =-1.8, # Posición de los puntos de datosmarker =list(color ='purple'), # Color de los puntos de datosline =list(color ='black') # Color de las líneas de las cajas)# Ajuste del diseño del gráficofig <- fig %>%layout(title ="UTILIDAD OPERACIONAL", yaxis =list(title ="Utilidad Operacional (COP)", # Etiqueta del eje Y con formato en COPzeroline =FALSE,tickprefix ="$", # Prefijo de pesos colombianostickformat =",.0f"# Formato de los ticks (sin decimales) ),showlegend =FALSE# Ocultar la leyenda si no es necesaria)# Mostrar el gráficofig
Ver código
# Creación del gráfico de caja y bigotes con la variable 'UTIL-NETA'fig <-plot_ly(data = datos, y =~`UTIL-NETA`, # Cambiado a 'y' para un gráfico verticaltype ='box',boxpoints ='all', # Muestra todos los puntos de datosjitter =0.3, # Dispersión de los puntos de datospointpos =-1.8, # Posición de los puntos de datosmarker =list(color ='purple'), # Color de los puntos de datosline =list(color ='black') # Color de las líneas de las cajas)# Ajuste del diseño del gráficofig <- fig %>%layout(title ="UTILIDAD NETA", yaxis =list(title ="Utilidad Neta (COP)", # Etiqueta del eje Y con formato en COPzeroline =FALSE,tickprefix ="$", # Prefijo de pesos colombianostickformat =",.0f"# Formato de los ticks (sin decimales) ),showlegend =FALSE# Ocultar la leyenda si no es necesaria)# Mostrar el gráficofig
Ver código
# Creación del gráfico de caja y bigotes con la variable 'ACTIV_2019'fig <-plot_ly(data = datos, y =~`ACTIV_2019`, # Cambiado a 'y' para un gráfico verticaltype ='box',boxpoints ='all', # Muestra todos los puntos de datosjitter =0.3, # Dispersión de los puntos de datospointpos =-1.8, # Posición de los puntos de datosmarker =list(color ='purple'), # Color de los puntos de datosline =list(color ='black') # Color de las líneas de las cajas)# Ajuste del diseño del gráficofig <- fig %>%layout(title ="ACTIVOS 2019", yaxis =list(title ="Activos 2019 (COP)", # Etiqueta del eje Y con formato en COPzeroline =FALSE,tickprefix ="$", # Prefijo de pesos colombianostickformat =",.0f"# Formato de los ticks (sin decimales) ),showlegend =FALSE# Ocultar la leyenda si no es necesaria)# Mostrar el gráficofig
Ver código
# Creación del gráfico de caja y bigotes con la variable 'ACTIV_2020'fig <-plot_ly(data = datos, y =~`ACTIV_2020`, # Cambiado a 'y' para un gráfico verticaltype ='box',boxpoints ='all', # Muestra todos los puntos de datosjitter =0.3, # Dispersión de los puntos de datospointpos =-1.8, # Posición de los puntos de datosmarker =list(color ='purple'), # Color de los puntos de datosline =list(color ='black') # Color de las líneas de las cajas)# Ajuste del diseño del gráficofig <- fig %>%layout(title ="ACTIVOS 2020", yaxis =list(title ="Activos 2020 (COP)", # Etiqueta del eje Y con formato en COPzeroline =FALSE,tickprefix ="$", # Prefijo de pesos colombianostickformat =",.0f"# Formato de los ticks (sin decimales) ),showlegend =FALSE# Ocultar la leyenda si no es necesaria)# Mostrar el gráficofig
Ver código
# Creación del gráfico de caja y bigotes con la variable 'ACTIV_2021'fig <-plot_ly(data = datos, y =~`ACTIV_2021`, # Cambiado a 'y' para un gráfico verticaltype ='box',boxpoints ='all', # Muestra todos los puntos de datosjitter =0.3, # Dispersión de los puntos de datospointpos =-1.8, # Posición de los puntos de datosmarker =list(color ='purple'), # Color de los puntos de datosline =list(color ='black') # Color de las líneas de las cajas)# Ajuste del diseño del gráficofig <- fig %>%layout(title ="ACTIVOS 2021", yaxis =list(title ="Activos 2021 (COP)", # Etiqueta del eje Yzeroline =FALSE,tickprefix ="$", # Prefijo de pesos colombianostickformat =",.0f"# Formato de los ticks (sin decimales) ),showlegend =FALSE# Ocultar la leyenda si no es necesaria)# Mostrar el gráficofig
Ver código
# Creación del gráfico de caja y bigotes con la variable 'ACTIV-2022'fig <-plot_ly(data = datos, y =~`ACTIV_2022`, # Cambiado a 'y' para un gráfico verticaltype ='box',boxpoints ='all', # Muestra todos los puntos de datosjitter =0.3, # Dispersión de los puntos de datospointpos =-1.8, # Posición de los puntos de datosmarker =list(color ='purple'), # Color de los puntos de datosline =list(color ='black') # Color de las líneas de las cajas)# Ajuste del diseño del gráficofig <- fig %>%layout(title ="ACTIVOS 2022", yaxis =list(title ="Activos 2022 (COP)", zeroline =FALSE,tickprefix ="$", # Prefijo de pesos colombianostickformat =",.0f"# Formato de los ticks (sin decimales) ),showlegend =FALSE# Ocultar la leyenda si no es necesaria)# Mostrar el gráficofig
Ver código
# Creación del gráfico de caja y bigotes con la variable 'ACTIV-2023'fig <-plot_ly(data = datos, y =~`ACTIV_2023`, # Cambiado a 'y' para un gráfico verticaltype ='box',boxpoints ='all', # Muestra todos los puntos de datosjitter =0.3, # Dispersión de los puntos de datospointpos =-1.8, # Posición de los puntos de datosmarker =list(color ='purple'), # Color de los puntos de datosline =list(color ='black')) # Color de las líneas de las cajas# Ajuste del diseño del gráficofig <- fig %>%layout(title ="ACTIVOS 2023", yaxis =list(title ="Activos 2023 (COP)", zeroline =FALSE,tickprefix ="", # Prefijo vacío si no deseas ningún símboloticksuffix ="B", # Sufijo para billonestickformat =",.1f"# Formato de los ticks (1 decimal) ),showlegend =FALSE# Ocultar la leyenda si no es necesaria)# Mostrar el gráficofig
Análisis bivariado
Para realizar el análisis bivariado, optamos por revisar las varianzas, correlaciones y demás medidas estadísticas que podrían ayudarnos a dar un vistazo más global a nuestra base de datos:
Ver código
suppressWarnings({suppressMessages({library(knitr)library(kableExtra)})})# Calcular la matriz de varianzas y covarianzas poblacionaln <-nrow(datos)matriz_cov <-var(datos[, c(14, 17:37)]) * (n -1) / n# Crear la tabla en HTML y mostrarla en el Viewerkable(matriz_cov, digits =2, format ="html") %>%kable_styling(full_width = F) %>%scroll_box(width ="800px", height ="500px") %>%as.character() %>% htmltools::HTML() %>% htmltools::browsable()
ING-TAM-EMPRESARIAL
ACTIVO-CORRIENTE
ACTIVO-NO-CORRIENTE
ACTIVO-TOTAL
PASIVO-CORRIENTE
PASIVO-LRG-PLAZO
PASIVO-TOTAL
PATRIMONIO
PASIVO+PATRIM
ING-OPERACIONES
ING-NO-OPERACIONALES
GAS-OPERACIONALES
GAS-NO-OPERAC
COS-VEN
GAS-IMP
UTIL-OPERACIONAL
UTIL-NETA
ACTIV_2019
ACTIV_2020
ACTIV_2021
ACTIV_2022
ACTIV_2023
ING-TAM-EMPRESARIAL
64654261018221715456
14989580900437821440
83063833492260716544
98053400798892933120
35943897292587687936
35109934523863203840
71053827614056611840
26999579821037760512
98053517456634200064
64654261018221715456
547483418749453760
3595018295191505408
1030812481182242176
59554605191633567744
500795339165746944
526822047503734272
-148049836110863968
792188376472389504
4832467854238955520
5507867501367943168
35297869394038775808
98053458231000760320
ACTIVO-CORRIENTE
14989580900437821440
4090322870922880512
20278658801469734912
24368978338497040384
8826418623538010112
8569498505857320960
17395916121425063936
6973063804833391616
24368993608115904512
14989580900437821440
109730388973705440
575383684351823680
260142103374024544
13811784884357466112
116005396962412912
112997436997619936
-60520390727177936
343436225104147648
1533970861123548160
1737109021995517696
9004962509424740352
24368987953220280320
ACTIVO-NO-CORRIENTE
83063833492260716544
20278658801469734912
146999345643685527552
167277996448732872704
60416239652250853376
60602237386459226112
121018474620137291786
46259525640088444938
167278062882195505152
83063833492260716544
623368042372728320
591112770440238720
1444869960350200832
81632414114376925184
721649531688583936
97147471062014912
-656711266281957504
118000177067851696
830093836140056960
1568535702808941312
53521126716475539456
167278049504988823552
ACTIVO-TOTAL
98053400798892933120
24368978338497040384
167277996448732872704
191646963468591661066
69242654086054461440
69171732322930081792
138414382984512045066
53232585881279971338
191647045173601042442
98053400798892933120
733098311037428992
1166494719437435136
1705011832100773888
95444188638044504064
837654830402120832
210144649486620288
-717231692249910784
461435252708797184
2364062307238216704
3305641791988486656
62526083319148273664
191647026141110534144
PASIVO-CORRIENTE
35943897292587687936
8826418623538010112
60416239652250853376
69242654086054461440
25141074252855205888
25015618734197874688
50156691715399491584
19085964379134201856
69242689070886723584
35943897292587687936
272614829466246528
524374977870532800
627421428058944768
35037976330987192320
304359430344961664
84275735139020224
-254561020387483936
77642872527806048
908137638551863168
1242907445393383424
22669162233361240064
69242682025635471360
PASIVO-LRG-PLAZO
35109934523863203840
8569498505857320960
60602237386459226112
69171732322930081792
25015618734197874688
25088854787575476224
50104472443734204416
19067261579810463744
69171761928457592832
35109934523863203840
264787181515704160
386082291349837824
614700340513622528
34360966099693375488
300140280653357056
58456990954351160
-265829246235385344
55303682622247816
585924754414528256
887620686359792896
22340292469329784832
69171755966324178944
PASIVO-TOTAL
71053827614056611840
17395916121425063936
121018474620137291786
138414382984512045066
50156691715399491584
50104472443734204416
100261161813385478144
38153224880253640704
138414447575450861578
71053827614056611840
537401974847002752
910456705317170560
1242121699003796736
69398939227611955200
604499680480282624
142732649580850832
-520390277492983040
132946205485684112
1494061669209462528
2130527246040965120
45009452914412707840
138414434567949615104
PATRIMONIO
26999579821037760512
6973063804833391616
46259525640088444938
53232585881279971338
19085964379134201856
19067261579810463744
38153224880253640704
15079362695128920064
53232602994437087232
26999579821037760512
195696393193927520
256038892153130272
462890242841924672
26045254446088159232
233155198064144672
67412109545549952
-196841402999568704
328489588317098496
870001775043004544
1175115948564747008
17516633224220196864
53232596969631760384
PASIVO+PATRIM
98053517456634200064
24368993608115904512
167278062882195505152
191647045173601042442
69242689070886723584
69171761928457592832
138414447575450861578
53232602994437087232
191647139473048797184
98053517456634200064
733099303395024256
1166510205530961408
1705013742621269760
95444276601693503498
837655668497720576
210146771459366848
-717231372973773952
461444998353787904
2364082430816380416
3305666399562345472
62526132800115408896
191647120443760115722
ING-OPERACIONES
64654261018221715456
14989580900437821440
83063833492260716544
98053400798892933120
35943897292587687936
35109934523863203840
71053827614056611840
26999579821037760512
98053517456634200064
64654261018221715456
547483418749453760
3595018295191505408
1030812481182242176
59554605191633567744
500795339165746944
526822047503734272
-148049836110863968
792188376472389504
4832467854238955520
5507867501367943168
35297869394038775808
98053458231000760320
ING-NO-OPERACIONALES
547483418749453760
109730388973705440
623368042372728320
733098311037428992
272614829466246528
264787181515704160
537401974847002752
195696393193927520
733099303395024256
547483418749453760
6756953928459890
40360006153942424
7558339290728099
501794084231917504
4440482408398533
5852938405761286
1409846671960618
4927971006691181
31484316668403128
36865709982077992
259679870441528480
733099103590440576
GAS-OPERACIONALES
3595018295191505408
575383684351823680
591112770440238720
1166494719437435136
524374977870532800
386082291349837824
910456705317170560
256038892153130272
1166510205530961408
3595018295191505408
40360006153942424
1077319838070754304
39104572050073008
2473705937638964224
20946127947109580
79549334829772512
36391244127383224
103383017572037040
611373507594444928
637187282245518720
887490748130197376
1166506036505419008
GAS-NO-OPERAC
1030812481182242176
260142103374024544
1444869960350200832
1705011832100773888
627421428058944768
614700340513622528
1242121699003796736
462890242841924672
1705013742621269760
1030812481182242176
7558339290728099
39104572050073008
24467303673585720
979759310011621504
8263870377344272
6145128884131491
-7129564394170284
18372580136775828
83166793710405296
101379609152128176
616845944274375168
1705013365504511744
COS-VEN
59554605191633567744
13811784884357466112
81632414114376925184
95444188638044504064
35037976330987192320
34360966099693375488
69398939227611955200
26045254446088159232
95444276601693503498
59554605191633567744
501794084231917504
2473705937638964224
979759310011621504
56493775137190854656
472882342264649920
431450052338086400
-185788727311017440
445247750908815040
3755073278675521536
4341889501003958784
33571946827146313728
95444224212932444160
GAS-IMP
500795339165746944
116005396962412912
721649531688583936
837654830402120832
304359430344961664
300140280653357056
604499680480282624
233155198064144672
837655668497720576
500795339165746944
4440482408398533
20946127947109580
8263870377344272
472882342264649920
4849456870994958
5691714524251682
-726034275954635
10259850686508052
23734292280932160
30093527633534704
285088091222406848
837655499750838272
UTIL-OPERACIONAL
526822047503734272
112997436997619936
97147471062014912
210144649486620288
84275735139020224
58456990954351160
142732649580850832
67412109545549952
210146771459366848
526822047503734272
5852938405761286
79549334829772512
6145128884131491
431450052338086400
5691714524251682
32570515698947324
14196880259993876
37532727094532728
111592820562707504
121347660076644896
160838082371429376
210145198237546848
UTIL-NETA
-148049836110863968
-60520390727177936
-656711266281957504
-717231692249910784
-254561020387483936
-265829246235385344
-520390277492983040
-196841402999568704
-717231372973773952
-148049836110863968
1409846671960618
36391244127383224
-7129564394170284
-185788727311017440
-726034275954635
14196880259993876
14792213867115886
10692217405622230
28073662704330144
23501907317354924
-205192742523716832
-717231521671697664
ACTIV_2019
792188376472389504
343436225104147648
118000177067851696
461435252708797184
77642872527806048
55303682622247816
132946205485684112
328489588317098496
461444998353787904
792188376472389504
4927971006691181
103383017572037040
18372580136775828
445247750908815040
10259850686508052
37532727094532728
10692217405622230
304183682571562240
399039288743840064
464770051080815296
474429583301868928
461442876987243520
ACTIV_2020
4832467854238955520
1533970861123548160
830093836140056960
2364062307238216704
908137638551863168
585924754414528256
1494061669209462528
870001775043004544
2364082430816380416
4832467854238955520
31484316668403128
611373507594444928
83166793710405296
3755073278675521536
23734292280932160
111592820562707504
28073662704330144
399039288743840064
1984495561612012032
2014557711342851584
2363055664277509632
2364078155998122496
ACTIV_2021
5507867501367943168
1737109021995517696
1568535702808941312
3305641791988486656
1242907445393383424
887620686359792896
2130527246040965120
1175115948564747008
3305666399562345472
5507867501367943168
36865709982077992
637187282245518720
101379609152128176
4341889501003958784
30093527633534704
121347660076644896
23501907317354924
464770051080815296
2014557711342851584
2132195979823006464
2765803819764941312
3305661056782542336
ACTIV_2022
35297869394038775808
9004962509424740352
53521126716475539456
62526083319148273664
22669162233361240064
22340292469329784832
45009452914412707840
17516633224220196864
62526132800115408896
35297869394038775808
259679870441528480
887490748130197376
616845944274375168
33571946827146313728
285088091222406848
160838082371429376
-205192742523716832
474429583301868928
2363055664277509632
2765803819764941312
21820003161410461696
62526122455050600458
ACTIV_2023
98053458231000760320
24368987953220280320
167278049504988823552
191647026141110534144
69242682025635471360
69171755966324178944
138414434567949615104
53232596969631760384
191647120443760115722
98053458231000760320
733099103590440576
1166506036505419008
1705013365504511744
95444224212932444160
837655499750838272
210145198237546848
-717231521671697664
461442876987243520
2364078155998122496
3305661056782542336
62526122455050600458
191647102361622216704
La matriz de varianzas y covarianzas no nos fue muy útil al momento de buscar una interpretación sobre las variables, pues, al ser variables relacionadas con millones de pesos y teniendo valores tan atípicos,no fue muy razonable utilizar estos resultados; pero decidimos mostrarla igualmente para mostrar más precisamente el por qué no nos fue útil.
Por otro lado, la correlación entre variables si nos dió información que podíamos interpretar con más facilidad:
El mapa de calor de la matriz de correlaciones nos da un adelanto de los resultados futuros: hay muchas variables que dependen entre sí y no aportan mucho a los ejes.
Ver código
library(knitr)library(kableExtra)library(FactoClass)# Calcular la matriz de correlacionesmatriz_cor <-cor(datos[, c(14, 17:37)])# Crear la tabla en HTML y mostrarla en el Viewerkable(matriz_cor, digits =2, format ="html") %>%kable_styling(full_width = F) %>%scroll_box(width ="800px", height ="500px") %>%as.character() %>% htmltools::HTML() %>% htmltools::browsable()
ING-TAM-EMPRESARIAL
ACTIVO-CORRIENTE
ACTIVO-NO-CORRIENTE
ACTIVO-TOTAL
PASIVO-CORRIENTE
PASIVO-LRG-PLAZO
PASIVO-TOTAL
PATRIMONIO
PASIVO+PATRIM
ING-OPERACIONES
ING-NO-OPERACIONALES
GAS-OPERACIONALES
GAS-NO-OPERAC
COS-VEN
GAS-IMP
UTIL-OPERACIONAL
UTIL-NETA
ACTIV_2019
ACTIV_2020
ACTIV_2021
ACTIV_2022
ACTIV_2023
ING-TAM-EMPRESARIAL
1.00
0.92
0.85
0.88
0.89
0.87
0.88
0.86
0.88
1.00
0.83
0.43
0.82
0.99
0.89
0.36
-0.15
0.18
0.43
0.47
0.94
0.88
ACTIVO-CORRIENTE
0.92
1.00
0.83
0.87
0.87
0.85
0.86
0.89
0.87
0.92
0.66
0.27
0.82
0.91
0.82
0.31
-0.25
0.31
0.54
0.59
0.95
0.87
ACTIVO-NO-CORRIENTE
0.85
0.83
1.00
1.00
0.99
1.00
1.00
0.98
1.00
0.85
0.63
0.05
0.76
0.90
0.85
0.04
-0.45
0.02
0.05
0.09
0.95
1.00
ACTIVO-TOTAL
0.88
0.87
1.00
1.00
1.00
1.00
1.00
0.99
1.00
0.88
0.64
0.08
0.79
0.92
0.87
0.08
-0.43
0.06
0.12
0.16
0.97
1.00
PASIVO-CORRIENTE
0.89
0.87
0.99
1.00
1.00
1.00
1.00
0.98
1.00
0.89
0.66
0.10
0.80
0.93
0.87
0.09
-0.42
0.03
0.13
0.17
0.97
1.00
PASIVO-LRG-PLAZO
0.87
0.85
1.00
1.00
1.00
1.00
1.00
0.98
1.00
0.87
0.64
0.07
0.78
0.91
0.86
0.06
-0.44
0.02
0.08
0.12
0.95
1.00
PASIVO-TOTAL
0.88
0.86
1.00
1.00
1.00
1.00
1.00
0.98
1.00
0.88
0.65
0.09
0.79
0.92
0.87
0.08
-0.43
0.02
0.11
0.15
0.96
1.00
PATRIMONIO
0.86
0.89
0.98
0.99
0.98
0.98
0.98
1.00
0.99
0.86
0.61
0.06
0.76
0.89
0.86
0.10
-0.42
0.15
0.16
0.21
0.97
0.99
PASIVO+PATRIM
0.88
0.87
1.00
1.00
1.00
1.00
1.00
0.99
1.00
0.88
0.64
0.08
0.79
0.92
0.87
0.08
-0.43
0.06
0.12
0.16
0.97
1.00
ING-OPERACIONES
1.00
0.92
0.85
0.88
0.89
0.87
0.88
0.86
0.88
1.00
0.83
0.43
0.82
0.99
0.89
0.36
-0.15
0.18
0.43
0.47
0.94
0.88
ING-NO-OPERACIONALES
0.83
0.66
0.63
0.64
0.66
0.64
0.65
0.61
0.64
0.83
1.00
0.47
0.59
0.81
0.78
0.39
0.14
0.11
0.27
0.31
0.68
0.64
GAS-OPERACIONALES
0.43
0.27
0.05
0.08
0.10
0.07
0.09
0.06
0.08
0.43
0.47
1.00
0.24
0.32
0.29
0.42
0.29
0.18
0.42
0.42
0.18
0.08
GAS-NO-OPERAC
0.82
0.82
0.76
0.79
0.80
0.78
0.79
0.76
0.79
0.82
0.59
0.24
1.00
0.83
0.76
0.22
-0.37
0.21
0.38
0.44
0.84
0.79
COS-VEN
0.99
0.91
0.90
0.92
0.93
0.91
0.92
0.89
0.92
0.99
0.81
0.32
0.83
1.00
0.90
0.32
-0.20
0.11
0.35
0.40
0.96
0.92
GAS-IMP
0.89
0.82
0.85
0.87
0.87
0.86
0.87
0.86
0.87
0.89
0.78
0.29
0.76
0.90
1.00
0.45
-0.09
0.27
0.24
0.30
0.88
0.87
UTIL-OPERACIONAL
0.36
0.31
0.04
0.08
0.09
0.06
0.08
0.10
0.08
0.36
0.39
0.42
0.22
0.32
0.45
1.00
0.65
0.38
0.44
0.46
0.19
0.08
UTIL-NETA
-0.15
-0.25
-0.45
-0.43
-0.42
-0.44
-0.43
-0.42
-0.43
-0.15
0.14
0.29
-0.37
-0.20
-0.09
0.65
1.00
0.16
0.16
0.13
-0.36
-0.43
ACTIV_2019
0.18
0.31
0.02
0.06
0.03
0.02
0.02
0.15
0.06
0.18
0.11
0.18
0.21
0.11
0.27
0.38
0.16
1.00
0.51
0.58
0.18
0.06
ACTIV_2020
0.43
0.54
0.05
0.12
0.13
0.08
0.11
0.16
0.12
0.43
0.27
0.42
0.38
0.35
0.24
0.44
0.16
0.51
1.00
0.98
0.36
0.12
ACTIV_2021
0.47
0.59
0.09
0.16
0.17
0.12
0.15
0.21
0.16
0.47
0.31
0.42
0.44
0.40
0.30
0.46
0.13
0.58
0.98
1.00
0.41
0.16
ACTIV_2022
0.94
0.95
0.95
0.97
0.97
0.95
0.96
0.97
0.97
0.94
0.68
0.18
0.84
0.96
0.88
0.19
-0.36
0.18
0.36
0.41
1.00
0.97
ACTIV_2023
0.88
0.87
1.00
1.00
1.00
1.00
1.00
0.99
1.00
0.88
0.64
0.08
0.79
0.92
0.87
0.08
-0.43
0.06
0.12
0.16
0.97
1.00
Es más fácil ver con esta matriz que hay valores con 1.00 que no necesariamente están en la diagonal, eso nos dice mucho sobre nuestros datos; indica una independencia que esperábamos inicialmente, pero que no sabíamos iba a ser un común denominador entre tantas variables.
Ahora, sabiendo esto, procedemos a realizar el análisis de componentes principales, para ver qué variables aportan más.
# Extraer información de las contribucionesvar_contrib <-get_pca_var(res.PCA)# Crear y mostrar tabla de contribuciones de variablescontrib_table <- var_contrib$contribkable(contrib_table, caption ="Contribuciones de las Variables en el PCA")
Contribuciones de las Variables en el PCA
Dim.1
Dim.2
Dim.3
Dim.4
Dim.5
ING-TAM-EMPRESARIAL
6.2721304
1.1090507
0.5996589
1.6875463
0.0218336
ACTIVO-CORRIENTE
5.9663488
1.1416668
2.3257646
0.0005751
1.3329571
ACTIVO-NO-CORRIENTE
6.1649282
2.3077861
0.0696050
0.4673464
0.0472336
ACTIVO-TOTAL
6.4080039
1.3791470
0.0000683
0.3626772
0.0004696
PASIVO-CORRIENTE
6.4482579
1.2708000
0.0321365
0.0443493
0.0957080
PASIVO-LRG-PLAZO
6.3024288
1.8311301
0.0553478
0.1652813
0.0008740
PASIVO-TOTAL
6.3878048
1.5411108
0.0430375
0.0953729
0.0196361
PATRIMONIO
6.2870966
0.9713784
0.2555018
1.8241711
0.1923583
PASIVO+PATRIM
6.4080079
1.3791313
0.0000683
0.3626763
0.0004701
ING-OPERACIONES
6.2721304
1.1090507
0.5996589
1.6875463
0.0218336
ING-NO-OPERACIONALES
3.7635730
2.0543178
11.8903979
1.9850170
0.5445171
GAS-OPERACIONALES
0.3955625
10.5461444
5.8997316
31.5303469
31.2837569
GAS-NO-OPERAC
4.9519898
0.1970896
2.3224838
1.0229471
0.0950954
COS-VEN
6.4559153
0.2490218
0.6824509
0.7375700
1.2270893
GAS-IMP
5.7101759
0.4323581
2.9104505
4.3870385
1.5986799
UTIL-OPERACIONAL
0.3807946
15.2456405
10.1079678
12.7464263
4.2997268
UTIL-NETA
0.6764792
11.5989736
22.2200630
7.3093776
4.9491140
ACTIV_2019
0.1877067
9.4826663
11.1300762
29.2009068
39.9863796
ACTIV_2020
0.6414300
17.3254999
13.5415673
2.6427503
9.0493436
ACTIV_2021
0.8542669
17.4469893
14.4839664
1.3707184
4.6905157
ACTIV_2022
6.6569622
0.0019101
0.8299286
0.0066831
0.5419375
ACTIV_2023
6.4080061
1.3791366
0.0000682
0.3626759
0.0004701
Ver código
# Extraer información de las distanciasvar_distances <-get_pca_var(res.PCA)$cos2# Crear y mostrar tabla de distanciasdistance_table <- var_distanceskable(distance_table, caption ="Distancias de las Variables a los Componentes Principales en el PCA")
Distancias de las Variables a los Componentes Principales en el PCA
Dim.1
Dim.2
Dim.3
Dim.4
Dim.5
ING-TAM-EMPRESARIAL
0.9237541
0.0393526
0.0087287
0.0145629
0.0001135
ACTIVO-CORRIENTE
0.8787189
0.0405099
0.0338542
0.0000050
0.0069280
ACTIVO-NO-CORRIENTE
0.9079655
0.0818875
0.0010132
0.0040330
0.0002455
ACTIVO-TOTAL
0.9437655
0.0489365
0.0000010
0.0031298
0.0000024
PASIVO-CORRIENTE
0.9496940
0.0450920
0.0004678
0.0003827
0.0004974
PASIVO-LRG-PLAZO
0.9282164
0.0649742
0.0008057
0.0014263
0.0000045
PASIVO-TOTAL
0.9407905
0.0546834
0.0006265
0.0008230
0.0001021
PATRIMONIO
0.9259583
0.0344675
0.0037191
0.0157419
0.0009998
PASIVO+PATRIM
0.9437660
0.0489359
0.0000010
0.0031298
0.0000024
ING-OPERACIONES
0.9237541
0.0393526
0.0087287
0.0145629
0.0001135
ING-NO-OPERACIONALES
0.5542959
0.0728936
0.1730786
0.0171299
0.0028301
GAS-OPERACIONALES
0.0582581
0.3742102
0.0858775
0.2720944
0.1625959
GAS-NO-OPERAC
0.7293249
0.0069934
0.0338065
0.0088276
0.0004943
COS-VEN
0.9508218
0.0088361
0.0099339
0.0063649
0.0063777
GAS-IMP
0.8409899
0.0153414
0.0423650
0.0378584
0.0083091
UTIL-OPERACIONAL
0.0560831
0.5409631
0.1471333
0.1099966
0.0223476
UTIL-NETA
0.0996313
0.4115679
0.3234390
0.0630770
0.0257228
ACTIV_2019
0.0276453
0.3364747
0.1620113
0.2519923
0.2078273
ACTIV_2020
0.0944693
0.6147630
0.1971133
0.0228059
0.0470335
ACTIV_2021
0.1258157
0.6190738
0.2108310
0.0118288
0.0243787
ACTIV_2022
0.9804318
0.0000678
0.0120806
0.0000577
0.0028167
ACTIV_2023
0.9437658
0.0489361
0.0000010
0.0031297
0.0000024
Ver código
var_coords <-get_pca_var(res.PCA)$coordcoords_table <- var_coordskable(coords_table, caption ="Coordenadas de las Variables en el PCA")
Ahora, vemos (en cada columna) la inercia de cada eje, qué tan representativo es cada uno y su acumulativo. Esto nos será útil para visualizar con cuántos ejes vamos a trabajar. En este caso trabajaremos con los tres primeros.
Proyección de las variables en los nuevos ejes
Ver código
plot.PCA(res.PCA,axes=c(1,2),choix='var')
Warning: ggrepel: 7 unlabeled data points (too many overlaps). Consider
increasing max.overlaps
Ver código
plot.PCA(res.PCA,axes=c(2,3),choix='var')
Warning: ggrepel: 11 unlabeled data points (too many overlaps). Consider
increasing max.overlaps
Ver código
plot.PCA(res.PCA,axes=c(1,3),choix='var')
Warning: ggrepel: 11 unlabeled data points (too many overlaps). Consider
increasing max.overlaps
Se realizó esta visualización para comprobar que tanto estaban afectando los datos atipicos a nuestro analisis. Como se puede observar las personas juridicas se llevan muy por encima a las personas naturales, por eso casi no se ven las elipses de el genero femenino ni la del masculino.
Dado a que no se puede hacer una analisis correcto por este medio, se realizara un ACP diferente para solo las personas naturales.
Personas naturales
Diagnostico inicial
Ver código
# Seleccionamos el archivo CSV ruta_archivo <-file.choose()# Carga el archivo CSVdatos_nat <-read.csv(ruta_archivo, sep =";")
RAZON_SOCIAL
GENERO
EMPREN-SOCIAL
NACIONALIDAD
DIR-COMERCIAL
MUN-COMERCIAL
CATEGORIA
ACTIVIDAD_ECONOMICA_PRINCIPAL
DOS_O_MAS_ACT_ECON
CANT-EST-BD
CANT-MUJERES
CANT-MUJERES-CAR-DIR
PORCENT-PART-MUJ
ING-TAM-EMPRESARIAL
ESTRATO
PERSONAL
ACTIVO-CORRIENTE
ACTIVO-NO-CORRIENTE
ACTIVO-TOTAL
PASIVO-CORRIENTE
PASIVO-LRG-PLAZO
PASIVO-TOTAL
PATRIMONIO
PASIVO+PATRIM
ING-OPERACIONES
ING-NO-OPERACIONALES
GAS-OPERACIONALES
GAS-NO-OPERAC
COS-VEN
GAS-IMP
UTIL-OPERACIONAL
UTIL-NETA
ACTIV_2019
ACTIV_2020
ACTIV_2021
ACTIV_2022
ACTIV_2023
NATURAL
F
S
COLOMBIANA
RURAL
05148 - CARMEN DE VIBORAL
AGROPECUARIA
AGRICULTURA
DOS O MÁS ACTIVIDADES ECONOMICAS
uno
0
0
0
0
5
0
2000000
0
2000000
0
0
0
2000000
2000000
0
0
0
0
0
0
0
0
0
0
0
0
2000000
NATURAL
F
N
COLOMBIANA
URBANO
05674-SAN VICENTE FERRER
AGROPECUARIA
AGRICULTURA
DOS O MÁS ACTIVIDADES ECONOMICAS
uno
0
0
0
72850000
6
0
3000000
0
3000000
0
0
0
3000000
3000000
72850000
0
0
0
0
0
0
0
0
0
3000000
3000000
3000000
NATURAL
M
N
COLOMBIANA
RURAL
05541 - EL PENOL
AGROPECUARIA
GANADERÍA
DOS O MÁS ACTIVIDADES ECONOMICAS
uno
0
0
0
0
6
0
1000000
0
1000000
0
0
0
1000000
1000000
0
0
0
0
0
0
0
0
0
0
0
0
1000000
NATURAL
M
N
COLOMBIANA
URBANO
05318 - GUARNE
AGROPECUARIA
GANADERÍA
DOS O MÁS ACTIVIDADES ECONOMICAS
uno
0
0
0
170000000
6
3
4200000
0
4200000
0
0
0
4200000
4200000
170000000
0
0
0
0
0
0
0
2500000
3100000
3400000
3900000
4200000
NATURAL
F
N
COLOMBIANA
URBANO
05148 - CARMEN DE VIBORAL
AGROPECUARIA
GANADERÍA
DOS O MÁS ACTIVIDADES ECONOMICAS
uno
0
0
0
300
6
0
1000000
0
1000000
0
0
0
1000000
1000000
300
0
0
0
0
0
0
0
0
1000000
1100000
1000000
1000000
NATURAL
M
N
COLOMBIANA
URBANO
05440 - MARINILLA
AUDIOVISUAL
OTROS
DOS O MÁS ACTIVIDADES ECONOMICAS
uno
0
0
0
40000000
5
0
3000000
0
3000000
0
0
0
3000000
3000000
40000000
0
0
0
0
0
0
0
5500000
3000000
3000000
3000000
3000000
Ver código
suppressWarnings({suppressMessages({library(plotly)library(readxl)library(dplyr)})})# Desactivar notación científicaoptions(scipen =999)# Especifica la ruta del archivo Excelarchivo_excel <-"C:/Users/catam/OneDrive/Escritorio/NATURALES.xlsx"# Leer los datos desde Excel sin especificar col_typesdat_nat <-read_excel(archivo_excel)# Función para limpiar y convertir las columnas a numéricasclean_and_convert <-function(df) { df[] <-lapply(df, function(column) {if (is.character(column)) { column <-gsub(",", "", column) # Eliminar comas column <-gsub(" ", "", column) # Eliminar espacios column <-as.numeric(column) # Convertir a numérico }return(column) })return(df)}# Aplicar la función a las columnas numéricas# Identifica las columnas que deberían ser numéricas (aquí se asume que las columnas de la 14 a la 37 deberían ser numéricas)columnas_numericas <-c(14,17:37)dat_nat[, columnas_numericas] <-clean_and_convert(dat_nat[, columnas_numericas])dat_nat$`CANT-EST-BD`<-as.factor(dat_nat$`CANT-EST-BD`)dat_nat$GENERO <-as.factor(dat_nat$GENERO)dat_nat$RAZON_SOCIAL <-as.factor(dat_nat$RAZON_SOCIAL)dat_nat$`EMPREN-SOCIAL`<-as.factor(dat_nat$`EMPREN-SOCIAL`)dat_nat$NACIONALIDAD <-as.factor(dat_nat$NACIONALIDAD)dat_nat$`DIR-COMERCIAL`<-as.factor(dat_nat$`DIR-COMERCIAL`)dat_nat$`MUN-COMERCIAL`<-as.factor(dat_nat$`MUN-COMERCIAL`)dat_nat$CATEGORIA <-as.factor(dat_nat$CATEGORIA)dat_nat$ACTIVIDAD_ECONOMICA_PRINCIPAL <-as.factor(dat_nat$ACTIVIDAD_ECONOMICA_PRINCIPAL)dat_nat$DOS_O_MAS_ACT_ECON <-as.factor(dat_nat$DOS_O_MAS_ACT_ECON)dat_nat$`CANT-MUJERES`<-as.factor(dat_nat$`CANT-MUJERES`)dat_nat$`CANT-MUJERES-CAR-DIR`<-as.factor(dat_nat$`CANT-MUJERES-CAR-DIR`)dat_nat$`PORCENT-PART-MUJ`<-as.factor(dat_nat$`PORCENT-PART-MUJ`)dat_nat$ESTRATO <-as.factor(dat_nat$ESTRATO)dat_nat$PERSONAL <-as.factor(dat_nat$PERSONAL)# Muestra el resumen de los datos importadossummary(dat_nat)
RAZON_SOCIAL GENERO EMPREN-SOCIAL NACIONALIDAD DIR-COMERCIAL
NATURAL:594 F:286 N:547 COLOMBIANA:587 RURAL :162
M:308 S: 47 OTRO : 7 URBANO:432
MUN-COMERCIAL CATEGORIA
05615 - RIONEGRO :147 ELABORACION DE PRODUCTOS DE CONSUMO:492
05440 - MARINILLA : 76 HOTELERÍA Y TURISMO : 56
05148 - CARMEN DE VIBORAL: 65 COMERCIO : 30
05376 - LA CEJA : 54 AGROPECUARIA : 5
05318 - GUARNE : 48 RECREACION : 4
05697 - SANTUARIO : 24 AUDIOVISUAL : 2
(Other) :180 (Other) : 5
ACTIVIDAD_ECONOMICA_PRINCIPAL DOS_O_MAS_ACT_ECON
ELABORACION PANADERIA :241 DOS O MÁS ACTIVIDADES ECONOMICAS:363
PRODUCTOS ALIMENTICIOS: 62 N/A :231
PROCESADOS ANIMALES : 49
ELABORACION DE COMIDA : 47
PRODUCTOS DE MOLINERIA: 31
POR MENOR : 28
(Other) :136
CANT-EST-BD CANT-MUJERES CANT-MUJERES-CAR-DIR PORCENT-PART-MUJ
cero : 48 0 :447 0:594 0:594
dos_o_mas: 14 1 : 83
uno :532 2 : 37
3 : 15
4 : 4
5 : 3
(Other): 5
ING-TAM-EMPRESARIAL ESTRATO PERSONAL ACTIVO-CORRIENTE
Min. : 0 1:410 0 :381 Min. : 0
1st Qu.: 0 2: 2 1 :100 1st Qu.: 1600000
Median : 9300000 3: 1 2 : 52 Median : 3130000
Mean : 49730165 4: 1 3 : 23 Mean : 8100834
3rd Qu.: 36000000 5:128 4 : 15 3rd Qu.: 8242500
Max. :5720881000 6: 52 5 : 10 Max. :706777000
(Other): 13
ACTIVO-NO-CORRIENTE ACTIVO-TOTAL PASIVO-CORRIENTE PASIVO-LRG-PLAZO
Min. : 0 Min. : 0 Min. : 0 Min. : 0
1st Qu.: 0 1st Qu.: 1900000 1st Qu.: 0 1st Qu.: 0
Median : 0 Median : 3500000 Median : 0 Median : 0
Mean : 1165711 Mean : 9278750 Mean : 1388282 Mean : 51088
3rd Qu.: 0 3rd Qu.: 9000000 3rd Qu.: 0 3rd Qu.: 0
Max. :231266000 Max. :938043000 Max. :367530000 Max. :9587000
PASIVO-TOTAL PATRIMONIO PASIVO+PATRIM
Min. : 0 Min. : 0 Min. : 0
1st Qu.: 0 1st Qu.: 1300000 1st Qu.: 1900000
Median : 0 Median : 3000000 Median : 3500000
Mean : 1444659 Mean : 7826271 Mean : 9278750
3rd Qu.: 0 3rd Qu.: 8000000 3rd Qu.: 9000000
Max. :367530000 Max. :604967325 Max. :938043000
ING-OPERACIONES ING-NO-OPERACIONALES GAS-OPERACIONALES
Min. : 0 Min. : 0 Min. : 0
1st Qu.: 0 1st Qu.: 0 1st Qu.: 0
Median : 9300000 Median : 0 Median : 0
Mean : 49730165 Mean : 89831 Mean : 6749619
3rd Qu.: 36000000 3rd Qu.: 0 3rd Qu.: 0
Max. :5720881000 Max. :28358000 Max. :2351202000
GAS-NO-OPERAC COS-VEN GAS-IMP
Min. : 0 Min. : 0 Min. : 0
1st Qu.: 0 1st Qu.: 0 1st Qu.: 0
Median : 0 Median : 0 Median : 0
Mean : 531234 Mean : 31938387 Mean : 226587
3rd Qu.: 0 3rd Qu.: 0 3rd Qu.: 0
Max. :121203000 Max. :7200000000 Max. :59629000
UTIL-OPERACIONAL UTIL-NETA ACTIV_2019
Min. :-23200000 Min. :-23200000 Min. : 0
1st Qu.: 0 1st Qu.: 0 1st Qu.: 0
Median : 0 Median : 0 Median : 0
Mean : 2253259 Mean : 1568277 Mean : 2904919
3rd Qu.: 0 3rd Qu.: 0 3rd Qu.: 1737500
Max. :338606000 Max. :186132000 Max. :470937000
ACTIV_2020 ACTIV_2021 ACTIV_2022
Min. : 0 Min. : 0 Min. : 0
1st Qu.: 0 1st Qu.: 0 1st Qu.: 17750
Median : 0 Median : 1185000 Median : 2250000
Mean : 3543864 Mean : 4338535 Mean : 6543159
3rd Qu.: 3000000 3rd Qu.: 4537500 3rd Qu.: 6011275
Max. :428599117 Max. :379325000 Max. :509312000
ACTIV_2023
Min. : 0
1st Qu.: 1800000
Median : 3500000
Mean : 9310628
3rd Qu.: 8950050
Max. :938043000
En este breve resumen vemos que algunas variables categóricas como la nacionalidad cambió, pues eran muy pocas las personas con nacionalidad extranjera en comparación a las colombianas, la cantidad de mujeres en cargos directivos y el porcentaje de participación de mujeres en estos cargos, por ejemplo, también puede interpretarse con facilidad, pues su único valor es 0. Por otro lado, en cuanto a las variables cuantitativas, vemos que se han reducido de manera evidente algunos valores que antes estaban disparados, como lo son los máximos en Activos, Pasivos, Ingresos, etc. Por supuesto que aún hay valores atípicos, pero no de manera tan drástica como anteriormente. También podemos ver que se siguen presentando varios percentiles de tercer orden en 0, lo que nos puede llegar a decir información a futuro de este grupo de empresarios.
En cuanto a género, podemos ver una paridad notable, lo que nos sugiere que al momento de responer la encuesta, aquellas mujeres cabezas de emprendimientos o autoras, no se consideraron como cargo directivo al ser únicas dueñas y/o empleadas y que posiblemente las preguntas tenían una redacción confusa.
Rionegro sigue siendo el que cuenta con más emprendimientos registrados, pero ya vemos municipios como Marinilla, Carmen de Viboral y La Ceja dandonos un poco más de presencia que antes con la base de datos de personas naturales y jurídicas juntas.
Se mantiene que las personas naturales siguen optando por dirigir su empresa hacia zonas urbanas, por efectos de comercio y distribución efectiva y accequible.
En el estrato optamos por no agrupar aún la categoría para que se visualizara con facilidad que el estrato 1 es aquel que sobrepasa por mucho a los demás.
La elaboración de productos de consumo es la categoría que más eligen los oriente antioqueños interesados en el área de alimentación al momento de empezar su negocio vinculado a los alimentos.
Ver código
fig <-plot_ly(dat_nat, x=~DOS_O_MAS_ACT_ECON, type='histogram', marker =list(color ='#76EEC6')) fig <- fig %>%layout(title ="DOS O MÁS ACTIVIDADES ECONÓMICAS",xaxis=list((title="Actividad")), yaxis=list(title='Frec. abs.')) fig
Que tengan dos o más actividades económicas nos indica que las personas optan por ofrecer diferentes tipos de servicios en un mismo establecimiento como forma de proyección a futuro de ampliarse como empresa.
En el oriente antioqueño no parecen faltar buenas paanderías y empresas que relacionen su comercio al consumo de productos alimenticios (antes que el expendio de comidas, por ejemplo).
Esta variable reafirma que la gran mayoría de individuos de este grupo se caracteriza por tener su propia empresa y dedicarse exclusivamente a ella, sin ningún tipo de apoyo laboral.
Pocas empresas cuentan con personal femenino en sus empresas, a pesar de que este sector ha sido afianzado con una destreza con las mujeres por el tema de la sazón, el conocimiento y demás tardiciones, no se evidencia que hayan muchas mujeres dentro de estas empresas.
Ver código
fig <-plot_ly(dat_nat, x=~`EMPREN-SOCIAL`, type='histogram', marker =list(color ='#76EEC6')) fig <- fig %>%layout(title ="ASPIRA O NO A FRANQUICIA", xaxis=list((title="Franquiciado")), yaxis=list(title='Frec. abs.')) fig
Las personas naturales no aspiran a adquirir el título de franquiciados en el oriente antioqueño. ¿será que es únicamente en el oriente antioqueño?¿será más psoible que se trate de un común denominador en el país por algún tipo de impedimento económico o consecuencia legal/fiscal como declarantes ante la cámara de comercio?
De las 594 personas naturales, sólo 48 no cuentan con establecimientos físicos para su negocio. Consideramos esto como una presencia de empresas movidas por redes sociales, incluso voz a voz.
Diagramas variables cuantitativas
Ver código
# Creación del gráfico de caja y bigotes con ajustes de visualizaciónfig <-plot_ly(data = dat_nat, y =~`ING-TAM-EMPRESARIAL`, # Cambiado a 'y' para un gráfico verticaltype ='box',boxpoints ='all', # Muestra todos los puntos de datosjitter =0.3, # Dispersión de los puntos de datospointpos =-1.8, # Posición de los puntos de datosmarker =list(color ='#54FF9F'), # Color de los puntos de datosline =list(color ='black') # Color de las líneas de las cajas)# Ajuste del diseño del gráficofig <- fig %>%layout(title ="Distribución de los Ingresos", yaxis =list(title ="Ingresos (COP)", # Etiqueta del eje Y con formato en COPzeroline =FALSE,tickprefix ="$", # Prefijo de pesos colombianostickformat =",.0f"# Formato de los ticks (sin decimales) ),showlegend =FALSE# Ocultar la leyenda si no es necesaria)# Mostrar el gráficofig
Ver código
# Creación del gráfico de caja y bigotes con la variable 'ACTIVO-TOTAL'fig <-plot_ly(data = dat_nat, y =~`ACTIVO-TOTAL`, # Cambiado a 'y' para un gráfico verticaltype ='box',boxpoints ='all', # Muestra todos los puntos de datosjitter =0.3, # Dispersión de los puntos de datospointpos =-1.8, # Posición de los puntos de datosmarker =list(color ='#54FF9F'), # Color de los puntos de datosline =list(color ='black') # Color de las líneas de las cajas)# Ajuste del diseño del gráficofig <- fig %>%layout(title ="ACTIVO TOTAL", yaxis =list(title ="Activo Total (COP)", # Etiqueta del eje Y con formato en COPzeroline =FALSE,tickprefix ="$", # Prefijo de pesos colombianostickformat =",.0f"# Formato de los ticks (sin decimales) ),showlegend =FALSE# Ocultar la leyenda si no es necesaria)# Mostrar el gráficofig
Ver código
# Creación del gráfico de caja y bigotes con la variable 'ACTIVO-CORRIENTE'fig <-plot_ly(data = dat_nat, y =~`ACTIVO-CORRIENTE`, # Cambiado a 'y' para un gráfico verticaltype ='box',boxpoints ='all', # Muestra todos los puntos de datosjitter =0.3, # Dispersión de los puntos de datospointpos =-1.8, # Posición de los puntos de datosmarker =list(color ='#54FF9F'), # Color de los puntos de datosline =list(color ='black') # Color de las líneas de las cajas)# Ajuste del diseño del gráficofig <- fig %>%layout(title ="ACTIVO CORRIENTE", yaxis =list(title ="Activo Corriente (COP)", # Etiqueta del eje Y con formato en COPzeroline =FALSE,tickprefix ="$", # Prefijo de pesos colombianostickformat =",.0f"# Formato de los ticks (sin decimales) ),showlegend =FALSE# Ocultar la leyenda si no es necesaria)# Mostrar el gráficofig
Ver código
# Creación del gráfico de caja y bigotes con la variable 'PASIVO-TOTAL'fig <-plot_ly(data = dat_nat, y =~`PASIVO-TOTAL`, # Cambiado a 'y' para un gráfico verticaltype ='box',boxpoints ='all', # Muestra todos los puntos de datosjitter =0.3, # Dispersión de los puntos de datospointpos =-1.8, # Posición de los puntos de datosmarker =list(color ='#54FF9F'), # Color de los puntos de datosline =list(color ='black') # Color de las líneas de las cajas)# Ajuste del diseño del gráficofig <- fig %>%layout(title ="PASIVO TOTAL", yaxis =list(title ="Pasivo Total (COP)", # Etiqueta del eje Y con formato en COPzeroline =FALSE,tickprefix ="$", # Prefijo de pesos colombianostickformat =",.0f"# Formato de los ticks (sin decimales) ),showlegend =FALSE# Ocultar la leyenda si no es necesaria)# Mostrar el gráficofig
Ver código
# Creación del gráfico de caja y bigotes con la variable 'PATRIMONIO'fig <-plot_ly(data = dat_nat, y =~PATRIMONIO, # Cambiado a 'y' para un gráfico verticaltype ='box',boxpoints ='all', # Muestra todos los puntos de datosjitter =0.3, # Dispersión de los puntos de datospointpos =-1.8, # Posición de los puntos de datosmarker =list(color ='#54FF9F'), # Color de los puntos de datosline =list(color ='black') # Color de las líneas de las cajas)# Ajuste del diseño del gráficofig <- fig %>%layout(title ="PATRIMONIO", yaxis =list(title ="Patrimonio (COP)", # Etiqueta del eje Y con formato en COPzeroline =FALSE,tickprefix ="$", # Prefijo de pesos colombianostickformat =",.0f"# Formato de los ticks (sin decimales) ),showlegend =FALSE# Ocultar la leyenda si no es necesaria)# Mostrar el gráficofig
Ver código
# Creación del gráfico de caja y bigotes con la variable 'ING-OPERACIONES'fig <-plot_ly(data = dat_nat, y =~`ING-OPERACIONES`, # Cambiado a 'y' para un gráfico verticaltype ='box',boxpoints ='all', # Muestra todos los puntos de datosjitter =0.3, # Dispersión de los puntos de datospointpos =-1.8, # Posición de los puntos de datosmarker =list(color ='#54FF9F'), # Color de los puntos de datosline =list(color ='black') # Color de las líneas de las cajas)# Ajuste del diseño del gráficofig <- fig %>%layout(title ="INGRESOS OPERACIONALES", yaxis =list(title ="Ingresos Operacionales (COP)", # Etiqueta del eje Y con formato en COPzeroline =FALSE,tickprefix ="$", # Prefijo de pesos colombianostickformat =",.0f"# Formato de los ticks (sin decimales) ),showlegend =FALSE# Ocultar la leyenda si no es necesaria)# Mostrar el gráficofig
Ver código
# Creación del gráfico de caja y bigotes con la variable 'GAS-OPERACIONALES'fig <-plot_ly(data = dat_nat, y =~`GAS-OPERACIONALES`, # Cambiado a 'y' para un gráfico verticaltype ='box',boxpoints ='all', # Muestra todos los puntos de datosjitter =0.3, # Dispersión de los puntos de datospointpos =-1.8, # Posición de los puntos de datosmarker =list(color ='#54FF9F'), # Color de los puntos de datosline =list(color ='black') # Color de las líneas de las cajas)# Ajuste del diseño del gráficofig <- fig %>%layout(title ="GASTOS OPERACIONALES", yaxis =list(title ="Gastos Operacionales (COP)", # Etiqueta del eje Y con formato en COPzeroline =FALSE,tickprefix ="$", # Prefijo de pesos colombianostickformat =",.0f"# Formato de los ticks (sin decimales) ),showlegend =FALSE# Ocultar la leyenda si no es necesaria)# Mostrar el gráficofig
Ver código
# Creación del gráfico de caja y bigotes con la variable 'GAS-NO-OPERAC'fig <-plot_ly(data = dat_nat, y =~`GAS-NO-OPERAC`, # Cambiado a 'y' para un gráfico verticaltype ='box',boxpoints ='all', # Muestra todos los puntos de datosjitter =0.3, # Dispersión de los puntos de datospointpos =-1.8, # Posición de los puntos de datosmarker =list(color ='#54FF9F'), # Color de los puntos de datosline =list(color ='black') # Color de las líneas de las cajas)# Ajuste del diseño del gráficofig <- fig %>%layout(title ="GASTOS NO OPERACIONALES", yaxis =list(title ="Gastos No Operacionales (COP)", # Etiqueta del eje Y con formato en COPzeroline =FALSE,tickprefix ="$", # Prefijo de pesos colombianostickformat =",.0f"# Formato de los ticks (sin decimales) ),showlegend =FALSE# Ocultar la leyenda si no es necesaria)# Mostrar el gráficofig
Ver código
# Creación del gráfico de caja y bigotes con la variable 'COS-VEN'fig <-plot_ly(data = dat_nat, y =~`COS-VEN`, # Cambiado a 'y' para un gráfico verticaltype ='box',boxpoints ='all', # Muestra todos los puntos de datosjitter =0.3, # Dispersión de los puntos de datospointpos =-1.8, # Posición de los puntos de datosmarker =list(color ='#54FF9F'), # Color de los puntos de datosline =list(color ='black') # Color de las líneas de las cajas)# Ajuste del diseño del gráficofig <- fig %>%layout(title ="GASTOS", yaxis =list(title ="Gastos (COP)", # Etiqueta del eje Y con formato en COPzeroline =FALSE,tickprefix ="$", # Prefijo de pesos colombianostickformat =",.0f"# Formato de los ticks (sin decimales) ),showlegend =FALSE# Ocultar la leyenda si no es necesaria)# Mostrar el gráficofig
Ver código
# Creación del gráfico de caja y bigotes con la variable 'GAS-IMP'fig <-plot_ly(data = dat_nat, y =~`GAS-IMP`, # Cambiado a 'y' para un gráfico verticaltype ='box',boxpoints ='all', # Muestra todos los puntos de datosjitter =0.3, # Dispersión de los puntos de datospointpos =-1.8, # Posición de los puntos de datosmarker =list(color ='#54FF9F'), # Color de los puntos de datosline =list(color ='black') # Color de las líneas de las cajas)# Ajuste del diseño del gráficofig <- fig %>%layout(title ="GASTO EN IMPUESTOS", yaxis =list(title ="Gasto en Impuestos (COP)", # Etiqueta del eje Y con formato en COPzeroline =FALSE,tickprefix ="$", # Prefijo de pesos colombianostickformat =",.0f"# Formato de los ticks (sin decimales) ),showlegend =FALSE# Ocultar la leyenda si no es necesaria)# Mostrar el gráficofig
Ver código
# Creación del gráfico de caja y bigotes con la variable 'UTIL-OPERACIONAL'fig <-plot_ly(data = dat_nat, y =~`UTIL-OPERACIONAL`, # Cambiado a 'y' para un gráfico verticaltype ='box',boxpoints ='all', # Muestra todos los puntos de datosjitter =0.3, # Dispersión de los puntos de datospointpos =-1.8, # Posición de los puntos de datosmarker =list(color ='#54FF9F'), # Color de los puntos de datosline =list(color ='black') # Color de las líneas de las cajas)# Ajuste del diseño del gráficofig <- fig %>%layout(title ="UTILIDAD OPERACIONAL", yaxis =list(title ="Utilidad Operacional (COP)", # Etiqueta del eje Y con formato en COPzeroline =FALSE,tickprefix ="$", # Prefijo de pesos colombianostickformat =",.0f"# Formato de los ticks (sin decimales) ),showlegend =FALSE# Ocultar la leyenda si no es necesaria)# Mostrar el gráficofig
Ver código
# Creación del gráfico de caja y bigotes con la variable 'UTIL-NETA'fig <-plot_ly(data = dat_nat, y =~`UTIL-NETA`, # Cambiado a 'y' para un gráfico verticaltype ='box',boxpoints ='all', # Muestra todos los puntos de datosjitter =0.3, # Dispersión de los puntos de datospointpos =-1.8, # Posición de los puntos de datosmarker =list(color ='#54FF9F'), # Color de los puntos de datosline =list(color ='black') # Color de las líneas de las cajas)# Ajuste del diseño del gráficofig <- fig %>%layout(title ="UTILIDAD NETA", yaxis =list(title ="Utilidad Neta (COP)", # Etiqueta del eje Y con formato en COPzeroline =FALSE,tickprefix ="$", # Prefijo de pesos colombianostickformat =",.0f"# Formato de los ticks (sin decimales) ),showlegend =FALSE# Ocultar la leyenda si no es necesaria)# Mostrar el gráficofig
Ver código
# Creación del gráfico de caja y bigotes con la variable 'ACTIV_2019'fig <-plot_ly(data = dat_nat, y =~`ACTIV_2019`, # Cambiado a 'y' para un gráfico verticaltype ='box',boxpoints ='all', # Muestra todos los puntos de datosjitter =0.3, # Dispersión de los puntos de datospointpos =-1.8, # Posición de los puntos de datosmarker =list(color ='#54FF9F'), # Color de los puntos de datosline =list(color ='black') # Color de las líneas de las cajas)# Ajuste del diseño del gráficofig <- fig %>%layout(title ="ACTIVOS 2019", yaxis =list(title ="Activos 2019 (COP)", # Etiqueta del eje Y con formato en COPzeroline =FALSE,tickprefix ="$", # Prefijo de pesos colombianostickformat =",.0f"# Formato de los ticks (sin decimales) ),showlegend =FALSE# Ocultar la leyenda si no es necesaria)# Mostrar el gráficofig
Ver código
# Creación del gráfico de caja y bigotes con la variable 'ACTIV_2020'fig <-plot_ly(data = dat_nat, y =~`ACTIV_2020`, # Cambiado a 'y' para un gráfico verticaltype ='box',boxpoints ='all', # Muestra todos los puntos de datosjitter =0.3, # Dispersión de los puntos de datospointpos =-1.8, # Posición de los puntos de datosmarker =list(color ='#54FF9F'), # Color de los puntos de datosline =list(color ='black') # Color de las líneas de las cajas)# Ajuste del diseño del gráficofig <- fig %>%layout(title ="ACTIVOS 2020", yaxis =list(title ="Activos 2020 (COP)", # Etiqueta del eje Y con formato en COPzeroline =FALSE,tickprefix ="$", # Prefijo de pesos colombianostickformat =",.0f"# Formato de los ticks (sin decimales) ),showlegend =FALSE# Ocultar la leyenda si no es necesaria)# Mostrar el gráficofig
Ver código
# Creación del gráfico de caja y bigotes con la variable 'ACTIV_2021'fig <-plot_ly(data = dat_nat, y =~`ACTIV_2021`, # Cambiado a 'y' para un gráfico verticaltype ='box',boxpoints ='all', # Muestra todos los puntos de datosjitter =0.3, # Dispersión de los puntos de datospointpos =-1.8, # Posición de los puntos de datosmarker =list(color ='#54FF9F'), # Color de los puntos de datosline =list(color ='black') # Color de las líneas de las cajas)# Ajuste del diseño del gráficofig <- fig %>%layout(title ="ACTIVOS 2021", yaxis =list(title ="Activos 2021 (COP)", # Etiqueta del eje Yzeroline =FALSE,tickprefix ="$", # Prefijo de pesos colombianostickformat =",.0f"# Formato de los ticks (sin decimales) ),showlegend =FALSE# Ocultar la leyenda si no es necesaria)# Mostrar el gráficofig
Ver código
# Creación del gráfico de caja y bigotes con la variable 'ACTIV_2022'fig <-plot_ly(data = dat_nat, y =~`ACTIV_2022`, # Cambiado a 'y' para un gráfico verticaltype ='box',boxpoints ='all', # Muestra todos los puntos de datosjitter =0.3, # Dispersión de los puntos de datospointpos =-1.8, # Posición de los puntos de datosmarker =list(color ='#54FF9F'), # Color de los puntos de datosline =list(color ='black') # Color de las líneas de las cajas)# Ajuste del diseño del gráficofig <- fig %>%layout(title ="ACTIVOS 2022", yaxis =list(title ="Activos 2022 (COP)", zeroline =FALSE,tickprefix ="$", # Prefijo de pesos colombianostickformat =",.0f"# Formato de los ticks (sin decimales) ),showlegend =FALSE# Ocultar la leyenda si no es necesaria)# Mostrar el gráficofig
Ver código
# Creación del gráfico de caja y bigotes con la variable 'ACTIV_2023'fig <-plot_ly(data = dat_nat, y =~`ACTIV_2023`, # Cambiado a 'y' para un gráfico verticaltype ='box',boxpoints ='all', # Muestra todos los puntos de datosjitter =0.3, # Dispersión de los puntos de datospointpos =-1.8, # Posición de los puntos de datosmarker =list(color ='#54FF9F'), # Color de los puntos de datosline =list(color ='black') # Color de las líneas de las cajas)# Ajuste del diseño del gráficofig <- fig %>%layout(title ="ACTIVOS 2023", yaxis =list(title ="Activos 2023 (COP)", zeroline =FALSE,tickprefix ="$", # Prefijo de pesos colombianostickformat =",.0f"# Formato de los ticks (sin decimales) ),showlegend =FALSE# Ocultar la leyenda si no es necesaria)# Mostrar el gráficofig
Análisis Bivariado
Ver código
library(knitr)library(kableExtra)# Calcular la matriz de varianzas y covarianzas poblacionaln <-nrow(dat_nat)matriz_cov <-var(dat_nat[, c(14, 17:37)]) * (n -1) / n# Crear la tabla en HTML y mostrarla en el Viewerkable(matriz_cov, digits =2, format ="html") %>%kable_styling(full_width = F) %>%scroll_box(width ="800px", height ="500px") %>%as.character() %>% htmltools::HTML() %>% htmltools::browsable()
library(knitr)library(kableExtra)library(FactoClass)# Calcular la matriz de correlacionesmatriz_cor <-cor(dat_nat[, c(14, 17:37)])# Crear la tabla en HTML y mostrarla en el Viewerkable(matriz_cor, digits =2, format ="html") %>%kable_styling(full_width = F) %>%scroll_box(width ="800px", height ="500px") %>%as.character() %>% htmltools::HTML() %>% htmltools::browsable()
# Extraer información de las contribucionesvar_contrib <-get_pca_var(nat.PCA)# Crear y mostrar tabla de contribuciones de variablescontrib_table <- var_contrib$contribkable(contrib_table, caption ="Contribuciones de las Variables en el PCA")
Contribuciones de las Variables en el PCA
Dim.1
Dim.2
Dim.3
Dim.4
Dim.5
ING-TAM-EMPRESARIAL
5.3587189
0.2916496
0.3075623
0.2458512
0.0035200
ACTIVO-CORRIENTE
5.3661695
1.9857821
0.0728256
1.9021315
0.0086109
ACTIVO-NO-CORRIENTE
5.2432682
0.0726490
0.0504661
0.1491580
0.3341154
ACTIVO-TOTAL
5.5457722
1.3514258
0.0244035
1.3628238
0.0446119
PASIVO-CORRIENTE
5.0167565
5.0866684
0.2445600
0.5591316
0.7926481
PASIVO-LRG-PLAZO
0.3145957
21.9390610
32.2204068
41.2041439
0.0240702
PASIVO-TOTAL
5.0782691
4.2736923
0.5063793
0.9851603
0.7764271
PATRIMONIO
4.8248248
6.2703584
0.2811208
4.1237268
0.0112607
PASIVO+PATRIM
5.5457722
1.3514258
0.0244035
1.3628238
0.0446119
ING-OPERACIONES
5.3587189
0.2916496
0.3075623
0.2458512
0.0035200
ING-NO-OPERACIONALES
2.8109441
7.5463465
0.4305510
0.8172833
83.1168240
GAS-OPERACIONALES
5.0566535
5.0259474
0.2689868
0.3602460
0.2152277
GAS-NO-OPERAC
4.0966348
4.0429825
1.9239189
4.0213688
2.5766553
COS-VEN
1.4452277
2.4311668
62.4408382
32.7582496
0.0508932
GAS-IMP
4.7430186
1.4360080
0.0030795
2.6336869
0.1191147
UTIL-OPERACIONAL
5.2477101
1.8154053
0.0387309
0.1643701
3.9022531
UTIL-NETA
4.4965897
6.7958060
0.1230834
0.3930026
0.2734777
ACTIV_2019
4.6090467
8.2502081
0.1871493
0.7936963
1.8922415
ACTIV_2020
4.6680692
7.1210043
0.3157377
1.1972581
2.5104984
ACTIV_2021
4.6171420
6.3595199
0.1378986
1.3308384
3.2131815
ACTIV_2022
5.0206028
4.9208752
0.0749604
1.9782589
0.0402440
ACTIV_2023
5.5354945
1.3403681
0.0153750
1.4109388
0.0459927
Ver código
# Extraer información de las distanciasvar_distances <-get_pca_var(nat.PCA)$cos2# Crear y mostrar tabla de distanciasdistance_table <- var_distanceskable(distance_table, caption ="Distancias de las Variables a los Componentes Principales en el PCA")
Distancias de las Variables a los Componentes Principales en el PCA
Dim.1
Dim.2
Dim.3
Dim.4
Dim.5
ING-TAM-EMPRESARIAL
0.9245628
0.0055140
0.0023992
0.0016205
0.0000152
ACTIVO-CORRIENTE
0.9258483
0.0375435
0.0005681
0.0125379
0.0000371
ACTIVO-NO-CORRIENTE
0.9046436
0.0013735
0.0003937
0.0009832
0.0014392
ACTIVO-TOTAL
0.9568359
0.0255502
0.0001904
0.0089831
0.0001922
PASIVO-CORRIENTE
0.8655626
0.0961692
0.0019077
0.0036855
0.0034142
PASIVO-LRG-PLAZO
0.0542786
0.4147828
0.2513366
0.2715979
0.0001037
PASIVO-TOTAL
0.8761756
0.0807990
0.0039500
0.0064937
0.0033443
PATRIMONIO
0.8324478
0.1185482
0.0021929
0.0271816
0.0000485
PASIVO+PATRIM
0.9568359
0.0255502
0.0001904
0.0089831
0.0001922
ING-OPERACIONES
0.9245628
0.0055140
0.0023992
0.0016205
0.0000152
ING-NO-OPERACIONALES
0.4849843
0.1426722
0.0033585
0.0053871
0.3580132
GAS-OPERACIONALES
0.8724462
0.0950212
0.0020982
0.0023746
0.0009271
GAS-NO-OPERAC
0.7068100
0.0764372
0.0150076
0.0265069
0.0110986
COS-VEN
0.2493513
0.0459640
0.4870723
0.2159267
0.0002192
GAS-IMP
0.8183334
0.0271494
0.0000240
0.0173600
0.0005131
UTIL-OPERACIONAL
0.9054100
0.0343223
0.0003021
0.0010834
0.0168084
UTIL-NETA
0.7758159
0.1284824
0.0009601
0.0025905
0.0011780
ACTIV_2019
0.7952186
0.1559795
0.0014599
0.0052317
0.0081505
ACTIV_2020
0.8054020
0.1346307
0.0024629
0.0078918
0.0108136
ACTIV_2021
0.7966154
0.1202339
0.0010757
0.0087722
0.0138403
ACTIV_2022
0.8662262
0.0930347
0.0005847
0.0130397
0.0001733
ACTIV_2023
0.9550626
0.0253412
0.0001199
0.0093002
0.0001981
Ver código
var_coords <-get_pca_var(nat.PCA)$coordcoords_table <- var_coordskable(coords_table, caption ="Coordenadas de las Variables en el PCA")
Too few points to calculate an ellipse
Too few points to calculate an ellipse
Too few points to calculate an ellipse
Too few points to calculate an ellipse
Too few points to calculate an ellipse
Too few points to calculate an ellipse
Too few points to calculate an ellipse
Too few points to calculate an ellipse
Too few points to calculate an ellipse
gen <- dna %>%select(GENERO, `CANT-MUJERES`, `ING-TAM-EMPRESARIAL`, PATRIMONIO, `ING-NO-OPERACIONALES`, `COS-VEN`, `UTIL-NETA`)# Realizar el ACMacm_gen <-MCA(gen, graph=FALSE)
Ver código
#Benzecris <-7l <- acm_gen$eig[acm_gen$eig[,1] >1/s, 1]tau <- ( s / (s -1) )^2* ( l - (1/s) )^2ptau <- tau /sum( tau ) *100barplot(ptau, col="darkred", ylim =c(0,100))+text(ptau, labels =paste(round(ptau,3),"%"), pos=3)
numeric(0)
Ver código
library(knitr)kable(round(acm_gen$var$contrib, 2), caption ="Contribuciones de las variables") %>%kable_styling(full_width = F) %>%scroll_box(width="800px", height="500px")
Contribuciones de las variables
Dim 1
Dim 2
Dim 3
Dim 4
Dim 5
F
0.12
1.25
3.80
16.80
0.00
M
0.12
1.16
3.52
15.60
0.00
CANT-MUJERES_0
1.59
5.32
2.43
0.64
0.48
CANT-MUJERES_MAYOR A 0
4.85
16.19
7.40
1.95
1.47
ING-TAM-EMPRESARIAL_[0 - 1'000.000)
4.12
0.11
21.07
0.00
0.67
ING-TAM-EMPRESARIAL_[1'000.000 - 100'000.000)
0.08
1.59
14.53
0.14
1.17
ING-TAM-EMPRESARIAL_[100'000.000 - 5.720'881.000)
9.94
16.74
2.46
1.26
1.89
PATRIMONIO_[0 - 1'000.000)
0.81
1.55
0.16
7.74
0.66
PATRIMONIO_[1'000.000 - 2'000.000)
0.66
5.63
10.58
0.65
5.95
PATRIMONIO_[10'000.000 - 20'000.000)
0.18
4.13
1.32
1.43
2.64
PATRIMONIO_[2'000.000 - 3'000.000)
0.48
0.85
0.30
9.95
11.57
PATRIMONIO_[20'000.000 - 604'967.325)
7.41
3.17
10.96
0.06
0.00
PATRIMONIO_[3'000.000 - 5'000.000)
0.00
1.05
6.61
0.61
9.19
PATRIMONIO_[5'000.000 - 10'000.000)
0.12
0.00
6.55
17.57
7.95
ING-NO-OPERACIONALES_[0 - 1'000.000)
12.35
14.48
0.85
0.35
2.47
ING-NO-OPERACIONALES_[1'000.000 - 367'530.000)
3.31
11.29
4.60
0.02
1.39
ING-NO-OPERACIONALES_0
0.30
0.08
0.06
0.00
0.02
COS-VEN_[0 - 1'000.000)
0.04
0.45
2.74
24.04
0.08
COS-VEN_[1'000.000 - 200'000.000)
24.38
4.45
0.00
0.00
1.22
COS-VEN_0
2.85
0.66
0.05
0.35
0.18
UTIL-NETA_(0 - 186'132.000]
21.76
4.07
0.01
0.72
6.46
UTIL-NETA_[-23'200.000 - 0)
2.17
5.17
0.01
0.06
44.39
UTIL-NETA_0
2.36
0.58
0.00
0.06
0.15
Ver código
kable(round(acm_gen$var$coord, 2), caption ="Coordenadas de las variables") %>%kable_styling(full_width = F) %>%scroll_box(width="800px", height="500px")
ende <- dna %>%select(`DIR-COMERCIAL`, `CANT-EST-BD`, ESTRATO, PERSONAL, `PASIVO-LRG-PLAZO`, `PASIVO-TOTAL`, `GAS-OPERACIONALES`)# Realizar el ACMacm_ende <-MCA(ende, graph=FALSE)
Ver código
#Benzecris <-7l <- acm_ende$eig[acm_ende$eig[,1] >1/s, 1]tau <- ( s / (s -1) )^2* ( l - (1/s) )^2ptau <- tau /sum( tau ) *100barplot(ptau, col="darkred", ylim =c(0,100))+text(ptau, labels =paste(round(ptau,3),"%"), pos=3)
numeric(0)
Ver código
library(knitr)kable(round(acm_ende$var$contrib, 2), caption ="Contribuciones de las variables") %>%kable_styling(full_width = F) %>%scroll_box(width="800px", height="500px")
Contribuciones de las variables
Dim 1
Dim 2
Dim 3
Dim 4
Dim 5
RURAL
9.30
0.53
0.74
5.12
0.12
URBANO
3.49
0.20
0.28
1.92
0.04
cero
0.06
14.04
7.87
16.13
1.93
dos_o_mas
2.77
6.14
0.48
18.18
1.38
uno
0.12
0.52
0.53
3.60
0.05
BAJO-MEDIO
1.16
6.66
3.25
2.26
0.28
MEDIO_ALTO
2.65
15.19
7.41
5.16
0.65
PERSONAL_0
8.47
1.95
0.93
0.00
1.37
PERSONAL_1-3
11.15
0.41
2.13
2.68
11.06
PERSONAL_4-76
4.20
9.30
0.01
13.89
11.73
PASIVO-LRG-PLAZO_[0 - 1'000.000)
3.28
12.97
9.61
3.80
36.42
PASIVO-LRG-PLAZO_[1'000.000 - 367'530.000)
8.18
1.80
26.90
9.78
0.19
PASIVO-LRG-PLAZO_0
0.32
0.37
0.05
0.37
0.49
PASIVO-TOTAL_[0 - 1'000.000)
2.99
20.89
19.93
1.16
0.51
PASIVO-TOTAL_[1'000.000 - 367'530.000)
19.32
0.27
4.66
8.80
0.84
PASIVO-TOTAL_0
4.11
1.14
0.00
0.89
0.24
GAS-OPERACIONALES_[0 - 1'000.000)
2.59
7.58
7.46
1.35
32.18
GAS-OPERACIONALES_[1'000.000 - 2.351'202.000)
14.06
0.00
7.37
4.30
0.42
GAS-OPERACIONALES_0
1.80
0.05
0.40
0.59
0.08
Ver código
kable(round(acm_ende$var$coord, 2), caption ="Coordenadas de las variables") %>%kable_styling(full_width = F) %>%scroll_box(width="800px", height="500px")
El sector alimenticio predominante en el conjunto de datos son las panaderías y restaurantes, adicionalmente el municipio con más cantidad de emprendedores individuales es rionegro. Esto indica que existe una alta demanda de productos alimenticios en la región.
Los emprendedores individuales cuentan en promedio con 1 empleado y un patrimonio de 7,8 millones de pesos. Además de tener un bajo nivel de endeudamiento, con un pasivo total promedio de 1,5 millones de pesos.
Las empresas son rentables, con una utilidad neta promedio de 1,6 millones de pesos.
Bibliografía
Cámara de Comercio de Bogotá (s/f). Registro Único de Proponentes - RUP. Org.co. Recuperado el 10 de marzo de 2024, de https://www.ccb.org.co
Inicio. (2023, noviembre 14). Camara de Comercio del Oriente Antioqueño; Cámara de Comercio del Oriente Antioqueño. https://ccoa.org.co
Jorge A. Rivera Godoy, D. R. A. (2006). Análisis del desempeño financiero de empresas innovadoras del Sector Alimentos y Bebidas en Colombia. scielo.org.co. http://scielo.org.co/pdf/pege/n31/n31a07.pdf