Diagnóstico y análisis socio-empresarial del comercio autónomo en el sector alimenticio en el oriente Antioqueño.

Authors

Laura Valentina Velásquez Gómez

Danna Catalina Amézquita Borja

Resumen

Este documento tiene como propósito presentar de manera adecuada un proyecto centrado en el diagnóstico y análisis socioempresarial del comercio autónomo en el sector alimenticio en el Oriente Antioqueño. Se utilizará la base de datos de empresas dedicadas al procesamiento de alimentos registradas en la Cámara de Comercio del Oriente Antioqueño (CCOA), la cual recopila información desde el año 2019 hasta el año 2023.

En el transcurso de este informe, se expondrán resultados correspondientes a variables univariadas, permitiendo así una comprensión más detallada del comportamiento de dichas variables. Estos resultados servirán como base para la formulación de un análisis multivariado en el futuro, con el fin de cumplir de manera efectiva con los objetivos propuestos en el presente documento.

Introducción

La camara de comercio regula y ofrece apoyo a diversas empresas dedicadas al sector de alimentos, entre ellas incluye a las que lo producen, procesan, comercializan y/o ofrecen cualquier tipo de servicio relacionado a esto.

Entre las regulaciones se encuentra el registro legal de estas empresas, en el que se emite una matricula o licencia de funcionamiento a operar en el que autoriza a la empresa para que empiecen a operar comercialmente, para esto la camra de comercio verifica ciertos requisitos legales y administrativos, además de recopilar la informacion financiera durante cierto periodo de tiempo, en este caso desde el 2019 al 2023.

La población que será analizada principalmente seran las personas naturales, sin embargo también se mostrará algunas diferencias y reaciones con las personas juridicás para dejar clara la diferencia en el comportamiento de estas y algunas posibles relaciones.

Marco conceptual

Marco de antecedentes

Se encontraron diversos estudios en los cuales se analizó el estado empresarial del sector alimenticio tanto en Antioquia como en Colombia en general. El primer estudio a tener en cuenta es “DIAGNÓSTICO DEL ESTADO ACTUAL DE LAS AGROINDUSTRIAS Y EMPRENDIMIENTOS DEL MUNICIPIO DE SONSÓN”, seleccionado debido a su acercamiento a los emprendimientos en uno de los municipios de Antioquia. En este se destaca la persistencia de los emprendedores locales. Se propone continuar apoyándolos con formación para formalizar sus empresas y cumplir requisitos comerciales. Se identificaron encadenamientos agroindustriales, y se sugiere reactivar industrias sin uso, como cárnicos y lácteos. A pesar de la falta del Registro INVIMA en algunas empresas, se busca asesorar para evitar futuros problemas. La pandemia no impidió la participación en formaciones virtuales y eventos presenciales con protocolos de bioseguridad. Aunque el micrositio web está en desarrollo, se espera su presentación durante este periodo de gobierno.

El segundo estudio es “Análisis del desempeño financiero de empresas innovadoras del sector Alimentos y Bebidas en Colombia”, el cual nos ayudó a comprender más a profundidad la situación financiera del sector alimenticio en Colombia y poder guiarnos activamente en el desarrollo del análisis financiero. En este se mencionan aspectos importantes, como que entre 2000 y 2008, el sector de alimentos y bebidas en Colombia experimentó un crecimiento en ventas, activos y utilidades. Las empresas innovadoras mostraron un mayor crecimiento en ventas y activos, pero tuvieron una caída en 2004, afectando las utilidades. La eficiencia de las innovadoras dependió del uso eficiente de activos, mientras que las no innovadoras se centraron en el manejo de costos. Aunque las innovadoras tuvieron un EVA promedio superior, ingresaron a una franja negativa después de 2004, mientras que las no innovadoras mantuvieron un EVA negativo constante. El EVA del sector se explicó por el rendimiento del activo neto operacional, vinculado al riesgo país. A pesar de contribuir al conocimiento financiero, el estudio tiene limitaciones en la consideración de otras características diferenciadoras en futuras investigaciones.

Marco teórico

El Oriente Antioqueño se destaca como una región prometedora para la inversión en el sector alimenticio, respaldada por diversos factores como su estratégica ubicación, crecimiento demográfico y dinamismo económico.

Desde una perspectiva social y cultural, la región exhibe una arraigada tradición culinaria, enfocada en la preferencia por productos frescos y locales. Además, la creciente conciencia sobre salud y alimentación saludable impulsa la demanda de productos orgánicos y artesanales. La población local, caracterizada por su espíritu emprendedor, muestra disposición a probar nuevas experiencias gastronómicas.

En cuanto a la dimensión poblacional, el crecimiento sostenido de la población amplía el mercado potencial para las empresas del sector alimenticio. La tendencia hacia la urbanización abre oportunidades para la distribución y comercialización de alimentos, especialmente considerando la presencia de una población joven y diversa que favorece la innovación y diversificación de la oferta.

En el ámbito político, el gobierno colombiano respalda el desarrollo del sector agroindustrial mediante políticas públicas, incentivos fiscales y programas de apoyo a las PYMES.

En el aspecto económico, la diversificación económica del Oriente Antioqueño, con un destacado sector industrial y comercial, se ve respaldada por una infraestructura vial y de transporte en constante desarrollo. El crecimiento sostenido del PIB per cápita indica un aumento del poder adquisitivo de la población.

El análisis de la fase de producción de alimentos se enfoca en identificar la demanda de productos, evaluar la rentabilidad y comparar márgenes de ganancia para determinar las áreas con mayor potencial.

El análisis integral de estos aspectos permitirá determinar la viabilidad del Comercio del Oriente Antioqueño como una atractiva opción de inversión en el sector alimenticio.

Definiciones importantes

  • Activos: Son los recursos económicos que posee una empresa, como efectivo, cuentas por cobrar, inventarios, maquinaria y equipos. Se clasifican en activos corrientes (a corto plazo) y activos no corrientes (a largo plazo).

  • Pasivos: Son las obligaciones que una empresa tiene con terceros, como proveedores, bancos, empleados y el gobierno. Representan los recursos financieros que la empresa debe a otros y que tendrá que pagar en el futuro.

  • Patrimonio: Es la diferencia entre los activos y los pasivos de una empresa. Representa el valor neto de la empresa. Se calcula como el total de activos menos el total de pasivos.

  • Utilidades: Son las ganancias que obtiene una empresa después de descontar los costos y gastos de operación. También se les conoce como beneficios o ganancias netas.

  • Sector alimenticio: Es el conjunto de actividades económicas que se relacionan con la producción, transformación, distribución y comercialización de alimentos. Abarca desde la agricultura y la ganadería hasta la industria alimentaria y el comercio minorista.

Planteamiento del problema

Considerando los aspectos sociales, culturales, poblacionales, políticos, económicos y éticos: ¿Es el comercio del Oriente Antioqueño una buena opción de inversión en el sector alimenticio si se desea invertir en una empresa en nacimiento o crecimiento?¿Se puede confiar en el progreso de los proyectos que se han ido consolidando y construyendo en los últimos 5 años?

Objetivos

General

Analizar la fase de producción de alimentos gestionada por emprendedores individuales para identificar las oportunidades de inversión con mayor relevancia en el Oriente Antioqueño. Este análisis se basará en los datos recopilados durante los últimos cuatro años.

Específicos

  1. Identificar los tipos de alimentos con mayor demanda y potencial de crecimiento en la región.

  2. Evaluar la rentabilidad y viabilidad económica de las actividades comerciales individuales en el sector alimentario.

  3. Establecer comparativas entre los márgenes de ganancia y retorno de inversión de los diferentes campos del sector alimenticio.

Justificación

El principal propósito de este proyecto es la observación y el análisis de una base de datos para relacionar y procesar información (considerada valiosa), mientras que se busca una solución u optimización de alguna técnica empleada ,que no se haya contemplado disponer en el contexto de las variables implicadas. Se investigó la base de datos de las empresas que se dedican a procesar alimentos registradas en la Cámara de Comercio del Oriente Antioqueño (CCOA) en pro del análisis empresarial previo y a futuro del cómo podían surgir, potencializarse o verse afectadas por diversos factores todas aquellas personas naturales registradas que cuentan con algún tipo de vínculo empresarial o que refieren emprendimientos propios; esto con el propósito de hallar patrones en las pérdidas y ganancias, en la ubicación geográfica de su negocio, ingresos, tipos de activos y pasivos que poseen, entre otros, para luego tratar de relacionar o descartar la relación que existe entre sí.

Adicionalmente, es importante resaltar que se realizó un estudio con esta base de datos específica, ya que toma variables tanto cuantitativas como cualitativas relacionadas con actividades económicas y factores que las rodean, y que, a su vez, resultaron mutuamente interesantes para trabajar, pues al tratar asuntos económicos de la mano de más características importantes financieras o no financieras, se logre evidenciar particularmente una tendencia a dependencia y significancia o imparcialidad y despreciabilidad.

Personas juridicas y naturales

Diagnóstico inicial de variables

Variables e individuos

Dada la naturaleza de nuestro proyecto, nos enfocaremos en colaborar con individuos considerados como personas naturales, excluyendo la participación de grandes empresas, esto con el fin de llevar a cabo un análisis cuantitativo y cualitativo en simultáneo; se determinó que resultaba más factible caracterizar ciertas cualidades en las personas naturales como género o estrato social, que, en comparación con las personas jurídicas, no aplicaban o no brindaban una información categórica útil para el estudio.

En lo concerniente a las variables, se prescindirá de aquellas que contengan información temporal como lo son cualquier tipo de fechas, así como de aquellas que simplemente reproduzcan datos ya existentes como nombre 1 y 2, apellido 1 y 2. Asimismo, se excluirán aquellas variables que posean información trivial, tal como aquellas en las que todos los individuos presenten valores nulos o aquellas con una cantidad significativa de datos faltantes.

En la tabla a continuación se muestran las variables que se utilizaran a lo largo del proyecto.

Ver código
suppressWarnings({
suppressMessages({
  
library(knitr)
library(kableExtra)
  
})
})

tabla <- data.frame(
  Identificador = c("RAZON SOCIAL", "GENERO", "EMPREN.SOCIAL", "NACIONALIDAD", 
                    "DIR.COMERCIAL", "MUN.COMERCIAL", "CATEGORIA", 
                    "ACTIVIDAD_ECONOMICA_PRINCIPAL", "DOS_O_MAS_ACT_ECON", 
                    "CANT.MUJERES", "ING.TAM.EMPRESARIAL", "UBICACION", "PERSONAL", 
                    "ACTIVO.CORRIENTE", "ACTIVO.TOTAL", "PASIVO.TOTAL", 
                    "PATRIMONIO", "PASIVO+PATRIM", "ING.OPERACIONES", 
                    "GAS.OPERACIONALES", "GAS.NO.OPERAC", "COS.VEN", 
                    "GAS.IMP", "UTIL.OPERACIONAL", "UTIL.NETA", "CANT.EST.BD", 
                    "ACTI 2019", "ACTI 2020", "ACTI 2021", "ACTI 2022", 
                    "ACTI 2023"),
  Tipo = c("Cualitativa", "Cualitativa", "Cualitativa", "Cualitativa", 
           "Cualitativa", "Cualitativa", "Cualitativa", 
           "Cualitativa", "Cualitativa", "Cuantitativa", 
           "Cuantitativa", "Cualitativa", "Cuantitativa", 
           "Cuantitativa", "Cuantitativa", "Cuantitativa", 
           "Cuantitativa", "Cuantitativa", "Cuantitativa", 
           "Cuantitativa", "Cuantitativa", "Cuantitativa", 
           "Cuantitativa", "Cuantitativa", "Cuantitativa", 
           "Cualitativa", "Cuantitativa", "Cuantitativa", 
           "Cuantitativa", "Cuantitativa", "Cuantitativa"),
  Descripción = c("Tipo de persona", "Masculino o Femenino", 
                  "Si aspira a convertise en una franquicia o no", 
                  "Nacionalidad", "Dirección donde se realiza la actividad comercial", 
                  "Municipio donde se realiza la actividad comercial", 
                  "Actividad comercial general", 
                  "Subdivición de la categoría, es más específica con la actividad", 
                  "Si tiene dos o más actividades económicas", 
                  "Cantidad de mujeres que trabajan en", "Ingresos", 
                  "Estrato socioeconómico", "Cantidad de personas en total", 
                  "Activo corriente", 
                  "Activo que incluye los activos corriente, no corriente, fijo, valorizado y otros.", 
                  "Pasivo que incluye el pasivo a largo plazo y el corriente.", 
                  "Patrimonio", "La suma del patrimonio y el pasivo total", 
                  "Ingresos que dejan las operaciones", "Gastos operacionales", 
                  "Gastos adicionales sin incluir los impuestos", 
                  "Costo total", "Gastos en impuestos", 
                  "Utilidad operacional", "Utilidad neta", 
                  "Cantidad de establecimientos físicos", 
                  "Activos del 2019", "Activos del 2020", 
                  "Activos del 2021", "Activos del 2022", "Activos del 2023")
)

tabla %>%
  kable("html", col.names = c("Identificador", "Tipo", "Descripción")) %>%
  kable_styling(full_width = FALSE)
Identificador Tipo Descripción
RAZON SOCIAL Cualitativa Tipo de persona
GENERO Cualitativa Masculino o Femenino
EMPREN.SOCIAL Cualitativa Si aspira a convertise en una franquicia o no
NACIONALIDAD Cualitativa Nacionalidad
DIR.COMERCIAL Cualitativa Dirección donde se realiza la actividad comercial
MUN.COMERCIAL Cualitativa Municipio donde se realiza la actividad comercial
CATEGORIA Cualitativa Actividad comercial general
ACTIVIDAD_ECONOMICA_PRINCIPAL Cualitativa Subdivición de la categoría, es más específica con la actividad
DOS_O_MAS_ACT_ECON Cualitativa Si tiene dos o más actividades económicas
CANT.MUJERES Cuantitativa Cantidad de mujeres que trabajan en
ING.TAM.EMPRESARIAL Cuantitativa Ingresos
UBICACION Cualitativa Estrato socioeconómico
PERSONAL Cuantitativa Cantidad de personas en total
ACTIVO.CORRIENTE Cuantitativa Activo corriente
ACTIVO.TOTAL Cuantitativa Activo que incluye los activos corriente, no corriente, fijo, valorizado y otros.
PASIVO.TOTAL Cuantitativa Pasivo que incluye el pasivo a largo plazo y el corriente.
PATRIMONIO Cuantitativa Patrimonio
PASIVO+PATRIM Cuantitativa La suma del patrimonio y el pasivo total
ING.OPERACIONES Cuantitativa Ingresos que dejan las operaciones
GAS.OPERACIONALES Cuantitativa Gastos operacionales
GAS.NO.OPERAC Cuantitativa Gastos adicionales sin incluir los impuestos
COS.VEN Cuantitativa Costo total
GAS.IMP Cuantitativa Gastos en impuestos
UTIL.OPERACIONAL Cuantitativa Utilidad operacional
UTIL.NETA Cuantitativa Utilidad neta
CANT.EST.BD Cualitativa Cantidad de establecimientos físicos
ACTI 2019 Cuantitativa Activos del 2019
ACTI 2020 Cuantitativa Activos del 2020
ACTI 2021 Cuantitativa Activos del 2021
ACTI 2022 Cuantitativa Activos del 2022
ACTI 2023 Cuantitativa Activos del 2023

Resumen comportamiento variables

Ver código
# Seleccionamos el archivo CSV 

ruta_archivo <- file.choose()



# Carga el archivo CSV

datos <- read.csv(ruta_archivo, sep = ";")

Tabla con los primeros individuos

RAZON_SOCIAL GENERO EMPREN-SOCIAL NACIONALIDAD DIR-COMERCIAL MUN-COMERCIAL CATEGORIA ACTIVIDAD_ECONOMICA_PRINCIPAL DOS_O_MAS_ACT_ECON CANT-MUJERES CANT-MUJERES-CAR-DIR PORCENT-PART-MUJ ING-TAM-EMPRESARIAL ESTRATO PERSONAL ACTIVO-CORRIENTE ACTIVO-NO-CORRIENTE ACTIVO-TOTAL PASIVO-CORRIENTE PASIVO-LRG-PLAZO PASIVO-TOTAL PATRIMONIO PASIVO+PATRIM ING-OPERACIONES ING-NO-OPERACIONALES GAS-OPERACIONALES GAS-NO-OPERAC COS-VEN GAS-IMP UTIL-OPERACIONAL UTIL-NETA CANT-EST-BD ACTIV_2019 ACTIV_2020 ACTIV_2021 ACTIV_2022 ACTIV_2023
NATURAL F N COLOMBIANA URBANO 05674-SAN VICENTE FERRER AGROPECUARIA AGRICULTURA DOS_O_MAS 0 0 0 72.850.000,00 6 0 3.000.000,00 0 3.000.000,00 0 0 0 3.000.000,00 3.000.000,00 72.850.000,00 0 0 0 0 0 0 0 1 0 0 3.000.000,00 3.000.000,00 3.000.000,00
JURIDICA N/A N N/A RURAL 05318-GUARNE AGROPECUARIA AGRICULTURA DOS_O_MAS 0 1 67 0 6 0 45.000.000,00 0 45.000.000,00 0 0 0 45.000.000,00 45.000.000,00 0 0 0 0 0 0 0 0 N/A 0 0 0 0 45.000.000,00
JURIDICA N/A N N/A URBANO 05318-GUARNE AGROPECUARIA AGRICULTURA DOS_O_MAS 1 0 0 0 1 4 1.861.528.809,00 757.378.707,00 2.618.907.516,00 89.558.669,00 3.458.640.558,00 3.548.199.227,00 -929.291.711,00 2.618.907.516,00 0 1.284,00 914.712.722,00 57.575.144,00 0 0 -972.286.582,00 -972.286.582,00 N/A 0 0 200.000.000,00 1.132.046.196,00 2.618.907.516,00
JURIDICA N/A N N/A URBANO 05607-EL RETIRO AGROPECUARIA AGRICULTURA DOS_O_MAS 3 1 90 601.391.125,00 6 3 639.061.000,00 0 639.061.000,00 502.500.000,00 0 502.500.000,00 136.561.000,00 639.061.000,00 601.391.125,00 130.740,00 433.449.000,00 49.892.000,00 65.901.874,00 0 0 0 N/A 462.690.000,00 515.642.000,00 589.890.442,00 571.723.175,00 639.061.000,00
JURIDICA N/A N N/A RURAL 05318-GUARNE AGROPECUARIA AGRICULTURA DOS_O_MAS 0 0 60 0 1 0 10.000.000,00 0 10.000.000,00 0 0 0 10.000.000,00 10.000.000,00 0 0 0 0 0 0 0 0 1 0 0 0 0 10.000.000,00
NATURAL F S COLOMBIANA RURAL 05148-CARMEN DE VIBORAL AGROPECUARIA AGRICULTURA DOS_O_MAS 0 0 0 0 5 0 2.000.000,00 0 2.000.000,00 0 0 0 2.000.000,00 2.000.000,00 0 0 0 0 0 0 0 0 1 0 0 0 0 2.000.000,00

Resumen Básico de las variables

Ver código
suppressWarnings({

suppressMessages({
  
library(plotly)
library(readxl)
library(dplyr)
  
})

})

# Desactivar notación científica
options(scipen = 999)

# Especifica la ruta del archivo Excel
archivo_excel <- "C:/Users/catam/OneDrive/Escritorio/catval.xlsx"

# Leer los datos desde Excel sin especificar col_types
datos <- read_excel(archivo_excel)

# Función para limpiar y convertir las columnas a numéricas
clean_and_convert <- function(df) {
  df[] <- lapply(df, function(column) {
    if (is.character(column)) {
      column <- gsub(",", "", column) # Eliminar comas
      column <- gsub(" ", "", column) # Eliminar espacios
      column <- as.numeric(column)    # Convertir a numérico
    }
    return(column)
  })
  return(df)
}

# Aplicar la función a las columnas numéricas
# Identifica las columnas que deberían ser numéricas (aquí se asume que las columnas de la 14 a la 37 deberían ser numéricas)
columnas_numericas <- c(14,17:37)
datos[, columnas_numericas] <- clean_and_convert(datos[, columnas_numericas])


# COLUMNAS QUE NECESITAMOS CONVERTIR A CATEGORÍAS:

datos$`CANT-EST-BD` <- as.factor(datos$`CANT-EST-BD`)
datos$GENERO <- as.factor(datos$GENERO)
datos$RAZON_SOCIAL <- as.factor(datos$RAZON_SOCIAL)
datos$`EMPREN-SOCIAL` <- as.factor(datos$`EMPREN-SOCIAL`)
datos$NACIONALIDAD<- as.factor(datos$NACIONALIDAD)
datos$`DIR-COMERCIAL` <- as.factor(datos$`DIR-COMERCIAL`)
datos$`MUN-COMERCIAL` <- as.factor(datos$`MUN-COMERCIAL`)
datos$CATEGORIA <- as.factor(datos$CATEGORIA)
datos$ACTIVIDAD_ECONOMICA_PRINCIPAL <- as.factor(datos$ACTIVIDAD_ECONOMICA_PRINCIPAL)
datos$DOS_O_MAS_ACT_ECON <- as.factor(datos$DOS_O_MAS_ACT_ECON)
datos$`CANT-MUJERES` <- as.factor(datos$`CANT-MUJERES`)
datos$`CANT-MUJERES-CAR-DIR` <- as.factor(datos$`CANT-MUJERES-CAR-DIR`)
datos$`PORCENT-PART-MUJ` <- as.factor(datos$`PORCENT-PART-MUJ`)
datos$ESTRATO <- as.factor(datos$ESTRATO)
datos$PERSONAL <- as.factor(datos$PERSONAL)


# Muestra el resumen de los datos importados
summary(datos)
   RAZON_SOCIAL GENERO    EMPREN-SOCIAL       NACIONALIDAD DIR-COMERCIAL
 JURIDICA:199   F  :286   N:737         ALEMANA     :  1   RURAL :195   
 NATURAL :594   M  :308   S: 56         COLOMBIANA  :587   URBANO:598   
                N/A:199                 FRANCESA    :  1                
                                        GUATEMANTECA:  1                
                                        N/A         :199                
                                        VENEZOLANA  :  4                
                                                                        
                   MUN-COMERCIAL                               CATEGORIA  
 05615 - RIONEGRO         :223   ELABORACION DE PRODUCTOS DE CONSUMO:630  
 05440 - MARINILLA        : 94   HOTELERÍA Y TURISMO                : 77  
 05318 - GUARNE           : 77   COMERCIO                           : 48  
 05148 - CARMEN DE VIBORAL: 76   AGROPECUARIA                       : 19  
 05376 - LA CEJA          : 74   RECREACION                         :  7  
 05607 - EL RETIRO        : 33   INVESTIGACION                      :  3  
 (Other)                  :216   (Other)                            :  9  
        ACTIVIDAD_ECONOMICA_PRINCIPAL                        DOS_O_MAS_ACT_ECON
 ELABORACION PANADERIA :261           DOS O MÁS ACTIVIDADES ECONOMICAS:525     
 PRODUCTOS ALIMENTICIOS: 84           N/A                             :268     
 PROCESADOS ANIMALES   : 83                                                    
 ELABORACION DE COMIDA : 60                                                    
 EXPENDIO DE COMIDAS   : 38                                                    
 POR MENOR             : 36                                                    
 (Other)               :231                                                    
    CANT-EST-BD   CANT-MUJERES CANT-MUJERES-CAR-DIR PORCENT-PART-MUJ
 cero     :141   0      :547   0      :708          0      :704     
 dos_o_mas: 24   1      :112   1      : 60          100    : 28     
 uno      :628   2      : 53   2      : 11          50     : 17     
                 3      : 28   3      :  5          1      :  7     
                 4      : 12   4      :  4          60     :  5     
                 5      :  6   5      :  3          30     :  4     
                 (Other): 35   (Other):  2          (Other): 28     
 ING-TAM-EMPRESARIAL    ESTRATO    PERSONAL   ACTIVO-CORRIENTE     
 Min.   :           0   1:496   0      :454   Min.   :          0  
 1st Qu.:           1   2: 20   1      :118   1st Qu.:    1950000  
 Median :    12000000   3: 11   2      : 73   Median :    5000000  
 Mean   :   925095888   4: 22   3      : 37   Mean   :  221088078  
 3rd Qu.:    60000000   5:162   4      : 25   3rd Qu.:   13415870  
 Max.   :188173212000   6: 82   5      : 20   Max.   :45846364000  
                                (Other): 66                        
 ACTIVO-NO-CORRIENTE     ACTIVO-TOTAL          PASIVO-CORRIENTE      
 Min.   :           0   Min.   :           0   Min.   :           0  
 1st Qu.:           0   1st Qu.:     2100000   1st Qu.:           0  
 Median :           0   Median :     5500000   Median :           0  
 Mean   :   526817359   Mean   :   747920724   Mean   :   277429720  
 3rd Qu.:           0   3rd Qu.:    15010000   3rd Qu.:           0  
 Max.   :341101547000   Max.   :386947911000   Max.   :139537308000  
                                                                     
 PASIVO-LRG-PLAZO        PASIVO-TOTAL            PATRIMONIO          
 Min.   :           0   Min.   :           0   Min.   :  -929291711  
 1st Qu.:           0   1st Qu.:           0   1st Qu.:     1600000  
 Median :           0   Median :           0   Median :     4500000  
 Mean   :   234771833   Mean   :   512206145   Mean   :   235707336  
 3rd Qu.:           0   3rd Qu.:           0   3rd Qu.:    12560000  
 Max.   :140334116000   Max.   :279871424000   Max.   :107076487000  
                                                                     
 PASIVO+PATRIM          ING-OPERACIONES        ING-NO-OPERACIONALES
 Min.   :           0   Min.   :           0   Min.   :         0  
 1st Qu.:     2100000   1st Qu.:           1   1st Qu.:         0  
 Median :     5375000   Median :    12000000   Median :         0  
 Mean   :   747794621   Mean   :   925095888   Mean   :   7869396  
 3rd Qu.:    15010000   3rd Qu.:    60000000   3rd Qu.:         0  
 Max.   :386947911000   Max.   :188173212000   Max.   :1548471000  
                                                                   
 GAS-OPERACIONALES     GAS-NO-OPERAC           COS-VEN            
 Min.   :  -50439000   Min.   :-402723000   Min.   : -3704547000  
 1st Qu.:          0   1st Qu.:         0   1st Qu.:           0  
 Median :          0   Median :         0   Median :           0  
 Mean   :  122804722   Mean   :  15150428   Mean   :   697551736  
 3rd Qu.:          0   3rd Qu.:         0   3rd Qu.:           0  
 Max.   :21148524146   Max.   :3256925000   Max.   :185624779000  
                                                                  
    GAS-IMP           UTIL-OPERACIONAL       UTIL-NETA          
 Min.   :         0   Min.   :-972286582   Min.   :-1563062000  
 1st Qu.:         0   1st Qu.:         0   1st Qu.:          0  
 Median :         0   Median :         0   Median :          0  
 Mean   :   6646098   Mean   :  16827244   Mean   :    2531860  
 3rd Qu.:         0   3rd Qu.:         0   3rd Qu.:          0  
 Max.   :1649028000   Max.   :3656830739   Max.   : 1713918000  
                                                                
   ACTIV_2019           ACTIV_2020            ACTIV_2021         
 Min.   :         0   Min.   :          0   Min.   :          0  
 1st Qu.:         0   1st Qu.:          0   1st Qu.:          0  
 Median :         0   Median :          0   Median :    1700000  
 Mean   :  77282965   Mean   :  159579975   Mean   :  195138061  
 3rd Qu.:   2610000   3rd Qu.:    5000000   3rd Qu.:    9054000  
 Max.   :8664805786   Max.   :31332606000   Max.   :29068555000  
                                                                 
   ACTIV_2022             ACTIV_2023          
 Min.   :           0   Min.   :           0  
 1st Qu.:      600000   1st Qu.:     2010000  
 Median :     3100000   Median :     5375000  
 Mean   :   392384069   Mean   :   747820011  
 3rd Qu.:    10800000   3rd Qu.:    15010000  
 Max.   :122291864000   Max.   :386947911000  
                                              

Análisis univariado

Histogramas sobre variables cualitativas

Ver código
fig <- plot_ly(datos, x=~RAZON_SOCIAL, type='histogram',  marker = list(color = 'purple'))

fig <- fig %>% layout(title = "RAZON SOCIAL",

                      xaxis=list((title="Actividad")),

                      yaxis=list(title='Frec. abs.'))

fig

En razón social de la base de datos original se encontraban los nombres particulares de cada empresa que recibía una matrícula, esto lo cambiamos por personas naturales o personas jurídicas para poder hacer un análisis adecuado, pues al categorizarlas así, era más sencillo explicar qué tantas empresas eran PYMES, y cuáles eran empresas ya consolidadas con anterioridad en el mercado antioqueño; este se hizo dependiendo de si el nombre terminaba en S.A.S o si solamente se identificaba con su nombre tal y como aparece en la cédula.

Ver código
fig <- plot_ly(datos, x=~GENERO, type='histogram',  marker = list(color = 'purple'))

fig <- fig %>% layout(title = "GÉNERO",

                      xaxis=list((title="Actividad")),

                      yaxis=list(title='Frec. abs.'))

fig
Ver código
fig <- plot_ly(datos, x=~NACIONALIDAD, type='histogram',  marker = list(color = 'purple'))

fig <- fig %>% layout(title = "NACIONALIDAD",

                      xaxis=list((title="Actividad")),

                      yaxis=list(title='Frec. abs.'))

fig

Cómo podemos notar, en las variables Género y Nacionalidad la cantidad de individuos que tiene N/A es exactamente la misma que las personas jurídicas, por tanto decidimos no eliminarlo.

Ver código
fig <- plot_ly(datos, x=~`MUN-COMERCIAL`, type='histogram',  marker = list(color = 'purple'))

fig <- fig %>% layout(title = "MUNICIPIO COMERCIAL",

                      xaxis=list((title="Actividad")),

                      yaxis=list(title='Frec. abs.'))

fig
Ver código
fig <- plot_ly(datos, x=~`DIR-COMERCIAL`, type='histogram',  marker = list(color = 'purple'))

fig <- fig %>% layout(title = "DIRECCIÓN COMERCIAL",

                      xaxis=list((title="Actividad")),

                      yaxis=list(title='Frec. abs.'))

fig

En estas dos variables cambiamos las direcciones exactas de los lugares por una clasificación de zona rural o zona urbana, para realizar esto nos guiamos de mapas, las iniciales de las dirrecciones (tales como cra, av, vda, etc), además en la gráfica de los municipios se puede notar que hay una gran concentración de estos establecimientos en Rionegro, que en su mayoría es urbano, y notamos que en general, las empresas se concentran en estas zonas.

Ver código
fig <- plot_ly(datos, x=~ESTRATO, type='histogram',  marker = list(color = 'purple'))

fig <- fig %>% layout(title = "ESTRATO",

                      xaxis=list((title="Actividad")),

                      yaxis=list(title='Frec. abs.'))

fig

En el caso de los estratos, vimos que era fácil identificar que había una mayor cantidad de empresas con estrato 1, lo que se puede interpretar como que son empresas locales o unipersonales.

Ver código
fig <- plot_ly(datos, x=~CATEGORIA, type='histogram',  marker = list(color = 'purple'))

fig <- fig %>% layout(title = "CATEGORIA",

                      xaxis=list((title="Actividad")),

                      yaxis=list(title='Frec. abs.'))

fig

Inicialmente, la variable CATEGORÍA no existía, nos guiamos de las variables CIIU-1, CIIU-2, CIIU-3 Y CIIU-4 (tratando de pluralizar cada una de estas) que, según la cámara de comercio, exigen al momento de declarar y que también indican a qué operación comercial específica se dedica la empresa y/o establecimiento, pues en varios casos se desarrolla más de una actividad, como por ejemplo: algunos restaurantes no sólo elaboran productos alimenticios (CIIU-1), si no que también los distribuyen (CIIU-2) y ofrecen ventas al por mayor (CIIU-4). Esta recategorización la vinculamos a algunos códigos claves en la base de datos de la CC. Generamos esta nueva variable condicionada por las letras que aparecen al comienzo de cada CIIU, que indican el tipo general de cada empresa (el MACROSECTOR), para analizarlo mejor y a su vez determinar mejor a qué tipo de población general nos enfrentábamos y sus razones.

Ver código
fig <- plot_ly(datos, x=~DOS_O_MAS_ACT_ECON, type='histogram',  marker = list(color = 'purple'))

fig <- fig %>% layout(title = "DOS O MÁS ACTIVIDADES ECONÓMICAS",

                      xaxis=list((title="Actividad")),

                      yaxis=list(title='Frec. abs.'))

fig

En esta variable particularmente, tratamos de ubicar aquellas empresas que únicamente se dedicaban a una actividad económica y aquellas que tenían dos o más de ellas, la razón principal es que en cuánto al CIIU 3 y 4 habían muchísimas empresas que en realidad sólo se dedicaban a una o máximo dos actividades económicas.

Ver código
fig <- plot_ly(datos, x=~ACTIVIDAD_ECONOMICA_PRINCIPAL, type='histogram',  marker = list(color = 'purple'))

fig <- fig %>% layout(title = "ACTIVIDAD ECONÓMICA PRINCIPAL",

                      xaxis=list((title="Actividad")),

                      yaxis=list(title='Frec. abs.'))

fig

Dentro de los macrosectores presentados anteriormente, hay otras divisiones específicas que detallan mejor cada actividad económica de cada empresa (teniendo en cuenta su macrosector).

Ver código
fig <- plot_ly(datos, x=~PERSONAL, type='histogram',  marker = list(color = 'purple'))

fig <- fig %>% layout(title = "PERSONAL",

                      xaxis=list((title="Personal")),

                      yaxis=list(title='Frec. abs.'))

fig

Como podemos notar una gran cantidad de empresas registran tener 0 personas bajo su cargo, esto se puede dar dado a que muchas de éstas pueden ser emprendimientos unipersonales (una sola persona es responsable de todas las decisiones, operaciones y en general de toda la administración del negocio).

Ver código
fig <- plot_ly(datos, x=~`CANT-MUJERES`, type='histogram',  marker = list(color = 'purple'))

fig <- fig %>% layout(title = "CANTIDAD DE MUJERES",

                      xaxis=list((title="A")),

                      yaxis=list(title='Frec. abs.'))

fig
Ver código
fig <- plot_ly(datos, x=~`CANT-MUJERES-CAR-DIR`, type='histogram',  marker = list(color = 'purple'))

fig <- fig %>% layout(title = "MUJERES EN CARGOS DIRECTIVOS",

                      xaxis=list((title="Cantidad de mujeres")),

                      yaxis=list(title='Frec. abs.'))

fig
Ver código
fig <- plot_ly(datos, x=~`PORCENT-PART-MUJ`, type='histogram',  marker = list(color = 'purple'))

fig <- fig %>% layout(title = "PORCENTAJE DE PARTICIPACIÓN FEMENINA",

                      xaxis=list((title="% Participación")),

                      yaxis=list(title='Frec. abs.'))

fig

A pesar de que en la variable de Género no tuvieramos una diferencia tan significativa entre Femenino y Masculino, podemos ver que en estas últimas tres variables (Cantidad de mujeres, Mujeres en cargos directivos y Porcentaje de Participación femenina) es bastante baja, lo que analizaremos más adelante en relación al tipo de comercio, ingreso, etc

Ver código
fig <- plot_ly(datos, x=~`EMPREN-SOCIAL`, type='histogram',  marker = list(color = 'purple'))

fig <- fig %>% layout(title = "ASPIRA O NO A FRANQUICIA",

                      xaxis=list((title="Franquiciado")),

                      yaxis=list(title='Frec. abs.'))

fig

En esta variable hicimos una recategorización acerca de si la empresa aspira o no a franquiciada (en Colombia, una franquicia suele ser asociada a si desea expandirse nacional o internacionalmente y modelar su idea de negocio con el fin de expansión a corto o mediano plazo), lo que nos inidca que la mayoría de empresas únicamente están interesadas en mantenser locales en el oriente Antioqueño.

Ver código
fig <- plot_ly(datos, x=~`CANT-EST-BD`, type='histogram',  marker = list(color = 'purple'))

fig <- fig %>% layout(title = "ESTABLECIMIENTOS FÍSICOS",

                      xaxis=list((title="Actividad")),

                      yaxis=list(title='Frec. abs.'))

fig

De las 793 empresas y/o emprendimientos registrados, solo 141 no cuentan con un establecimiento físico, lo que significa que pueden ser emprendimientos que no requieren de atención al cliente frecuente o que solo requieren de distribución.

Diagramas sobre variables cuantitativas

Ver código
# Creación del gráfico de caja y bigotes con ajustes de visualización
fig <- plot_ly(
  data = datos, 
  y = ~`ING-TAM-EMPRESARIAL`,  # Cambiado a 'y' para un gráfico vertical
  type = 'box',
  boxpoints = 'all',           # Muestra todos los puntos de datos
  jitter = 0.3,                # Dispersión de los puntos de datos
  pointpos = -1.8,             # Posición de los puntos de datos
  marker = list(color = 'purple'), # Color de los puntos de datos
  line = list(color = 'black')  # Color de las líneas de las cajas
)

# Ajuste del diseño del gráfico
fig <- fig %>% layout(
  title = "Distribución de los Ingresos", 
  yaxis = list(
    title = "Ingresos (COP)",    # Etiqueta del eje Y con formato en COP
    zeroline = FALSE,
    tickprefix = "$",           # Prefijo de pesos colombianos
    tickformat = ",.0f"        # Formato de los ticks (sin decimales)
  ),
  showlegend = FALSE            # Ocultar la leyenda si no es necesaria
)

# Mostrar el gráfico
fig
Ver código
# Creación del gráfico de caja y bigotes con la variable 'ACTIVO-TOTAL'
fig <- plot_ly(
  data = datos, 
  y = ~`ACTIVO-TOTAL`,  # Cambiado a 'y' para un gráfico vertical
  type = 'box',
  boxpoints = 'all',           # Muestra todos los puntos de datos
  jitter = 0.3,                # Dispersión de los puntos de datos
  pointpos = -1.8,             # Posición de los puntos de datos
  marker = list(color = 'purple'), # Color de los puntos de datos
  line = list(color = 'black')  # Color de las líneas de las cajas
)

# Ajuste del diseño del gráfico
fig <- fig %>% layout(
  title = "ACTIVO TOTAL", 
  yaxis = list(
    title = "Activo Total (COP)",  # Etiqueta del eje Y con formato en COP
    zeroline = FALSE,
    tickprefix = "$",             # Prefijo de pesos colombianos
    tickformat = ",.0f"          # Formato de los ticks (sin decimales)
  ),
  showlegend = FALSE            # Ocultar la leyenda si no es necesaria
)

# Mostrar el gráfico
fig
Ver código
# Creación del gráfico de caja y bigotes con la variable 'ACTIVO-CORRIENTE'
fig <- plot_ly(
  data = datos, 
  y = ~`ACTIVO-CORRIENTE`,  # Cambiado a 'y' para un gráfico vertical
  type = 'box',
  boxpoints = 'all',           # Muestra todos los puntos de datos
  jitter = 0.3,                # Dispersión de los puntos de datos
  pointpos = -1.8,             # Posición de los puntos de datos
  marker = list(color = 'purple'), # Color de los puntos de datos
  line = list(color = 'black')  # Color de las líneas de las cajas
)

# Ajuste del diseño del gráfico
fig <- fig %>% layout(
  title = "ACTIVO CORRIENTE", 
  yaxis = list(
    title = "Activo Corriente (COP)",  # Etiqueta del eje Y con formato en COP
    zeroline = FALSE,
    tickprefix = "$",             # Prefijo de pesos colombianos
    tickformat = ",.0f"          # Formato de los ticks (sin decimales)
  ),
  showlegend = FALSE            # Ocultar la leyenda si no es necesaria
)

# Mostrar el gráfico
fig
Ver código
# Creación del gráfico de caja y bigotes con la variable 'PASIVO-TOTAL'
fig <- plot_ly(
  data = datos, 
  y = ~`PASIVO-TOTAL`,  # Cambiado a 'y' para un gráfico vertical
  type = 'box',
  boxpoints = 'all',           # Muestra todos los puntos de datos
  jitter = 0.3,                # Dispersión de los puntos de datos
  pointpos = -1.8,             # Posición de los puntos de datos
  marker = list(color = 'purple'), # Color de los puntos de datos
  line = list(color = 'black')  # Color de las líneas de las cajas
)

# Ajuste del diseño del gráfico
fig <- fig %>% layout(
  title = "PASIVO TOTAL", 
  yaxis = list(
    title = "Pasivo Total (COP)",  # Etiqueta del eje Y con formato en COP
    zeroline = FALSE,
    tickprefix = "$",             # Prefijo de pesos colombianos
    tickformat = ",.0f"          # Formato de los ticks (sin decimales)
  ),
  showlegend = FALSE            # Ocultar la leyenda si no es necesaria
)

# Mostrar el gráfico
fig
Ver código
# Creación del gráfico de caja y bigotes con la variable 'PATRIMONIO'
fig <- plot_ly(
  data = datos, 
  y = ~PATRIMONIO,  # Cambiado a 'y' para un gráfico vertical
  type = 'box',
  boxpoints = 'all',           # Muestra todos los puntos de datos
  jitter = 0.3,                # Dispersión de los puntos de datos
  pointpos = -1.8,             # Posición de los puntos de datos
  marker = list(color = 'purple'), # Color de los puntos de datos
  line = list(color = 'black')  # Color de las líneas de las cajas
)

# Ajuste del diseño del gráfico
fig <- fig %>% layout(
  title = "PATRIMONIO", 
  yaxis = list(
    title = "Patrimonio (COP)",  # Etiqueta del eje Y con formato en COP
    zeroline = FALSE,
    tickprefix = "$",             # Prefijo de pesos colombianos
    tickformat = ",.0f"          # Formato de los ticks (sin decimales)
  ),
  showlegend = FALSE            # Ocultar la leyenda si no es necesaria
)

# Mostrar el gráfico
fig
Ver código
# Creación del gráfico de caja y bigotes con la variable 'ING-OPERACIONES'
fig <- plot_ly(
  data = datos, 
  y = ~`ING-OPERACIONES`,  # Cambiado a 'y' para un gráfico vertical
  type = 'box',
  boxpoints = 'all',           # Muestra todos los puntos de datos
  jitter = 0.3,                # Dispersión de los puntos de datos
  pointpos = -1.8,             # Posición de los puntos de datos
  marker = list(color = 'purple'), # Color de los puntos de datos
  line = list(color = 'black')  # Color de las líneas de las cajas
)

# Ajuste del diseño del gráfico
fig <- fig %>% layout(
  title = "INGRESOS OPERACIONALES", 
  yaxis = list(
    title = "Ingresos Operacionales (COP)",  # Etiqueta del eje Y con formato en COP
    zeroline = FALSE,
    tickprefix = "$",             # Prefijo de pesos colombianos
    tickformat = ",.0f"          # Formato de los ticks (sin decimales)
  ),
  showlegend = FALSE            # Ocultar la leyenda si no es necesaria
)

# Mostrar el gráfico
fig
Ver código
# Creación del gráfico de caja y bigotes con la variable 'GAS-OPERACIONALES'
fig <- plot_ly(
  data = datos, 
  y = ~`GAS-OPERACIONALES`,  # Cambiado a 'y' para un gráfico vertical
  type = 'box',
  boxpoints = 'all',           # Muestra todos los puntos de datos
  jitter = 0.3,                # Dispersión de los puntos de datos
  pointpos = -1.8,             # Posición de los puntos de datos
  marker = list(color = 'purple'), # Color de los puntos de datos
  line = list(color = 'black')  # Color de las líneas de las cajas
)

# Ajuste del diseño del gráfico
fig <- fig %>% layout(
  title = "GASTOS OPERACIONALES", 
  yaxis = list(
    title = "Gastos Operacionales (COP)",  # Etiqueta del eje Y con formato en COP
    zeroline = FALSE,
    tickprefix = "$",             # Prefijo de pesos colombianos
    tickformat = ",.0f"          # Formato de los ticks (sin decimales)
  ),
  showlegend = FALSE            # Ocultar la leyenda si no es necesaria
)

# Mostrar el gráfico
fig
Ver código
# Creación del gráfico de caja y bigotes con la variable 'GAS-NO-OPERAC'
fig <- plot_ly(
  data = datos, 
  y = ~`GAS-NO-OPERAC`,  # Cambiado a 'y' para un gráfico vertical
  type = 'box',
  boxpoints = 'all',           # Muestra todos los puntos de datos
  jitter = 0.3,                # Dispersión de los puntos de datos
  pointpos = -1.8,             # Posición de los puntos de datos
  marker = list(color = 'purple'), # Color de los puntos de datos
  line = list(color = 'black')  # Color de las líneas de las cajas
)

# Ajuste del diseño del gráfico
fig <- fig %>% layout(
  title = "GASTOS NO OPERACIONALES", 
  yaxis = list(
    title = "Gastos No Operacionales (COP)",  # Etiqueta del eje Y con formato en COP
    zeroline = FALSE,
    tickprefix = "$",             # Prefijo de pesos colombianos
    tickformat = ",.0f"          # Formato de los ticks (sin decimales)
  ),
  showlegend = FALSE            # Ocultar la leyenda si no es necesaria
)

# Mostrar el gráfico
fig
Ver código
# Creación del gráfico de caja y bigotes con la variable 'COS-VEN'
fig <- plot_ly(
  data = datos, 
  y = ~`COS-VEN`,  # Cambiado a 'y' para un gráfico vertical
  type = 'box',
  boxpoints = 'all',           # Muestra todos los puntos de datos
  jitter = 0.3,                # Dispersión de los puntos de datos
  pointpos = -1.8,             # Posición de los puntos de datos
  marker = list(color = 'purple'), # Color de los puntos de datos
  line = list(color = 'black')  # Color de las líneas de las cajas
)

# Ajuste del diseño del gráfico
fig <- fig %>% layout(
  title = "GASTOS", 
  yaxis = list(
    title = "Gastos (COP)",  # Etiqueta del eje Y con formato en COP
    zeroline = FALSE,
    tickprefix = "$",             # Prefijo de pesos colombianos
    tickformat = ",.0f"          # Formato de los ticks (sin decimales)
  ),
  showlegend = FALSE            # Ocultar la leyenda si no es necesaria
)

# Mostrar el gráfico
fig
Ver código
# Creación del gráfico de caja y bigotes con la variable 'GAS-IMP'
fig <- plot_ly(
  data = datos, 
  y = ~`GAS-IMP`,  # Cambiado a 'y' para un gráfico vertical
  type = 'box',
  boxpoints = 'all',           # Muestra todos los puntos de datos
  jitter = 0.3,                # Dispersión de los puntos de datos
  pointpos = -1.8,             # Posición de los puntos de datos
  marker = list(color = 'purple'), # Color de los puntos de datos
  line = list(color = 'black')  # Color de las líneas de las cajas
)

# Ajuste del diseño del gráfico
fig <- fig %>% layout(
  title = "GASTO EN IMPUESTOS", 
  yaxis = list(
    title = "Gasto en Impuestos (COP)",  # Etiqueta del eje Y con formato en COP
    zeroline = FALSE,
    tickprefix = "$",             # Prefijo de pesos colombianos
    tickformat = ",.0f"          # Formato de los ticks (sin decimales)
  ),
  showlegend = FALSE            # Ocultar la leyenda si no es necesaria
)

# Mostrar el gráfico
fig
Ver código
# Creación del gráfico de caja y bigotes con la variable 'UTIL-OPERACIONAL'
fig <- plot_ly(
  data = datos, 
  y = ~`UTIL-OPERACIONAL`,  # Cambiado a 'y' para un gráfico vertical
  type = 'box',
  boxpoints = 'all',           # Muestra todos los puntos de datos
  jitter = 0.3,                # Dispersión de los puntos de datos
  pointpos = -1.8,             # Posición de los puntos de datos
  marker = list(color = 'purple'), # Color de los puntos de datos
  line = list(color = 'black')  # Color de las líneas de las cajas
)

# Ajuste del diseño del gráfico
fig <- fig %>% layout(
  title = "UTILIDAD OPERACIONAL", 
  yaxis = list(
    title = "Utilidad Operacional (COP)",  # Etiqueta del eje Y con formato en COP
    zeroline = FALSE,
    tickprefix = "$",             # Prefijo de pesos colombianos
    tickformat = ",.0f"          # Formato de los ticks (sin decimales)
  ),
  showlegend = FALSE            # Ocultar la leyenda si no es necesaria
)

# Mostrar el gráfico
fig
Ver código
# Creación del gráfico de caja y bigotes con la variable 'UTIL-NETA'
fig <- plot_ly(
  data = datos, 
  y = ~`UTIL-NETA`,  # Cambiado a 'y' para un gráfico vertical
  type = 'box',
  boxpoints = 'all',           # Muestra todos los puntos de datos
  jitter = 0.3,                # Dispersión de los puntos de datos
  pointpos = -1.8,             # Posición de los puntos de datos
  marker = list(color = 'purple'), # Color de los puntos de datos
  line = list(color = 'black')  # Color de las líneas de las cajas
)

# Ajuste del diseño del gráfico
fig <- fig %>% layout(
  title = "UTILIDAD NETA", 
  yaxis = list(
    title = "Utilidad Neta (COP)",  # Etiqueta del eje Y con formato en COP
    zeroline = FALSE,
    tickprefix = "$",             # Prefijo de pesos colombianos
    tickformat = ",.0f"          # Formato de los ticks (sin decimales)
  ),
  showlegend = FALSE            # Ocultar la leyenda si no es necesaria
)

# Mostrar el gráfico
fig
Ver código
# Creación del gráfico de caja y bigotes con la variable 'ACTIV_2019'
fig <- plot_ly(
  data = datos, 
  y = ~`ACTIV_2019`,  # Cambiado a 'y' para un gráfico vertical
  type = 'box',
  boxpoints = 'all',           # Muestra todos los puntos de datos
  jitter = 0.3,                # Dispersión de los puntos de datos
  pointpos = -1.8,             # Posición de los puntos de datos
  marker = list(color = 'purple'), # Color de los puntos de datos
  line = list(color = 'black')  # Color de las líneas de las cajas
)

# Ajuste del diseño del gráfico
fig <- fig %>% layout(
  title = "ACTIVOS 2019", 
  yaxis = list(
    title = "Activos 2019 (COP)",  # Etiqueta del eje Y con formato en COP
    zeroline = FALSE,
    tickprefix = "$",             # Prefijo de pesos colombianos
    tickformat = ",.0f"          # Formato de los ticks (sin decimales)
  ),
  showlegend = FALSE            # Ocultar la leyenda si no es necesaria
)

# Mostrar el gráfico
fig
Ver código
# Creación del gráfico de caja y bigotes con la variable 'ACTIV_2020'
fig <- plot_ly(
  data = datos, 
  y = ~`ACTIV_2020`,  # Cambiado a 'y' para un gráfico vertical
  type = 'box',
  boxpoints = 'all',           # Muestra todos los puntos de datos
  jitter = 0.3,                # Dispersión de los puntos de datos
  pointpos = -1.8,             # Posición de los puntos de datos
  marker = list(color = 'purple'), # Color de los puntos de datos
  line = list(color = 'black')  # Color de las líneas de las cajas
)

# Ajuste del diseño del gráfico
fig <- fig %>% layout(
  title = "ACTIVOS 2020", 
  yaxis = list(
    title = "Activos 2020 (COP)",  # Etiqueta del eje Y con formato en COP
    zeroline = FALSE,
    tickprefix = "$",             # Prefijo de pesos colombianos
    tickformat = ",.0f"          # Formato de los ticks (sin decimales)
  ),
  showlegend = FALSE            # Ocultar la leyenda si no es necesaria
)

# Mostrar el gráfico
fig
Ver código
# Creación del gráfico de caja y bigotes con la variable 'ACTIV_2021'
fig <- plot_ly(
  data = datos, 
  y = ~`ACTIV_2021`,  # Cambiado a 'y' para un gráfico vertical
  type = 'box',
  boxpoints = 'all',           # Muestra todos los puntos de datos
  jitter = 0.3,                # Dispersión de los puntos de datos
  pointpos = -1.8,             # Posición de los puntos de datos
  marker = list(color = 'purple'), # Color de los puntos de datos
  line = list(color = 'black')  # Color de las líneas de las cajas
)

# Ajuste del diseño del gráfico
fig <- fig %>% layout(
  title = "ACTIVOS 2021", 
  yaxis = list(
    title = "Activos 2021 (COP)", # Etiqueta del eje Y
    zeroline = FALSE,
    tickprefix = "$",             # Prefijo de pesos colombianos
    tickformat = ",.0f"          # Formato de los ticks (sin decimales)
  ),
  showlegend = FALSE            # Ocultar la leyenda si no es necesaria
)

# Mostrar el gráfico
fig
Ver código
# Creación del gráfico de caja y bigotes con la variable 'ACTIV-2022'
fig <- plot_ly(
  data = datos, 
  y = ~`ACTIV_2022`,  # Cambiado a 'y' para un gráfico vertical
  type = 'box',
  boxpoints = 'all',           # Muestra todos los puntos de datos
  jitter = 0.3,                # Dispersión de los puntos de datos
  pointpos = -1.8,             # Posición de los puntos de datos
  marker = list(color = 'purple'), # Color de los puntos de datos
  line = list(color = 'black')  # Color de las líneas de las cajas
)

# Ajuste del diseño del gráfico
fig <- fig %>% layout(
  title = "ACTIVOS 2022", 
  yaxis = list(
    title = "Activos 2022 (COP)", 
    zeroline = FALSE,
    tickprefix = "$",             # Prefijo de pesos colombianos
    tickformat = ",.0f"          # Formato de los ticks (sin decimales)
  ),
  showlegend = FALSE            # Ocultar la leyenda si no es necesaria
)

# Mostrar el gráfico
fig
Ver código
# Creación del gráfico de caja y bigotes con la variable 'ACTIV-2023'
fig <- plot_ly(
  data = datos, 
  y = ~`ACTIV_2023`,  # Cambiado a 'y' para un gráfico vertical
  type = 'box',
  boxpoints = 'all',           # Muestra todos los puntos de datos
  jitter = 0.3,                # Dispersión de los puntos de datos
  pointpos = -1.8,             # Posición de los puntos de datos
  marker = list(color = 'purple'), # Color de los puntos de datos
  line = list(color = 'black'))  # Color de las líneas de las cajas


# Ajuste del diseño del gráfico
fig <- fig %>% layout(
  title = "ACTIVOS 2023", 
  yaxis = list(
    title = "Activos 2023 (COP)", 
    zeroline = FALSE,
    tickprefix = "",             # Prefijo vacío si no deseas ningún símbolo
    ticksuffix = "B",            # Sufijo para billones
    tickformat = ",.1f"          # Formato de los ticks (1 decimal)
  ),
  showlegend = FALSE            # Ocultar la leyenda si no es necesaria
)

# Mostrar el gráfico
fig

Análisis bivariado

Para realizar el análisis bivariado, optamos por revisar las varianzas, correlaciones y demás medidas estadísticas que podrían ayudarnos a dar un vistazo más global a nuestra base de datos:

Ver código
suppressWarnings({
suppressMessages({
  
library(knitr)
library(kableExtra)
  
})
})


# Calcular la matriz de varianzas y covarianzas poblacional
n <- nrow(datos)
matriz_cov <- var(datos[, c(14, 17:37)]) * (n - 1) / n

# Crear la tabla en HTML y mostrarla en el Viewer
kable(matriz_cov, digits = 2, format = "html") %>%
  kable_styling(full_width = F) %>%
  scroll_box(width = "800px", height = "500px") %>%
  as.character() %>%
  htmltools::HTML() %>%
  htmltools::browsable()
ING-TAM-EMPRESARIAL ACTIVO-CORRIENTE ACTIVO-NO-CORRIENTE ACTIVO-TOTAL PASIVO-CORRIENTE PASIVO-LRG-PLAZO PASIVO-TOTAL PATRIMONIO PASIVO+PATRIM ING-OPERACIONES ING-NO-OPERACIONALES GAS-OPERACIONALES GAS-NO-OPERAC COS-VEN GAS-IMP UTIL-OPERACIONAL UTIL-NETA ACTIV_2019 ACTIV_2020 ACTIV_2021 ACTIV_2022 ACTIV_2023
ING-TAM-EMPRESARIAL 64654261018221715456 14989580900437821440 83063833492260716544 98053400798892933120 35943897292587687936 35109934523863203840 71053827614056611840 26999579821037760512 98053517456634200064 64654261018221715456 547483418749453760 3595018295191505408 1030812481182242176 59554605191633567744 500795339165746944 526822047503734272 -148049836110863968 792188376472389504 4832467854238955520 5507867501367943168 35297869394038775808 98053458231000760320
ACTIVO-CORRIENTE 14989580900437821440 4090322870922880512 20278658801469734912 24368978338497040384 8826418623538010112 8569498505857320960 17395916121425063936 6973063804833391616 24368993608115904512 14989580900437821440 109730388973705440 575383684351823680 260142103374024544 13811784884357466112 116005396962412912 112997436997619936 -60520390727177936 343436225104147648 1533970861123548160 1737109021995517696 9004962509424740352 24368987953220280320
ACTIVO-NO-CORRIENTE 83063833492260716544 20278658801469734912 146999345643685527552 167277996448732872704 60416239652250853376 60602237386459226112 121018474620137291786 46259525640088444938 167278062882195505152 83063833492260716544 623368042372728320 591112770440238720 1444869960350200832 81632414114376925184 721649531688583936 97147471062014912 -656711266281957504 118000177067851696 830093836140056960 1568535702808941312 53521126716475539456 167278049504988823552
ACTIVO-TOTAL 98053400798892933120 24368978338497040384 167277996448732872704 191646963468591661066 69242654086054461440 69171732322930081792 138414382984512045066 53232585881279971338 191647045173601042442 98053400798892933120 733098311037428992 1166494719437435136 1705011832100773888 95444188638044504064 837654830402120832 210144649486620288 -717231692249910784 461435252708797184 2364062307238216704 3305641791988486656 62526083319148273664 191647026141110534144
PASIVO-CORRIENTE 35943897292587687936 8826418623538010112 60416239652250853376 69242654086054461440 25141074252855205888 25015618734197874688 50156691715399491584 19085964379134201856 69242689070886723584 35943897292587687936 272614829466246528 524374977870532800 627421428058944768 35037976330987192320 304359430344961664 84275735139020224 -254561020387483936 77642872527806048 908137638551863168 1242907445393383424 22669162233361240064 69242682025635471360
PASIVO-LRG-PLAZO 35109934523863203840 8569498505857320960 60602237386459226112 69171732322930081792 25015618734197874688 25088854787575476224 50104472443734204416 19067261579810463744 69171761928457592832 35109934523863203840 264787181515704160 386082291349837824 614700340513622528 34360966099693375488 300140280653357056 58456990954351160 -265829246235385344 55303682622247816 585924754414528256 887620686359792896 22340292469329784832 69171755966324178944
PASIVO-TOTAL 71053827614056611840 17395916121425063936 121018474620137291786 138414382984512045066 50156691715399491584 50104472443734204416 100261161813385478144 38153224880253640704 138414447575450861578 71053827614056611840 537401974847002752 910456705317170560 1242121699003796736 69398939227611955200 604499680480282624 142732649580850832 -520390277492983040 132946205485684112 1494061669209462528 2130527246040965120 45009452914412707840 138414434567949615104
PATRIMONIO 26999579821037760512 6973063804833391616 46259525640088444938 53232585881279971338 19085964379134201856 19067261579810463744 38153224880253640704 15079362695128920064 53232602994437087232 26999579821037760512 195696393193927520 256038892153130272 462890242841924672 26045254446088159232 233155198064144672 67412109545549952 -196841402999568704 328489588317098496 870001775043004544 1175115948564747008 17516633224220196864 53232596969631760384
PASIVO+PATRIM 98053517456634200064 24368993608115904512 167278062882195505152 191647045173601042442 69242689070886723584 69171761928457592832 138414447575450861578 53232602994437087232 191647139473048797184 98053517456634200064 733099303395024256 1166510205530961408 1705013742621269760 95444276601693503498 837655668497720576 210146771459366848 -717231372973773952 461444998353787904 2364082430816380416 3305666399562345472 62526132800115408896 191647120443760115722
ING-OPERACIONES 64654261018221715456 14989580900437821440 83063833492260716544 98053400798892933120 35943897292587687936 35109934523863203840 71053827614056611840 26999579821037760512 98053517456634200064 64654261018221715456 547483418749453760 3595018295191505408 1030812481182242176 59554605191633567744 500795339165746944 526822047503734272 -148049836110863968 792188376472389504 4832467854238955520 5507867501367943168 35297869394038775808 98053458231000760320
ING-NO-OPERACIONALES 547483418749453760 109730388973705440 623368042372728320 733098311037428992 272614829466246528 264787181515704160 537401974847002752 195696393193927520 733099303395024256 547483418749453760 6756953928459890 40360006153942424 7558339290728099 501794084231917504 4440482408398533 5852938405761286 1409846671960618 4927971006691181 31484316668403128 36865709982077992 259679870441528480 733099103590440576
GAS-OPERACIONALES 3595018295191505408 575383684351823680 591112770440238720 1166494719437435136 524374977870532800 386082291349837824 910456705317170560 256038892153130272 1166510205530961408 3595018295191505408 40360006153942424 1077319838070754304 39104572050073008 2473705937638964224 20946127947109580 79549334829772512 36391244127383224 103383017572037040 611373507594444928 637187282245518720 887490748130197376 1166506036505419008
GAS-NO-OPERAC 1030812481182242176 260142103374024544 1444869960350200832 1705011832100773888 627421428058944768 614700340513622528 1242121699003796736 462890242841924672 1705013742621269760 1030812481182242176 7558339290728099 39104572050073008 24467303673585720 979759310011621504 8263870377344272 6145128884131491 -7129564394170284 18372580136775828 83166793710405296 101379609152128176 616845944274375168 1705013365504511744
COS-VEN 59554605191633567744 13811784884357466112 81632414114376925184 95444188638044504064 35037976330987192320 34360966099693375488 69398939227611955200 26045254446088159232 95444276601693503498 59554605191633567744 501794084231917504 2473705937638964224 979759310011621504 56493775137190854656 472882342264649920 431450052338086400 -185788727311017440 445247750908815040 3755073278675521536 4341889501003958784 33571946827146313728 95444224212932444160
GAS-IMP 500795339165746944 116005396962412912 721649531688583936 837654830402120832 304359430344961664 300140280653357056 604499680480282624 233155198064144672 837655668497720576 500795339165746944 4440482408398533 20946127947109580 8263870377344272 472882342264649920 4849456870994958 5691714524251682 -726034275954635 10259850686508052 23734292280932160 30093527633534704 285088091222406848 837655499750838272
UTIL-OPERACIONAL 526822047503734272 112997436997619936 97147471062014912 210144649486620288 84275735139020224 58456990954351160 142732649580850832 67412109545549952 210146771459366848 526822047503734272 5852938405761286 79549334829772512 6145128884131491 431450052338086400 5691714524251682 32570515698947324 14196880259993876 37532727094532728 111592820562707504 121347660076644896 160838082371429376 210145198237546848
UTIL-NETA -148049836110863968 -60520390727177936 -656711266281957504 -717231692249910784 -254561020387483936 -265829246235385344 -520390277492983040 -196841402999568704 -717231372973773952 -148049836110863968 1409846671960618 36391244127383224 -7129564394170284 -185788727311017440 -726034275954635 14196880259993876 14792213867115886 10692217405622230 28073662704330144 23501907317354924 -205192742523716832 -717231521671697664
ACTIV_2019 792188376472389504 343436225104147648 118000177067851696 461435252708797184 77642872527806048 55303682622247816 132946205485684112 328489588317098496 461444998353787904 792188376472389504 4927971006691181 103383017572037040 18372580136775828 445247750908815040 10259850686508052 37532727094532728 10692217405622230 304183682571562240 399039288743840064 464770051080815296 474429583301868928 461442876987243520
ACTIV_2020 4832467854238955520 1533970861123548160 830093836140056960 2364062307238216704 908137638551863168 585924754414528256 1494061669209462528 870001775043004544 2364082430816380416 4832467854238955520 31484316668403128 611373507594444928 83166793710405296 3755073278675521536 23734292280932160 111592820562707504 28073662704330144 399039288743840064 1984495561612012032 2014557711342851584 2363055664277509632 2364078155998122496
ACTIV_2021 5507867501367943168 1737109021995517696 1568535702808941312 3305641791988486656 1242907445393383424 887620686359792896 2130527246040965120 1175115948564747008 3305666399562345472 5507867501367943168 36865709982077992 637187282245518720 101379609152128176 4341889501003958784 30093527633534704 121347660076644896 23501907317354924 464770051080815296 2014557711342851584 2132195979823006464 2765803819764941312 3305661056782542336
ACTIV_2022 35297869394038775808 9004962509424740352 53521126716475539456 62526083319148273664 22669162233361240064 22340292469329784832 45009452914412707840 17516633224220196864 62526132800115408896 35297869394038775808 259679870441528480 887490748130197376 616845944274375168 33571946827146313728 285088091222406848 160838082371429376 -205192742523716832 474429583301868928 2363055664277509632 2765803819764941312 21820003161410461696 62526122455050600458
ACTIV_2023 98053458231000760320 24368987953220280320 167278049504988823552 191647026141110534144 69242682025635471360 69171755966324178944 138414434567949615104 53232596969631760384 191647120443760115722 98053458231000760320 733099103590440576 1166506036505419008 1705013365504511744 95444224212932444160 837655499750838272 210145198237546848 -717231521671697664 461442876987243520 2364078155998122496 3305661056782542336 62526122455050600458 191647102361622216704

La matriz de varianzas y covarianzas no nos fue muy útil al momento de buscar una interpretación sobre las variables, pues, al ser variables relacionadas con millones de pesos y teniendo valores tan atípicos,no fue muy razonable utilizar estos resultados; pero decidimos mostrarla igualmente para mostrar más precisamente el por qué no nos fue útil.

Por otro lado, la correlación entre variables si nos dió información que podíamos interpretar con más facilidad:

Ver código
heatmap(cor(datos[,c(14,17:37)]), 
        Rowv = NA, 
        Colv = NA, 
        col = colorRampPalette(c("#e0bbe4", "#6a0572"))(20), 
        scale = "none", 
        margins = c(5, 5))

El mapa de calor de la matriz de correlaciones nos da un adelanto de los resultados futuros: hay muchas variables que dependen entre sí y no aportan mucho a los ejes.

Ver código
library(knitr)
library(kableExtra)
library(FactoClass)

# Calcular la matriz de correlaciones
matriz_cor <- cor(datos[, c(14, 17:37)])

# Crear la tabla en HTML y mostrarla en el Viewer
kable(matriz_cor, digits = 2, format = "html") %>%
  kable_styling(full_width = F) %>%
  scroll_box(width = "800px", height = "500px") %>%
  as.character() %>%
  htmltools::HTML() %>%
  htmltools::browsable()
ING-TAM-EMPRESARIAL ACTIVO-CORRIENTE ACTIVO-NO-CORRIENTE ACTIVO-TOTAL PASIVO-CORRIENTE PASIVO-LRG-PLAZO PASIVO-TOTAL PATRIMONIO PASIVO+PATRIM ING-OPERACIONES ING-NO-OPERACIONALES GAS-OPERACIONALES GAS-NO-OPERAC COS-VEN GAS-IMP UTIL-OPERACIONAL UTIL-NETA ACTIV_2019 ACTIV_2020 ACTIV_2021 ACTIV_2022 ACTIV_2023
ING-TAM-EMPRESARIAL 1.00 0.92 0.85 0.88 0.89 0.87 0.88 0.86 0.88 1.00 0.83 0.43 0.82 0.99 0.89 0.36 -0.15 0.18 0.43 0.47 0.94 0.88
ACTIVO-CORRIENTE 0.92 1.00 0.83 0.87 0.87 0.85 0.86 0.89 0.87 0.92 0.66 0.27 0.82 0.91 0.82 0.31 -0.25 0.31 0.54 0.59 0.95 0.87
ACTIVO-NO-CORRIENTE 0.85 0.83 1.00 1.00 0.99 1.00 1.00 0.98 1.00 0.85 0.63 0.05 0.76 0.90 0.85 0.04 -0.45 0.02 0.05 0.09 0.95 1.00
ACTIVO-TOTAL 0.88 0.87 1.00 1.00 1.00 1.00 1.00 0.99 1.00 0.88 0.64 0.08 0.79 0.92 0.87 0.08 -0.43 0.06 0.12 0.16 0.97 1.00
PASIVO-CORRIENTE 0.89 0.87 0.99 1.00 1.00 1.00 1.00 0.98 1.00 0.89 0.66 0.10 0.80 0.93 0.87 0.09 -0.42 0.03 0.13 0.17 0.97 1.00
PASIVO-LRG-PLAZO 0.87 0.85 1.00 1.00 1.00 1.00 1.00 0.98 1.00 0.87 0.64 0.07 0.78 0.91 0.86 0.06 -0.44 0.02 0.08 0.12 0.95 1.00
PASIVO-TOTAL 0.88 0.86 1.00 1.00 1.00 1.00 1.00 0.98 1.00 0.88 0.65 0.09 0.79 0.92 0.87 0.08 -0.43 0.02 0.11 0.15 0.96 1.00
PATRIMONIO 0.86 0.89 0.98 0.99 0.98 0.98 0.98 1.00 0.99 0.86 0.61 0.06 0.76 0.89 0.86 0.10 -0.42 0.15 0.16 0.21 0.97 0.99
PASIVO+PATRIM 0.88 0.87 1.00 1.00 1.00 1.00 1.00 0.99 1.00 0.88 0.64 0.08 0.79 0.92 0.87 0.08 -0.43 0.06 0.12 0.16 0.97 1.00
ING-OPERACIONES 1.00 0.92 0.85 0.88 0.89 0.87 0.88 0.86 0.88 1.00 0.83 0.43 0.82 0.99 0.89 0.36 -0.15 0.18 0.43 0.47 0.94 0.88
ING-NO-OPERACIONALES 0.83 0.66 0.63 0.64 0.66 0.64 0.65 0.61 0.64 0.83 1.00 0.47 0.59 0.81 0.78 0.39 0.14 0.11 0.27 0.31 0.68 0.64
GAS-OPERACIONALES 0.43 0.27 0.05 0.08 0.10 0.07 0.09 0.06 0.08 0.43 0.47 1.00 0.24 0.32 0.29 0.42 0.29 0.18 0.42 0.42 0.18 0.08
GAS-NO-OPERAC 0.82 0.82 0.76 0.79 0.80 0.78 0.79 0.76 0.79 0.82 0.59 0.24 1.00 0.83 0.76 0.22 -0.37 0.21 0.38 0.44 0.84 0.79
COS-VEN 0.99 0.91 0.90 0.92 0.93 0.91 0.92 0.89 0.92 0.99 0.81 0.32 0.83 1.00 0.90 0.32 -0.20 0.11 0.35 0.40 0.96 0.92
GAS-IMP 0.89 0.82 0.85 0.87 0.87 0.86 0.87 0.86 0.87 0.89 0.78 0.29 0.76 0.90 1.00 0.45 -0.09 0.27 0.24 0.30 0.88 0.87
UTIL-OPERACIONAL 0.36 0.31 0.04 0.08 0.09 0.06 0.08 0.10 0.08 0.36 0.39 0.42 0.22 0.32 0.45 1.00 0.65 0.38 0.44 0.46 0.19 0.08
UTIL-NETA -0.15 -0.25 -0.45 -0.43 -0.42 -0.44 -0.43 -0.42 -0.43 -0.15 0.14 0.29 -0.37 -0.20 -0.09 0.65 1.00 0.16 0.16 0.13 -0.36 -0.43
ACTIV_2019 0.18 0.31 0.02 0.06 0.03 0.02 0.02 0.15 0.06 0.18 0.11 0.18 0.21 0.11 0.27 0.38 0.16 1.00 0.51 0.58 0.18 0.06
ACTIV_2020 0.43 0.54 0.05 0.12 0.13 0.08 0.11 0.16 0.12 0.43 0.27 0.42 0.38 0.35 0.24 0.44 0.16 0.51 1.00 0.98 0.36 0.12
ACTIV_2021 0.47 0.59 0.09 0.16 0.17 0.12 0.15 0.21 0.16 0.47 0.31 0.42 0.44 0.40 0.30 0.46 0.13 0.58 0.98 1.00 0.41 0.16
ACTIV_2022 0.94 0.95 0.95 0.97 0.97 0.95 0.96 0.97 0.97 0.94 0.68 0.18 0.84 0.96 0.88 0.19 -0.36 0.18 0.36 0.41 1.00 0.97
ACTIV_2023 0.88 0.87 1.00 1.00 1.00 1.00 1.00 0.99 1.00 0.88 0.64 0.08 0.79 0.92 0.87 0.08 -0.43 0.06 0.12 0.16 0.97 1.00

Es más fácil ver con esta matriz que hay valores con 1.00 que no necesariamente están en la diagonal, eso nos dice mucho sobre nuestros datos; indica una independencia que esperábamos inicialmente, pero que no sabíamos iba a ser un común denominador entre tantas variables.

Ahora, sabiendo esto, procedemos a realizar el análisis de componentes principales, para ver qué variables aportan más.

Análisis de componentes principales (ACP)

Inercia de cada eje

Ver código
suppressWarnings({

suppressMessages({
  
if (!require(FactoMineR))install.packages("FactoMineR")
library(FactoMineR)
  if (!require(factoextra)) install.packages("factoextra")
library(factoextra)
})
})


res.PCA <- PCA(datos, quali.sup = c(1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11,  
     12, 13, 15, 16), graph = FALSE)

summary(res.PCA)

Call:
PCA(X = datos, quali.sup = c(1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11,  
     12, 13, 15, 16), graph = FALSE) 


Eigenvalues
                       Dim.1   Dim.2   Dim.3   Dim.4   Dim.5   Dim.6   Dim.7
Variance              14.728   3.548   1.456   0.863   0.520   0.334   0.268
% of var.             66.945  16.129   6.616   3.923   2.362   1.520   1.217
Cumulative % of var.  66.945  83.074  89.690  93.613  95.975  97.496  98.713
                       Dim.8   Dim.9  Dim.10  Dim.11  Dim.12  Dim.13  Dim.14
Variance               0.114   0.062   0.050   0.033   0.011   0.007   0.003
% of var.              0.518   0.283   0.228   0.149   0.051   0.032   0.016
Cumulative % of var.  99.231  99.514  99.742  99.891  99.942  99.974  99.990
                      Dim.15  Dim.16  Dim.17  Dim.18  Dim.19  Dim.20  Dim.21
Variance               0.002   0.000   0.000   0.000   0.000   0.000   0.000
% of var.              0.008   0.002   0.000   0.000   0.000   0.000   0.000
Cumulative % of var.  99.998 100.000 100.000 100.000 100.000 100.000 100.000
                      Dim.22
Variance               0.000
% of var.              0.000
Cumulative % of var. 100.000

Individuals (the 10 first)
                            Dist    Dim.1    ctr   cos2    Dim.2    ctr   cos2
1                       |  0.419 | -0.335  0.001  0.638 | -0.242  0.002  0.333
2                       |  0.541 | -0.216  0.000  0.159 |  0.085  0.000  0.025
3                       |  0.413 | -0.326  0.001  0.624 | -0.242  0.002  0.343
4                       |  9.816 |  0.792  0.005  0.007 | -4.803  0.820  0.239
5                       |  0.924 |  0.093  0.000  0.010 |  0.499  0.009  0.292
6                       |  0.336 | -0.277  0.001  0.680 | -0.112  0.000  0.111
7                       |  0.421 | -0.336  0.001  0.638 | -0.243  0.002  0.333
8                       |  0.397 | -0.321  0.001  0.651 | -0.219  0.002  0.303
9                       |  0.419 | -0.335  0.001  0.638 | -0.242  0.002  0.333
10                      |  0.361 | -0.307  0.001  0.723 | -0.171  0.001  0.226
                           Dim.3    ctr   cos2  
1                       |  0.033  0.000  0.006 |
2                       | -0.317  0.009  0.342 |
3                       |  0.030  0.000  0.005 |
4                       | -5.466  2.588  0.310 |
5                       | -0.527  0.024  0.326 |
6                       | -0.107  0.001  0.101 |
7                       |  0.034  0.000  0.007 |
8                       |  0.009  0.000  0.000 |
9                       |  0.033  0.000  0.006 |
10                      | -0.042  0.000  0.014 |

Variables (the 10 first)
                           Dim.1    ctr   cos2    Dim.2    ctr   cos2    Dim.3
ING-TAM-EMPRESARIAL     |  0.961  6.272  0.924 |  0.198  1.109  0.039 |  0.093
ACTIVO-CORRIENTE        |  0.937  5.966  0.879 |  0.201  1.142  0.041 | -0.184
ACTIVO-NO-CORRIENTE     |  0.953  6.165  0.908 | -0.286  2.308  0.082 |  0.032
ACTIVO-TOTAL            |  0.971  6.408  0.944 | -0.221  1.379  0.049 |  0.001
PASIVO-CORRIENTE        |  0.975  6.448  0.950 | -0.212  1.271  0.045 |  0.022
PASIVO-LRG-PLAZO        |  0.963  6.302  0.928 | -0.255  1.831  0.065 |  0.028
PASIVO-TOTAL            |  0.970  6.388  0.941 | -0.234  1.541  0.055 |  0.025
PATRIMONIO              |  0.962  6.287  0.926 | -0.186  0.971  0.034 | -0.061
PASIVO+PATRIM           |  0.971  6.408  0.944 | -0.221  1.379  0.049 |  0.001
ING-OPERACIONES         |  0.961  6.272  0.924 |  0.198  1.109  0.039 |  0.093
                           ctr   cos2  
ING-TAM-EMPRESARIAL      0.600  0.009 |
ACTIVO-CORRIENTE         2.326  0.034 |
ACTIVO-NO-CORRIENTE      0.070  0.001 |
ACTIVO-TOTAL             0.000  0.000 |
PASIVO-CORRIENTE         0.032  0.000 |
PASIVO-LRG-PLAZO         0.055  0.001 |
PASIVO-TOTAL             0.043  0.001 |
PATRIMONIO               0.256  0.004 |
PASIVO+PATRIM            0.000  0.000 |
ING-OPERACIONES          0.600  0.009 |

Supplementary categories (the 10 first)
                            Dist    Dim.1   cos2 v.test    Dim.2   cos2 v.test
JURIDICA                |  1.209 |  0.979  0.656  4.156 |  0.671  0.308  5.800
NATURAL                 |  0.405 | -0.328  0.656 -4.156 | -0.225  0.308 -5.800
GENERO_F                |  0.411 | -0.332  0.651 -1.827 | -0.232  0.318 -2.601
GENERO_M                |  0.399 | -0.325  0.661 -1.897 | -0.218  0.299 -2.597
GENERO_N/A              |  1.209 |  0.979  0.656  4.156 |  0.671  0.308  5.800
EMPREN-SOCIAL.N         |  0.031 |  0.025  0.657  0.666 |  0.017  0.314  0.939
EMPREN-SOCIAL.S         |  0.407 | -0.330  0.657 -0.666 | -0.228  0.314 -0.939
NACIONALIDAD_ALEMANA    |  0.421 | -0.337  0.641 -0.088 | -0.242  0.330 -0.128
NACIONALIDAD_COLOMBIANA |  0.405 | -0.328  0.657 -4.060 | -0.225  0.308 -5.662
NACIONALIDAD_FRANCESA   |  0.420 | -0.335  0.638 -0.087 | -0.242  0.332 -0.128
                           Dim.3   cos2 v.test  
JURIDICA                | -0.128  0.011 -1.723 |
NATURAL                 |  0.043  0.011  1.723 |
GENERO_F                |  0.037  0.008  0.652 |
GENERO_M                |  0.048  0.014  0.890 |
GENERO_N/A              | -0.128  0.011 -1.723 |
EMPREN-SOCIAL.N         | -0.003  0.007 -0.217 |
EMPREN-SOCIAL.S         |  0.034  0.007  0.217 |
NACIONALIDAD_ALEMANA    |  0.034  0.006  0.028 |
NACIONALIDAD_COLOMBIANA |  0.043  0.011  1.687 |
NACIONALIDAD_FRANCESA   |  0.033  0.006  0.028 |
Ver código
# Extraer información de las contribuciones
var_contrib <- get_pca_var(res.PCA)

# Crear y mostrar tabla de contribuciones de variables
contrib_table <- var_contrib$contrib
kable(contrib_table, caption = "Contribuciones de las Variables en el PCA")
Contribuciones de las Variables en el PCA
Dim.1 Dim.2 Dim.3 Dim.4 Dim.5
ING-TAM-EMPRESARIAL 6.2721304 1.1090507 0.5996589 1.6875463 0.0218336
ACTIVO-CORRIENTE 5.9663488 1.1416668 2.3257646 0.0005751 1.3329571
ACTIVO-NO-CORRIENTE 6.1649282 2.3077861 0.0696050 0.4673464 0.0472336
ACTIVO-TOTAL 6.4080039 1.3791470 0.0000683 0.3626772 0.0004696
PASIVO-CORRIENTE 6.4482579 1.2708000 0.0321365 0.0443493 0.0957080
PASIVO-LRG-PLAZO 6.3024288 1.8311301 0.0553478 0.1652813 0.0008740
PASIVO-TOTAL 6.3878048 1.5411108 0.0430375 0.0953729 0.0196361
PATRIMONIO 6.2870966 0.9713784 0.2555018 1.8241711 0.1923583
PASIVO+PATRIM 6.4080079 1.3791313 0.0000683 0.3626763 0.0004701
ING-OPERACIONES 6.2721304 1.1090507 0.5996589 1.6875463 0.0218336
ING-NO-OPERACIONALES 3.7635730 2.0543178 11.8903979 1.9850170 0.5445171
GAS-OPERACIONALES 0.3955625 10.5461444 5.8997316 31.5303469 31.2837569
GAS-NO-OPERAC 4.9519898 0.1970896 2.3224838 1.0229471 0.0950954
COS-VEN 6.4559153 0.2490218 0.6824509 0.7375700 1.2270893
GAS-IMP 5.7101759 0.4323581 2.9104505 4.3870385 1.5986799
UTIL-OPERACIONAL 0.3807946 15.2456405 10.1079678 12.7464263 4.2997268
UTIL-NETA 0.6764792 11.5989736 22.2200630 7.3093776 4.9491140
ACTIV_2019 0.1877067 9.4826663 11.1300762 29.2009068 39.9863796
ACTIV_2020 0.6414300 17.3254999 13.5415673 2.6427503 9.0493436
ACTIV_2021 0.8542669 17.4469893 14.4839664 1.3707184 4.6905157
ACTIV_2022 6.6569622 0.0019101 0.8299286 0.0066831 0.5419375
ACTIV_2023 6.4080061 1.3791366 0.0000682 0.3626759 0.0004701
Ver código
# Extraer información de las distancias
var_distances <- get_pca_var(res.PCA)$cos2

# Crear y mostrar tabla de distancias
distance_table <- var_distances
kable(distance_table, caption = "Distancias de las Variables a los Componentes Principales en el PCA")
Distancias de las Variables a los Componentes Principales en el PCA
Dim.1 Dim.2 Dim.3 Dim.4 Dim.5
ING-TAM-EMPRESARIAL 0.9237541 0.0393526 0.0087287 0.0145629 0.0001135
ACTIVO-CORRIENTE 0.8787189 0.0405099 0.0338542 0.0000050 0.0069280
ACTIVO-NO-CORRIENTE 0.9079655 0.0818875 0.0010132 0.0040330 0.0002455
ACTIVO-TOTAL 0.9437655 0.0489365 0.0000010 0.0031298 0.0000024
PASIVO-CORRIENTE 0.9496940 0.0450920 0.0004678 0.0003827 0.0004974
PASIVO-LRG-PLAZO 0.9282164 0.0649742 0.0008057 0.0014263 0.0000045
PASIVO-TOTAL 0.9407905 0.0546834 0.0006265 0.0008230 0.0001021
PATRIMONIO 0.9259583 0.0344675 0.0037191 0.0157419 0.0009998
PASIVO+PATRIM 0.9437660 0.0489359 0.0000010 0.0031298 0.0000024
ING-OPERACIONES 0.9237541 0.0393526 0.0087287 0.0145629 0.0001135
ING-NO-OPERACIONALES 0.5542959 0.0728936 0.1730786 0.0171299 0.0028301
GAS-OPERACIONALES 0.0582581 0.3742102 0.0858775 0.2720944 0.1625959
GAS-NO-OPERAC 0.7293249 0.0069934 0.0338065 0.0088276 0.0004943
COS-VEN 0.9508218 0.0088361 0.0099339 0.0063649 0.0063777
GAS-IMP 0.8409899 0.0153414 0.0423650 0.0378584 0.0083091
UTIL-OPERACIONAL 0.0560831 0.5409631 0.1471333 0.1099966 0.0223476
UTIL-NETA 0.0996313 0.4115679 0.3234390 0.0630770 0.0257228
ACTIV_2019 0.0276453 0.3364747 0.1620113 0.2519923 0.2078273
ACTIV_2020 0.0944693 0.6147630 0.1971133 0.0228059 0.0470335
ACTIV_2021 0.1258157 0.6190738 0.2108310 0.0118288 0.0243787
ACTIV_2022 0.9804318 0.0000678 0.0120806 0.0000577 0.0028167
ACTIV_2023 0.9437658 0.0489361 0.0000010 0.0031297 0.0000024
Ver código
var_coords <- get_pca_var(res.PCA)$coord
coords_table <- var_coords
kable(coords_table, caption = "Coordenadas de las Variables en el PCA")
Coordenadas de las Variables en el PCA
Dim.1 Dim.2 Dim.3 Dim.4 Dim.5
ING-TAM-EMPRESARIAL 0.9611213 0.1983749 0.0934277 -0.1206767 -0.0106527
ACTIVO-CORRIENTE 0.9374001 0.2012707 -0.1839952 0.0022278 -0.0832345
ACTIVO-NO-CORRIENTE 0.9528722 -0.2861599 0.0318305 0.0635060 0.0156683
ACTIVO-TOTAL 0.9714759 -0.2212159 0.0009970 0.0559443 0.0015623
PASIVO-CORRIENTE 0.9745225 -0.2123487 0.0216283 0.0195632 -0.0223033
PASIVO-LRG-PLAZO 0.9634399 -0.2549004 0.0283840 0.0377665 0.0021313
PASIVO-TOTAL 0.9699436 -0.2338449 0.0250292 0.0286885 -0.0101024
PATRIMONIO 0.9622673 -0.1856544 -0.0609846 0.1254666 0.0316192
PASIVO+PATRIM 0.9714762 -0.2212146 0.0009968 0.0559442 0.0015631
ING-OPERACIONES 0.9611213 0.1983749 0.0934277 -0.1206767 -0.0106527
ING-NO-OPERACIONALES 0.7445105 0.2699882 0.4160272 -0.1308813 0.0531987
GAS-OPERACIONALES 0.2413672 0.6117272 0.2930486 -0.5216267 0.4032318
GAS-NO-OPERAC 0.8540052 0.0836263 -0.1838653 -0.0939555 0.0222318
COS-VEN 0.9751009 0.0940004 0.0996688 -0.0797806 -0.0798607
GAS-IMP 0.9170550 0.1238605 0.2058276 0.1945724 0.0911541
UTIL-OPERACIONAL 0.2368187 0.7355019 0.3835796 0.3316574 -0.1494912
UTIL-NETA -0.3156443 0.6415356 0.5687169 0.2511514 -0.1603833
ACTIV_2019 0.1662687 0.5800644 -0.4025062 0.5019883 0.4558808
ACTIV_2020 0.3073585 0.7840682 -0.4439745 -0.1510162 -0.2168722
ACTIV_2021 0.3547051 0.7868124 -0.4591634 -0.1087601 -0.1561369
ACTIV_2022 0.9901676 -0.0082326 -0.1099117 0.0075943 -0.0530725
ACTIV_2023 0.9714761 -0.2212150 0.0009967 0.0559442 0.0015631
Ver código
library(factoextra)

fviz_screeplot(res.PCA, 
               addlabels = TRUE, 
               ylim = c(0, 100), 
               ggtheme = theme_minimal(), 
               barfill = "purple", 
               barcolor = "black")

Ver código
library(kableExtra)

eig_values <- res.PCA$eig

eig_df <- data.frame(
  Component = 1:nrow(eig_values),
  Eigenvalue = eig_values[, 1],
  Variance_Explained = eig_values[, 2],
  Cumulative_Variance_Explained = eig_values[, 3]
)

kable(eig_df, digits = 2, col.names = c("Componente", "Eigenvalor", "Varianza Explicada (%)", "Varianza Acumulada (%)")) %>%
  kable_styling(full_width = FALSE) %>%
  scroll_box(width = "800px", height = "500px")
Componente Eigenvalor Varianza Explicada (%) Varianza Acumulada (%)
comp 1 1 14.73 66.95 66.95
comp 2 2 3.55 16.13 83.07
comp 3 3 1.46 6.62 89.69
comp 4 4 0.86 3.92 93.61
comp 5 5 0.52 2.36 95.98
comp 6 6 0.33 1.52 97.50
comp 7 7 0.27 1.22 98.71
comp 8 8 0.11 0.52 99.23
comp 9 9 0.06 0.28 99.51
comp 10 10 0.05 0.23 99.74
comp 11 11 0.03 0.15 99.89
comp 12 12 0.01 0.05 99.94
comp 13 13 0.01 0.03 99.97
comp 14 14 0.00 0.02 99.99
comp 15 15 0.00 0.01 100.00
comp 16 16 0.00 0.00 100.00
comp 17 17 0.00 0.00 100.00
comp 18 18 0.00 0.00 100.00
comp 19 19 0.00 0.00 100.00
comp 20 20 0.00 0.00 100.00
comp 21 21 0.00 0.00 100.00
comp 22 22 0.00 0.00 100.00

Ahora, vemos (en cada columna) la inercia de cada eje, qué tan representativo es cada uno y su acumulativo. Esto nos será útil para visualizar con cuántos ejes vamos a trabajar. En este caso trabajaremos con los tres primeros.

Proyección de las variables en los nuevos ejes

Ver código
plot.PCA(res.PCA,axes=c(1,2),choix='var')
Warning: ggrepel: 7 unlabeled data points (too many overlaps). Consider
increasing max.overlaps

Ver código
plot.PCA(res.PCA,axes=c(2,3),choix='var')
Warning: ggrepel: 11 unlabeled data points (too many overlaps). Consider
increasing max.overlaps

Ver código
plot.PCA(res.PCA,axes=c(1,3),choix='var')
Warning: ggrepel: 11 unlabeled data points (too many overlaps). Consider
increasing max.overlaps

Visualización de categoricas en los nuevos ejes

Ver código
fviz_pca_biplot(res.PCA, label = "none",
                habillage = datos$GENERO,
                addEllipses = TRUE)

Se realizó esta visualización para comprobar que tanto estaban afectando los datos atipicos a nuestro analisis. Como se puede observar las personas juridicas se llevan muy por encima a las personas naturales, por eso casi no se ven las elipses de el genero femenino ni la del masculino.

Dado a que no se puede hacer una analisis correcto por este medio, se realizara un ACP diferente para solo las personas naturales.

Personas naturales

Diagnostico inicial

Ver código
# Seleccionamos el archivo CSV 

ruta_archivo <- file.choose()



# Carga el archivo CSV

datos_nat <- read.csv(ruta_archivo, sep = ";")
RAZON_SOCIAL GENERO EMPREN-SOCIAL NACIONALIDAD DIR-COMERCIAL MUN-COMERCIAL CATEGORIA ACTIVIDAD_ECONOMICA_PRINCIPAL DOS_O_MAS_ACT_ECON CANT-EST-BD CANT-MUJERES CANT-MUJERES-CAR-DIR PORCENT-PART-MUJ ING-TAM-EMPRESARIAL ESTRATO PERSONAL ACTIVO-CORRIENTE ACTIVO-NO-CORRIENTE ACTIVO-TOTAL PASIVO-CORRIENTE PASIVO-LRG-PLAZO PASIVO-TOTAL PATRIMONIO PASIVO+PATRIM ING-OPERACIONES ING-NO-OPERACIONALES GAS-OPERACIONALES GAS-NO-OPERAC COS-VEN GAS-IMP UTIL-OPERACIONAL UTIL-NETA ACTIV_2019 ACTIV_2020 ACTIV_2021 ACTIV_2022 ACTIV_2023
NATURAL F S COLOMBIANA RURAL 05148 - CARMEN DE VIBORAL AGROPECUARIA AGRICULTURA DOS O MÁS ACTIVIDADES ECONOMICAS uno 0 0 0 0 5 0 2000000 0 2000000 0 0 0 2000000 2000000 0 0 0 0 0 0 0 0 0 0 0 0 2000000
NATURAL F N COLOMBIANA URBANO 05674-SAN VICENTE FERRER AGROPECUARIA AGRICULTURA DOS O MÁS ACTIVIDADES ECONOMICAS uno 0 0 0 72850000 6 0 3000000 0 3000000 0 0 0 3000000 3000000 72850000 0 0 0 0 0 0 0 0 0 3000000 3000000 3000000
NATURAL M N COLOMBIANA RURAL 05541 - EL PENOL AGROPECUARIA GANADERÍA DOS O MÁS ACTIVIDADES ECONOMICAS uno 0 0 0 0 6 0 1000000 0 1000000 0 0 0 1000000 1000000 0 0 0 0 0 0 0 0 0 0 0 0 1000000
NATURAL M N COLOMBIANA URBANO 05318 - GUARNE AGROPECUARIA GANADERÍA DOS O MÁS ACTIVIDADES ECONOMICAS uno 0 0 0 170000000 6 3 4200000 0 4200000 0 0 0 4200000 4200000 170000000 0 0 0 0 0 0 0 2500000 3100000 3400000 3900000 4200000
NATURAL F N COLOMBIANA URBANO 05148 - CARMEN DE VIBORAL AGROPECUARIA GANADERÍA DOS O MÁS ACTIVIDADES ECONOMICAS uno 0 0 0 300 6 0 1000000 0 1000000 0 0 0 1000000 1000000 300 0 0 0 0 0 0 0 0 1000000 1100000 1000000 1000000
NATURAL M N COLOMBIANA URBANO 05440 - MARINILLA AUDIOVISUAL OTROS DOS O MÁS ACTIVIDADES ECONOMICAS uno 0 0 0 40000000 5 0 3000000 0 3000000 0 0 0 3000000 3000000 40000000 0 0 0 0 0 0 0 5500000 3000000 3000000 3000000 3000000
Ver código
suppressWarnings({

suppressMessages({
  
library(plotly)
library(readxl)
library(dplyr)
  
})

})

# Desactivar notación científica
options(scipen = 999)

# Especifica la ruta del archivo Excel
archivo_excel <- "C:/Users/catam/OneDrive/Escritorio/NATURALES.xlsx"

# Leer los datos desde Excel sin especificar col_types
dat_nat <- read_excel(archivo_excel)

# Función para limpiar y convertir las columnas a numéricas
clean_and_convert <- function(df) {
  df[] <- lapply(df, function(column) {
    if (is.character(column)) {
      column <- gsub(",", "", column) # Eliminar comas
      column <- gsub(" ", "", column) # Eliminar espacios
      column <- as.numeric(column)    # Convertir a numérico
    }
    return(column)
  })
  return(df)
}

# Aplicar la función a las columnas numéricas
# Identifica las columnas que deberían ser numéricas (aquí se asume que las columnas de la 14 a la 37 deberían ser numéricas)
columnas_numericas <- c(14,17:37)
dat_nat[, columnas_numericas] <- clean_and_convert(dat_nat[, columnas_numericas])

dat_nat$`CANT-EST-BD` <- as.factor(dat_nat$`CANT-EST-BD`)
dat_nat$GENERO <- as.factor(dat_nat$GENERO)
dat_nat$RAZON_SOCIAL <- as.factor(dat_nat$RAZON_SOCIAL)
dat_nat$`EMPREN-SOCIAL` <- as.factor(dat_nat$`EMPREN-SOCIAL`)
dat_nat$NACIONALIDAD <- as.factor(dat_nat$NACIONALIDAD)
dat_nat$`DIR-COMERCIAL` <- as.factor(dat_nat$`DIR-COMERCIAL`)
dat_nat$`MUN-COMERCIAL` <- as.factor(dat_nat$`MUN-COMERCIAL`)
dat_nat$CATEGORIA <- as.factor(dat_nat$CATEGORIA)
dat_nat$ACTIVIDAD_ECONOMICA_PRINCIPAL <- as.factor(dat_nat$ACTIVIDAD_ECONOMICA_PRINCIPAL)
dat_nat$DOS_O_MAS_ACT_ECON <- as.factor(dat_nat$DOS_O_MAS_ACT_ECON)
dat_nat$`CANT-MUJERES` <- as.factor(dat_nat$`CANT-MUJERES`)
dat_nat$`CANT-MUJERES-CAR-DIR` <- as.factor(dat_nat$`CANT-MUJERES-CAR-DIR`)
dat_nat$`PORCENT-PART-MUJ` <- as.factor(dat_nat$`PORCENT-PART-MUJ`)
dat_nat$ESTRATO <- as.factor(dat_nat$ESTRATO)
dat_nat$PERSONAL <- as.factor(dat_nat$PERSONAL)

# Muestra el resumen de los datos importados
summary(dat_nat)
  RAZON_SOCIAL GENERO  EMPREN-SOCIAL     NACIONALIDAD DIR-COMERCIAL
 NATURAL:594   F:286   N:547         COLOMBIANA:587   RURAL :162   
               M:308   S: 47         OTRO      :  7   URBANO:432   
                                                                   
                                                                   
                                                                   
                                                                   
                                                                   
                   MUN-COMERCIAL                               CATEGORIA  
 05615 - RIONEGRO         :147   ELABORACION DE PRODUCTOS DE CONSUMO:492  
 05440 - MARINILLA        : 76   HOTELERÍA Y TURISMO                : 56  
 05148 - CARMEN DE VIBORAL: 65   COMERCIO                           : 30  
 05376 - LA CEJA          : 54   AGROPECUARIA                       :  5  
 05318 - GUARNE           : 48   RECREACION                         :  4  
 05697 - SANTUARIO        : 24   AUDIOVISUAL                        :  2  
 (Other)                  :180   (Other)                            :  5  
        ACTIVIDAD_ECONOMICA_PRINCIPAL                        DOS_O_MAS_ACT_ECON
 ELABORACION PANADERIA :241           DOS O MÁS ACTIVIDADES ECONOMICAS:363     
 PRODUCTOS ALIMENTICIOS: 62           N/A                             :231     
 PROCESADOS ANIMALES   : 49                                                    
 ELABORACION DE COMIDA : 47                                                    
 PRODUCTOS DE MOLINERIA: 31                                                    
 POR MENOR             : 28                                                    
 (Other)               :136                                                    
    CANT-EST-BD   CANT-MUJERES CANT-MUJERES-CAR-DIR PORCENT-PART-MUJ
 cero     : 48   0      :447   0:594                0:594           
 dos_o_mas: 14   1      : 83                                        
 uno      :532   2      : 37                                        
                 3      : 15                                        
                 4      :  4                                        
                 5      :  3                                        
                 (Other):  5                                        
 ING-TAM-EMPRESARIAL  ESTRATO    PERSONAL   ACTIVO-CORRIENTE   
 Min.   :         0   1:410   0      :381   Min.   :        0  
 1st Qu.:         0   2:  2   1      :100   1st Qu.:  1600000  
 Median :   9300000   3:  1   2      : 52   Median :  3130000  
 Mean   :  49730165   4:  1   3      : 23   Mean   :  8100834  
 3rd Qu.:  36000000   5:128   4      : 15   3rd Qu.:  8242500  
 Max.   :5720881000   6: 52   5      : 10   Max.   :706777000  
                              (Other): 13                      
 ACTIVO-NO-CORRIENTE  ACTIVO-TOTAL       PASIVO-CORRIENTE    PASIVO-LRG-PLAZO 
 Min.   :        0   Min.   :        0   Min.   :        0   Min.   :      0  
 1st Qu.:        0   1st Qu.:  1900000   1st Qu.:        0   1st Qu.:      0  
 Median :        0   Median :  3500000   Median :        0   Median :      0  
 Mean   :  1165711   Mean   :  9278750   Mean   :  1388282   Mean   :  51088  
 3rd Qu.:        0   3rd Qu.:  9000000   3rd Qu.:        0   3rd Qu.:      0  
 Max.   :231266000   Max.   :938043000   Max.   :367530000   Max.   :9587000  
                                                                              
  PASIVO-TOTAL         PATRIMONIO        PASIVO+PATRIM      
 Min.   :        0   Min.   :        0   Min.   :        0  
 1st Qu.:        0   1st Qu.:  1300000   1st Qu.:  1900000  
 Median :        0   Median :  3000000   Median :  3500000  
 Mean   :  1444659   Mean   :  7826271   Mean   :  9278750  
 3rd Qu.:        0   3rd Qu.:  8000000   3rd Qu.:  9000000  
 Max.   :367530000   Max.   :604967325   Max.   :938043000  
                                                            
 ING-OPERACIONES      ING-NO-OPERACIONALES GAS-OPERACIONALES   
 Min.   :         0   Min.   :       0     Min.   :         0  
 1st Qu.:         0   1st Qu.:       0     1st Qu.:         0  
 Median :   9300000   Median :       0     Median :         0  
 Mean   :  49730165   Mean   :   89831     Mean   :   6749619  
 3rd Qu.:  36000000   3rd Qu.:       0     3rd Qu.:         0  
 Max.   :5720881000   Max.   :28358000     Max.   :2351202000  
                                                               
 GAS-NO-OPERAC          COS-VEN              GAS-IMP        
 Min.   :        0   Min.   :         0   Min.   :       0  
 1st Qu.:        0   1st Qu.:         0   1st Qu.:       0  
 Median :        0   Median :         0   Median :       0  
 Mean   :   531234   Mean   :  31938387   Mean   :  226587  
 3rd Qu.:        0   3rd Qu.:         0   3rd Qu.:       0  
 Max.   :121203000   Max.   :7200000000   Max.   :59629000  
                                                            
 UTIL-OPERACIONAL      UTIL-NETA           ACTIV_2019       
 Min.   :-23200000   Min.   :-23200000   Min.   :        0  
 1st Qu.:        0   1st Qu.:        0   1st Qu.:        0  
 Median :        0   Median :        0   Median :        0  
 Mean   :  2253259   Mean   :  1568277   Mean   :  2904919  
 3rd Qu.:        0   3rd Qu.:        0   3rd Qu.:  1737500  
 Max.   :338606000   Max.   :186132000   Max.   :470937000  
                                                            
   ACTIV_2020          ACTIV_2021          ACTIV_2022       
 Min.   :        0   Min.   :        0   Min.   :        0  
 1st Qu.:        0   1st Qu.:        0   1st Qu.:    17750  
 Median :        0   Median :  1185000   Median :  2250000  
 Mean   :  3543864   Mean   :  4338535   Mean   :  6543159  
 3rd Qu.:  3000000   3rd Qu.:  4537500   3rd Qu.:  6011275  
 Max.   :428599117   Max.   :379325000   Max.   :509312000  
                                                            
   ACTIV_2023       
 Min.   :        0  
 1st Qu.:  1800000  
 Median :  3500000  
 Mean   :  9310628  
 3rd Qu.:  8950050  
 Max.   :938043000  
                    

En este breve resumen vemos que algunas variables categóricas como la nacionalidad cambió, pues eran muy pocas las personas con nacionalidad extranjera en comparación a las colombianas, la cantidad de mujeres en cargos directivos y el porcentaje de participación de mujeres en estos cargos, por ejemplo, también puede interpretarse con facilidad, pues su único valor es 0. Por otro lado, en cuanto a las variables cuantitativas, vemos que se han reducido de manera evidente algunos valores que antes estaban disparados, como lo son los máximos en Activos, Pasivos, Ingresos, etc. Por supuesto que aún hay valores atípicos, pero no de manera tan drástica como anteriormente. También podemos ver que se siguen presentando varios percentiles de tercer orden en 0, lo que nos puede llegar a decir información a futuro de este grupo de empresarios.

Analisis Univariado

Histogramas sobre variables cualitativas

Ver código
fig <- plot_ly(dat_nat, x=~GENERO, type='histogram',  
               marker = list(color = '#76EEC6'))  
fig <- fig %>% layout(title = "GÉNERO",                        
                      xaxis=list((title="Actividad")),                        
                      yaxis=list(title='Frec. abs.'))  
fig  

En cuanto a género, podemos ver una paridad notable, lo que nos sugiere que al momento de responer la encuesta, aquellas mujeres cabezas de emprendimientos o autoras, no se consideraron como cargo directivo al ser únicas dueñas y/o empleadas y que posiblemente las preguntas tenían una redacción confusa.

Ver código
fig <- plot_ly(dat_nat, x=~NACIONALIDAD, type='histogram',  
               marker = list(color = '#76EEC6'))  
fig <- fig %>% layout(title = "NACIONALIDAD",                        
                      xaxis=list((title="Actividad")),                        
                      yaxis=list(title='Frec. abs.'))  
fig 

En cuanto a nacionalidad se mantiene que la colombiana es la que predomina.

Ver código
fig <- plot_ly(dat_nat, x=~`MUN-COMERCIAL`, type='histogram',  marker = list(color = '#76EEC6'))  
fig <- fig %>% layout(title = "MUNICIPIO COMERCIAL",                        
                      xaxis=list((title="Actividad")),                        
                      yaxis=list(title='Frec. abs.'))  
fig 

Rionegro sigue siendo el que cuenta con más emprendimientos registrados, pero ya vemos municipios como Marinilla, Carmen de Viboral y La Ceja dandonos un poco más de presencia que antes con la base de datos de personas naturales y jurídicas juntas.

Ver código
fig <- plot_ly(dat_nat, x=~`DIR-COMERCIAL`, type='histogram',  marker = list(color = '#76EEC6'))  
fig <- fig %>% layout(title = "DIRECCIÓN COMERCIAL",                        
                      xaxis=list((title="Actividad")),                        
                      yaxis=list(title='Frec. abs.'))  
fig 

Se mantiene que las personas naturales siguen optando por dirigir su empresa hacia zonas urbanas, por efectos de comercio y distribución efectiva y accequible.

Ver código
fig <- plot_ly(dat_nat, x=~ESTRATO, type='histogram',  marker = list(color = '#76EEC6'))  
fig <- fig %>% layout(title = "ESTRATO",                        
                      xaxis=list((title="Actividad")),                        
                      yaxis=list(title='Frec. abs.'))  
fig  

En el estrato optamos por no agrupar aún la categoría para que se visualizara con facilidad que el estrato 1 es aquel que sobrepasa por mucho a los demás.

Ver código
fig <- plot_ly(dat_nat, x=~CATEGORIA, type='histogram',  marker = list(color = '#76EEC6'))  
fig <- fig %>% layout(title = "CATEGORIA",                        
                      xaxis=list((title="Actividad")),                        
                      yaxis=list(title='Frec. abs.'))  
fig 

La elaboración de productos de consumo es la categoría que más eligen los oriente antioqueños interesados en el área de alimentación al momento de empezar su negocio vinculado a los alimentos.

Ver código
fig <- plot_ly(dat_nat, x=~DOS_O_MAS_ACT_ECON, type='histogram',  marker = list(color = '#76EEC6'))  
fig <- fig %>% layout(title = "DOS O MÁS ACTIVIDADES ECONÓMICAS",
                      xaxis=list((title="Actividad")),                        
                      yaxis=list(title='Frec. abs.'))  
fig

Que tengan dos o más actividades económicas nos indica que las personas optan por ofrecer diferentes tipos de servicios en un mismo establecimiento como forma de proyección a futuro de ampliarse como empresa.

Ver código
fig <- plot_ly(dat_nat, x=~ACTIVIDAD_ECONOMICA_PRINCIPAL, type='histogram',  marker = list(color = '#76EEC6'))  
fig <- fig %>% layout(title = "ACTIVIDAD ECONÓMICA PRINCIPAL",                  
                      xaxis=list((title="Actividad")),                        
                      yaxis=list(title='Frec. abs.'))  
fig 

En el oriente antioqueño no parecen faltar buenas paanderías y empresas que relacionen su comercio al consumo de productos alimenticios (antes que el expendio de comidas, por ejemplo).

Ver código
fig <- plot_ly(dat_nat, x=~PERSONAL, type='histogram',  marker = list(color = '#76EEC6'))  
fig <- fig %>% layout(title = "PERSONAL",                        
                      xaxis=list((title="Personal")),                        
                      yaxis=list(title='Frec. abs.'))  
fig 

Esta variable reafirma que la gran mayoría de individuos de este grupo se caracteriza por tener su propia empresa y dedicarse exclusivamente a ella, sin ningún tipo de apoyo laboral.

Ver código
fig <- plot_ly(dat_nat, x=~`CANT-MUJERES`, type='histogram',  marker = list(color = '#76EEC6'))  
fig <- fig %>% layout(title = "CANTIDAD DE MUJERES",                        
                      xaxis=list((title="A")),                        
                      yaxis=list(title='Frec. abs.'))  
fig 

Pocas empresas cuentan con personal femenino en sus empresas, a pesar de que este sector ha sido afianzado con una destreza con las mujeres por el tema de la sazón, el conocimiento y demás tardiciones, no se evidencia que hayan muchas mujeres dentro de estas empresas.

Ver código
fig <- plot_ly(dat_nat, x=~`EMPREN-SOCIAL`, type='histogram',  marker = list(color = '#76EEC6'))  
fig <- fig %>% layout(title = "ASPIRA O NO A FRANQUICIA",                       
                      xaxis=list((title="Franquiciado")),                       
                      yaxis=list(title='Frec. abs.'))  
fig 

Las personas naturales no aspiran a adquirir el título de franquiciados en el oriente antioqueño. ¿será que es únicamente en el oriente antioqueño?¿será más psoible que se trate de un común denominador en el país por algún tipo de impedimento económico o consecuencia legal/fiscal como declarantes ante la cámara de comercio?

Ver código
fig <- plot_ly(dat_nat, x=~`CANT-EST-BD`, type='histogram',  marker = list(color = '#76EEC6'))  
fig <- fig %>% layout(title = "ESTABLECIMIENTOS FÍSICOS",                       
                      xaxis=list((title="Actividad")),                        
                      yaxis=list(title='Frec. abs.'))  
fig 

De las 594 personas naturales, sólo 48 no cuentan con establecimientos físicos para su negocio. Consideramos esto como una presencia de empresas movidas por redes sociales, incluso voz a voz.

Diagramas variables cuantitativas

Ver código
# Creación del gráfico de caja y bigotes con ajustes de visualización
fig <- plot_ly(
  data = dat_nat, 
  y = ~`ING-TAM-EMPRESARIAL`,  # Cambiado a 'y' para un gráfico vertical
  type = 'box',
  boxpoints = 'all',           # Muestra todos los puntos de datos
  jitter = 0.3,                # Dispersión de los puntos de datos
  pointpos = -1.8,             # Posición de los puntos de datos
  marker = list(color = '#54FF9F'), # Color de los puntos de datos
  line = list(color = 'black')  # Color de las líneas de las cajas
)

# Ajuste del diseño del gráfico
fig <- fig %>% layout(
  title = "Distribución de los Ingresos", 
  yaxis = list(
    title = "Ingresos (COP)",    # Etiqueta del eje Y con formato en COP
    zeroline = FALSE,
    tickprefix = "$",           # Prefijo de pesos colombianos
    tickformat = ",.0f"        # Formato de los ticks (sin decimales)
  ),
  showlegend = FALSE            # Ocultar la leyenda si no es necesaria
)

# Mostrar el gráfico
fig
Ver código
# Creación del gráfico de caja y bigotes con la variable 'ACTIVO-TOTAL'
fig <- plot_ly(
  data = dat_nat, 
  y = ~`ACTIVO-TOTAL`,  # Cambiado a 'y' para un gráfico vertical
  type = 'box',
  boxpoints = 'all',           # Muestra todos los puntos de datos
  jitter = 0.3,                # Dispersión de los puntos de datos
  pointpos = -1.8,             # Posición de los puntos de datos
  marker = list(color = '#54FF9F'), # Color de los puntos de datos
  line = list(color = 'black')  # Color de las líneas de las cajas
)

# Ajuste del diseño del gráfico
fig <- fig %>% layout(
  title = "ACTIVO TOTAL", 
  yaxis = list(
    title = "Activo Total (COP)",  # Etiqueta del eje Y con formato en COP
    zeroline = FALSE,
    tickprefix = "$",             # Prefijo de pesos colombianos
    tickformat = ",.0f"          # Formato de los ticks (sin decimales)
  ),
  showlegend = FALSE            # Ocultar la leyenda si no es necesaria
)

# Mostrar el gráfico
fig
Ver código
# Creación del gráfico de caja y bigotes con la variable 'ACTIVO-CORRIENTE'
fig <- plot_ly(
  data = dat_nat, 
  y = ~`ACTIVO-CORRIENTE`,  # Cambiado a 'y' para un gráfico vertical
  type = 'box',
  boxpoints = 'all',           # Muestra todos los puntos de datos
  jitter = 0.3,                # Dispersión de los puntos de datos
  pointpos = -1.8,             # Posición de los puntos de datos
  marker = list(color = '#54FF9F'), # Color de los puntos de datos
  line = list(color = 'black')  # Color de las líneas de las cajas
)

# Ajuste del diseño del gráfico
fig <- fig %>% layout(
  title = "ACTIVO CORRIENTE", 
  yaxis = list(
    title = "Activo Corriente (COP)",  # Etiqueta del eje Y con formato en COP
    zeroline = FALSE,
    tickprefix = "$",             # Prefijo de pesos colombianos
    tickformat = ",.0f"          # Formato de los ticks (sin decimales)
  ),
  showlegend = FALSE            # Ocultar la leyenda si no es necesaria
)

# Mostrar el gráfico
fig
Ver código
# Creación del gráfico de caja y bigotes con la variable 'PASIVO-TOTAL'
fig <- plot_ly(
  data = dat_nat, 
  y = ~`PASIVO-TOTAL`,  # Cambiado a 'y' para un gráfico vertical
  type = 'box',
  boxpoints = 'all',           # Muestra todos los puntos de datos
  jitter = 0.3,                # Dispersión de los puntos de datos
  pointpos = -1.8,             # Posición de los puntos de datos
  marker = list(color = '#54FF9F'), # Color de los puntos de datos
  line = list(color = 'black')  # Color de las líneas de las cajas
)

# Ajuste del diseño del gráfico
fig <- fig %>% layout(
  title = "PASIVO TOTAL", 
  yaxis = list(
    title = "Pasivo Total (COP)",  # Etiqueta del eje Y con formato en COP
    zeroline = FALSE,
    tickprefix = "$",             # Prefijo de pesos colombianos
    tickformat = ",.0f"          # Formato de los ticks (sin decimales)
  ),
  showlegend = FALSE            # Ocultar la leyenda si no es necesaria
)

# Mostrar el gráfico
fig
Ver código
# Creación del gráfico de caja y bigotes con la variable 'PATRIMONIO'
fig <- plot_ly(
  data = dat_nat, 
  y = ~PATRIMONIO,  # Cambiado a 'y' para un gráfico vertical
  type = 'box',
  boxpoints = 'all',           # Muestra todos los puntos de datos
  jitter = 0.3,                # Dispersión de los puntos de datos
  pointpos = -1.8,             # Posición de los puntos de datos
  marker = list(color = '#54FF9F'), # Color de los puntos de datos
  line = list(color = 'black')  # Color de las líneas de las cajas
)

# Ajuste del diseño del gráfico
fig <- fig %>% layout(
  title = "PATRIMONIO", 
  yaxis = list(
    title = "Patrimonio (COP)",  # Etiqueta del eje Y con formato en COP
    zeroline = FALSE,
    tickprefix = "$",             # Prefijo de pesos colombianos
    tickformat = ",.0f"          # Formato de los ticks (sin decimales)
  ),
  showlegend = FALSE            # Ocultar la leyenda si no es necesaria
)

# Mostrar el gráfico
fig
Ver código
# Creación del gráfico de caja y bigotes con la variable 'ING-OPERACIONES'
fig <- plot_ly(
  data = dat_nat, 
  y = ~`ING-OPERACIONES`,  # Cambiado a 'y' para un gráfico vertical
  type = 'box',
  boxpoints = 'all',           # Muestra todos los puntos de datos
  jitter = 0.3,                # Dispersión de los puntos de datos
  pointpos = -1.8,             # Posición de los puntos de datos
  marker = list(color = '#54FF9F'), # Color de los puntos de datos
  line = list(color = 'black')  # Color de las líneas de las cajas
)

# Ajuste del diseño del gráfico
fig <- fig %>% layout(
  title = "INGRESOS OPERACIONALES", 
  yaxis = list(
    title = "Ingresos Operacionales (COP)",  # Etiqueta del eje Y con formato en COP
    zeroline = FALSE,
    tickprefix = "$",             # Prefijo de pesos colombianos
    tickformat = ",.0f"          # Formato de los ticks (sin decimales)
  ),
  showlegend = FALSE            # Ocultar la leyenda si no es necesaria
)

# Mostrar el gráfico
fig
Ver código
# Creación del gráfico de caja y bigotes con la variable 'GAS-OPERACIONALES'
fig <- plot_ly(
  data = dat_nat, 
  y = ~`GAS-OPERACIONALES`,  # Cambiado a 'y' para un gráfico vertical
  type = 'box',
  boxpoints = 'all',           # Muestra todos los puntos de datos
  jitter = 0.3,                # Dispersión de los puntos de datos
  pointpos = -1.8,             # Posición de los puntos de datos
  marker = list(color = '#54FF9F'), # Color de los puntos de datos
  line = list(color = 'black')  # Color de las líneas de las cajas
)

# Ajuste del diseño del gráfico
fig <- fig %>% layout(
  title = "GASTOS OPERACIONALES", 
  yaxis = list(
    title = "Gastos Operacionales (COP)",  # Etiqueta del eje Y con formato en COP
    zeroline = FALSE,
    tickprefix = "$",             # Prefijo de pesos colombianos
    tickformat = ",.0f"          # Formato de los ticks (sin decimales)
  ),
  showlegend = FALSE            # Ocultar la leyenda si no es necesaria
)

# Mostrar el gráfico
fig
Ver código
# Creación del gráfico de caja y bigotes con la variable 'GAS-NO-OPERAC'
fig <- plot_ly(
  data = dat_nat, 
  y = ~`GAS-NO-OPERAC`,  # Cambiado a 'y' para un gráfico vertical
  type = 'box',
  boxpoints = 'all',           # Muestra todos los puntos de datos
  jitter = 0.3,                # Dispersión de los puntos de datos
  pointpos = -1.8,             # Posición de los puntos de datos
  marker = list(color = '#54FF9F'), # Color de los puntos de datos
  line = list(color = 'black')  # Color de las líneas de las cajas
)

# Ajuste del diseño del gráfico
fig <- fig %>% layout(
  title = "GASTOS NO OPERACIONALES", 
  yaxis = list(
    title = "Gastos No Operacionales (COP)",  # Etiqueta del eje Y con formato en COP
    zeroline = FALSE,
    tickprefix = "$",             # Prefijo de pesos colombianos
    tickformat = ",.0f"          # Formato de los ticks (sin decimales)
  ),
  showlegend = FALSE            # Ocultar la leyenda si no es necesaria
)

# Mostrar el gráfico
fig
Ver código
# Creación del gráfico de caja y bigotes con la variable 'COS-VEN'
fig <- plot_ly(
  data = dat_nat, 
  y = ~`COS-VEN`,  # Cambiado a 'y' para un gráfico vertical
  type = 'box',
  boxpoints = 'all',           # Muestra todos los puntos de datos
  jitter = 0.3,                # Dispersión de los puntos de datos
  pointpos = -1.8,             # Posición de los puntos de datos
  marker = list(color = '#54FF9F'), # Color de los puntos de datos
  line = list(color = 'black')  # Color de las líneas de las cajas
)

# Ajuste del diseño del gráfico
fig <- fig %>% layout(
  title = "GASTOS", 
  yaxis = list(
    title = "Gastos (COP)",  # Etiqueta del eje Y con formato en COP
    zeroline = FALSE,
    tickprefix = "$",             # Prefijo de pesos colombianos
    tickformat = ",.0f"          # Formato de los ticks (sin decimales)
  ),
  showlegend = FALSE            # Ocultar la leyenda si no es necesaria
)

# Mostrar el gráfico
fig
Ver código
# Creación del gráfico de caja y bigotes con la variable 'GAS-IMP'
fig <- plot_ly(
  data = dat_nat, 
  y = ~`GAS-IMP`,  # Cambiado a 'y' para un gráfico vertical
  type = 'box',
  boxpoints = 'all',           # Muestra todos los puntos de datos
  jitter = 0.3,                # Dispersión de los puntos de datos
  pointpos = -1.8,             # Posición de los puntos de datos
  marker = list(color = '#54FF9F'), # Color de los puntos de datos
  line = list(color = 'black')  # Color de las líneas de las cajas
)

# Ajuste del diseño del gráfico
fig <- fig %>% layout(
  title = "GASTO EN IMPUESTOS", 
  yaxis = list(
    title = "Gasto en Impuestos (COP)",  # Etiqueta del eje Y con formato en COP
    zeroline = FALSE,
    tickprefix = "$",             # Prefijo de pesos colombianos
    tickformat = ",.0f"          # Formato de los ticks (sin decimales)
  ),
  showlegend = FALSE            # Ocultar la leyenda si no es necesaria
)

# Mostrar el gráfico
fig
Ver código
# Creación del gráfico de caja y bigotes con la variable 'UTIL-OPERACIONAL'
fig <- plot_ly(
  data = dat_nat, 
  y = ~`UTIL-OPERACIONAL`,  # Cambiado a 'y' para un gráfico vertical
  type = 'box',
  boxpoints = 'all',           # Muestra todos los puntos de datos
  jitter = 0.3,                # Dispersión de los puntos de datos
  pointpos = -1.8,             # Posición de los puntos de datos
  marker = list(color = '#54FF9F'), # Color de los puntos de datos
  line = list(color = 'black')  # Color de las líneas de las cajas
)

# Ajuste del diseño del gráfico
fig <- fig %>% layout(
  title = "UTILIDAD OPERACIONAL", 
  yaxis = list(
    title = "Utilidad Operacional (COP)",  # Etiqueta del eje Y con formato en COP
    zeroline = FALSE,
    tickprefix = "$",             # Prefijo de pesos colombianos
    tickformat = ",.0f"          # Formato de los ticks (sin decimales)
  ),
  showlegend = FALSE            # Ocultar la leyenda si no es necesaria
)

# Mostrar el gráfico
fig
Ver código
# Creación del gráfico de caja y bigotes con la variable 'UTIL-NETA'
fig <- plot_ly(
  data = dat_nat, 
  y = ~`UTIL-NETA`,  # Cambiado a 'y' para un gráfico vertical
  type = 'box',
  boxpoints = 'all',           # Muestra todos los puntos de datos
  jitter = 0.3,                # Dispersión de los puntos de datos
  pointpos = -1.8,             # Posición de los puntos de datos
  marker = list(color = '#54FF9F'), # Color de los puntos de datos
  line = list(color = 'black')  # Color de las líneas de las cajas
)

# Ajuste del diseño del gráfico
fig <- fig %>% layout(
  title = "UTILIDAD NETA", 
  yaxis = list(
    title = "Utilidad Neta (COP)",  # Etiqueta del eje Y con formato en COP
    zeroline = FALSE,
    tickprefix = "$",             # Prefijo de pesos colombianos
    tickformat = ",.0f"          # Formato de los ticks (sin decimales)
  ),
  showlegend = FALSE            # Ocultar la leyenda si no es necesaria
)

# Mostrar el gráfico
fig
Ver código
# Creación del gráfico de caja y bigotes con la variable 'ACTIV_2019'
fig <- plot_ly(
  data = dat_nat, 
  y = ~`ACTIV_2019`,  # Cambiado a 'y' para un gráfico vertical
  type = 'box',
  boxpoints = 'all',           # Muestra todos los puntos de datos
  jitter = 0.3,                # Dispersión de los puntos de datos
  pointpos = -1.8,             # Posición de los puntos de datos
  marker = list(color = '#54FF9F'), # Color de los puntos de datos
  line = list(color = 'black')  # Color de las líneas de las cajas
)

# Ajuste del diseño del gráfico
fig <- fig %>% layout(
  title = "ACTIVOS 2019", 
  yaxis = list(
    title = "Activos 2019 (COP)",  # Etiqueta del eje Y con formato en COP
    zeroline = FALSE,
    tickprefix = "$",             # Prefijo de pesos colombianos
    tickformat = ",.0f"          # Formato de los ticks (sin decimales)
  ),
  showlegend = FALSE            # Ocultar la leyenda si no es necesaria
)

# Mostrar el gráfico
fig
Ver código
# Creación del gráfico de caja y bigotes con la variable 'ACTIV_2020'
fig <- plot_ly(
  data = dat_nat, 
  y = ~`ACTIV_2020`,  # Cambiado a 'y' para un gráfico vertical
  type = 'box',
  boxpoints = 'all',           # Muestra todos los puntos de datos
  jitter = 0.3,                # Dispersión de los puntos de datos
  pointpos = -1.8,             # Posición de los puntos de datos
  marker = list(color = '#54FF9F'), # Color de los puntos de datos
  line = list(color = 'black')  # Color de las líneas de las cajas
)

# Ajuste del diseño del gráfico
fig <- fig %>% layout(
  title = "ACTIVOS 2020", 
  yaxis = list(
    title = "Activos 2020 (COP)",  # Etiqueta del eje Y con formato en COP
    zeroline = FALSE,
    tickprefix = "$",             # Prefijo de pesos colombianos
    tickformat = ",.0f"          # Formato de los ticks (sin decimales)
  ),
  showlegend = FALSE            # Ocultar la leyenda si no es necesaria
)

# Mostrar el gráfico
fig
Ver código
# Creación del gráfico de caja y bigotes con la variable 'ACTIV_2021'
fig <- plot_ly(
  data = dat_nat, 
  y = ~`ACTIV_2021`,  # Cambiado a 'y' para un gráfico vertical
  type = 'box',
  boxpoints = 'all',           # Muestra todos los puntos de datos
  jitter = 0.3,                # Dispersión de los puntos de datos
  pointpos = -1.8,             # Posición de los puntos de datos
  marker = list(color = '#54FF9F'), # Color de los puntos de datos
  line = list(color = 'black')  # Color de las líneas de las cajas
)

# Ajuste del diseño del gráfico
fig <- fig %>% layout(
  title = "ACTIVOS 2021", 
  yaxis = list(
    title = "Activos 2021 (COP)", # Etiqueta del eje Y
    zeroline = FALSE,
    tickprefix = "$",             # Prefijo de pesos colombianos
    tickformat = ",.0f"          # Formato de los ticks (sin decimales)
  ),
  showlegend = FALSE            # Ocultar la leyenda si no es necesaria
)

# Mostrar el gráfico
fig
Ver código
# Creación del gráfico de caja y bigotes con la variable 'ACTIV_2022'
fig <- plot_ly(
  data = dat_nat, 
  y = ~`ACTIV_2022`,  # Cambiado a 'y' para un gráfico vertical
  type = 'box',
  boxpoints = 'all',           # Muestra todos los puntos de datos
  jitter = 0.3,                # Dispersión de los puntos de datos
  pointpos = -1.8,             # Posición de los puntos de datos
  marker = list(color = '#54FF9F'), # Color de los puntos de datos
  line = list(color = 'black')  # Color de las líneas de las cajas
)

# Ajuste del diseño del gráfico
fig <- fig %>% layout(
  title = "ACTIVOS 2022", 
  yaxis = list(
    title = "Activos 2022 (COP)", 
    zeroline = FALSE,
    tickprefix = "$",             # Prefijo de pesos colombianos
    tickformat = ",.0f"          # Formato de los ticks (sin decimales)
  ),
  showlegend = FALSE            # Ocultar la leyenda si no es necesaria
)

# Mostrar el gráfico
fig
Ver código
# Creación del gráfico de caja y bigotes con la variable 'ACTIV_2023'
fig <- plot_ly(
  data = dat_nat, 
  y = ~`ACTIV_2023`,  # Cambiado a 'y' para un gráfico vertical
  type = 'box',
  boxpoints = 'all',           # Muestra todos los puntos de datos
  jitter = 0.3,                # Dispersión de los puntos de datos
  pointpos = -1.8,             # Posición de los puntos de datos
  marker = list(color = '#54FF9F'), # Color de los puntos de datos
  line = list(color = 'black')  # Color de las líneas de las cajas
)

# Ajuste del diseño del gráfico
fig <- fig %>% layout(
  title = "ACTIVOS 2023", 
  yaxis = list(
    title = "Activos 2023 (COP)", 
    zeroline = FALSE,
    tickprefix = "$",             # Prefijo de pesos colombianos
    tickformat = ",.0f"          # Formato de los ticks (sin decimales)
  ),
  showlegend = FALSE            # Ocultar la leyenda si no es necesaria
)

# Mostrar el gráfico
fig

Análisis Bivariado

Ver código
library(knitr)
library(kableExtra)

# Calcular la matriz de varianzas y covarianzas poblacional
n <- nrow(dat_nat)
matriz_cov <- var(dat_nat[, c(14, 17:37)]) * (n - 1) / n

# Crear la tabla en HTML y mostrarla en el Viewer
kable(matriz_cov, digits = 2, format = "html") %>%
  kable_styling(full_width = F) %>%
  scroll_box(width = "800px", height = "500px") %>%
  as.character() %>%
  htmltools::HTML() %>%
  htmltools::browsable()
ING-TAM-EMPRESARIAL ACTIVO-CORRIENTE ACTIVO-NO-CORRIENTE ACTIVO-TOTAL PASIVO-CORRIENTE PASIVO-LRG-PLAZO PASIVO-TOTAL PATRIMONIO PASIVO+PATRIM ING-OPERACIONES ING-NO-OPERACIONALES GAS-OPERACIONALES GAS-NO-OPERAC COS-VEN GAS-IMP UTIL-OPERACIONAL UTIL-NETA ACTIV_2019 ACTIV_2020 ACTIV_2021 ACTIV_2022 ACTIV_2023
ING-TAM-EMPRESARIAL 79755962590880720 9589748815447018 2933323030582967 12522705624239550 3748846376829833 37729060671392 3786371918396448 8736635962153332 12522705624239550 79755962590880720 273890065828773 24055000776705436 1267502088756742 49290439509847368 787656896621527 4731368428725453 2884344772505930 4549368337539057 4235290797541735 3878941329523839 7646194946748332 12473410513109168
ACTIVO-CORRIENTE 9589748815447018 1340626967448089 370350066081253 1710883708269457 466317571564103 6223954686597 472503295793381 1238425432173273 1710883708269457 9589748815447018 33439473906978 2944907931110931 150492646693409 6207749975334722 107423615474756 610927504730282 386095064791959 572058223704747 535057954397609 483497616393315 1067126135040811 1710570188003285
ACTIVO-NO-CORRIENTE 2933323030582967 370350066081253 127549375559037 497914548376526 152280168185259 1545067924841 153819744664780 344097764475510 497914548376526 2933323030582967 10936156414619 974473998831745 53408041356386 1779939973463162 31040505385429 181191344749920 112889716036657 180652944449978 168062502825738 155521889105047 298788058833708 497875705496015
ACTIVO-TOTAL 12522705624239550 1710883708269457 497914548376526 2208729525044617 618585204352568 7768401098065 626312298912223 1582464445176771 2208729525044617 12522705624239550 44374533888972 3919359872071367 203894204084840 7987342997299105 138461355882630 792109379379387 498975586724979 752691933150882 703105229273086 639002931480226 1365880398969327 2208376772808292
PASIVO-CORRIENTE 3748846376829833 466317571564103 152280168185259 618585204352568 236400368420149 655164809624 237050377543404 381544166815211 618585204352568 3748846376829833 17421456373362 1470282905242796 76290807818895 2114524044116003 38906706009549 223691625482773 127784885193353 292742614911829 267618362188301 239992880032093 345864365251349 618539267935040
PASIVO-LRG-PLAZO 37729060671392 6223954686597 1545067924841 7768401098065 655164809624 353421922420 1008320378322 6760479206527 7768401098065 37729060671392 -4588973232 3801090866968 463116850130 30426872449845 485654382770 3405806686707 2828379739725 220690625771 557995244055 552624744448 6125324456613 7765089525066
PASIVO-TOTAL 3786371918396448 472503295793381 153819744664780 626312298912223 237050377543404 1008320378322 238058122022344 388263956747584 626312298912223 3786371918396448 17416392257243 1474048295229030 76751114805711 2144781984441775 39391161904197 227085514201143 130604969816259 292954894814258 268165442091873 240532143877368 351967720898240 626262882308349
PATRIMONIO 8736635962153332 1238425432173273 344097764475510 1582464445176771 381544166815211 6760479206527 388263956747584 1194243952750328 1582464445176771 8736635962153332 26958844148238 2445348973291955 127147243598835 5842787828492433 99071965987900 565025131006007 368374094048851 459734764306389 434942224081689 398490160784375 1013935225686126 1582161358845455
PASIVO+PATRIM 12522705624239550 1710883708269457 497914548376526 2208729525044617 618585204352568 7768401098065 626312298912223 1582464445176771 2208729525044617 12522705624239550 44374533888972 3919359872071367 203894204084840 7987342997299105 138461355882630 792109379379387 498975586724979 752691933150882 703105229273086 639002931480226 1365880398969327 2208376772808292
ING-OPERACIONES 79755962590880720 9589748815447018 2933323030582967 12522705624239550 3748846376829833 37729060671392 3786371918396448 8736635962153332 12522705624239550 79755962590880720 273890065828773 24055000776705436 1267502088756742 49290439509847368 787656896621527 4731368428725453 2884344772505930 4549368337539057 4235290797541735 3878941329523839 7646194946748332 12473410513109168
ING-NO-OPERACIONALES 273890065828773 33439473906978 10936156414619 44374533888972 17421456373362 -4588973232 17416392257243 26958844148238 44374533888972 273890065828773 2397950933692 112690249627873 5738600319412 145107858967776 2826382566600 18066980130709 8745232504462 22306111043586 20353735661065 18140431726809 24150221178654 44371670259669
GAS-OPERACIONALES 24055000776705436 2944907931110931 974473998831745 3919359872071367 1470282905242796 3801090866968 1474048295229030 2445348973291955 3919359872071367 24055000776705436 112690249627873 9474316924845212 493868026886916 13215090108264226 248827858736995 1442105226687469 819291439714843 1850197964940771 1691916044690403 1507773794441183 2178327671585134 3917741622460360
GAS-NO-OPERAC 1267502088756742 150492646693409 53408041356386 203894204084840 76290807818895 463116850130 76751114805711 127147243598835 203894204084840 1267502088756742 5738600319412 493868026886916 32867586249339 694771107639812 12731941970697 75878991383421 43313017569871 95605273726474 88974582932733 80437624965811 113756194815069 203887359442336
COS-VEN 49290439509847368 6207749975334722 1779939973463162 7987342997299105 2114524044116003 30426872449845 2144781984441775 5842787828492433 7987342997299105 49290439509847368 145107858967776 13215090108264226 694771107639812 120415955268986384 488801690612044 2997044016045969 1906063789381821 2532610502834028 2388608227290022 2256194803151507 5099932416306581 7940029480306278
GAS-IMP 787656896621527 107423615474756 31040505385429 138461355882630 38906706009549 485654382770 39391161904197 99071965987900 138461355882630 787656896621527 2826382566600 248827858736995 12731941970697 488801690612044 10342754499536 50588816917306 31541730770734 47178581648204 43493744290840 38611819540820 85479831282826 138454132401475
UTIL-OPERACIONAL 4731368428725453 610927504730282 181191344749920 792109379379387 223691625482773 3405806686707 227085514201143 565025131006007 792109379379387 4731368428725453 18066980130709 1442105226687469 75878991383421 2997044016045969 50588816917306 315690868196409 199131940324286 267759892342657 250215507116890 226198198389969 490089669170257 790507664816337
UTIL-NETA 2884344772505930 386095064791959 112889716036657 498975586724979 127784885193353 2828379739725 130604969816259 368374094048851 498975586724979 2884344772505930 8745232504462 819291439714843 43313017569871 1906063789381821 31541730770734 199131940324286 136897939487832 146907938335467 139419133026791 127270707282384 317926965859610 498812904653486
ACTIV_2019 4549368337539057 572058223704747 180652944449978 752691933150882 292742614911829 220690625771 292954894814258 459734764306389 752691933150882 4549368337539057 22306111043586 1850197964940771 95605273726474 2532610502834028 47178581648204 267759892342657 146907938335467 394308643650304 360270292697603 320323145928330 418063160450628 752387344924201
ACTIV_2020 4235290797541735 535057954397609 168062502825738 703105229273086 267618362188301 557995244055 268165442091873 434942224081689 703105229273086 4235290797541735 20353735661065 1691916044690403 88974582932733 2388608227290022 43493744290840 250215507116890 139419133026791 360270292697603 337116788723459 301908390475272 397382601812417 702694518381257
ACTIV_2021 3878941329523839 483497616393315 155521889105047 639002931480226 239992880032093 552624744448 240532143877368 398490160784375 639002931480226 3878941329523839 18140431726809 1507773794441183 80437624965811 2256194803151507 38611819540820 226198198389969 127270707282384 320323145928330 301908390475272 280156509948048 367487880628638 638346425211009
ACTIV_2022 7646194946748332 1067126135040811 298788058833708 1365880398969327 345864365251349 6125324456613 351967720898240 1013935225686126 1365880398969327 7646194946748332 24150221178654 2178327671585134 113756194815069 5099932416306581 85479831282826 490089669170257 317926965859610 418063160450628 397382601812417 367487880628638 884012143051961 1365161393372083
ACTIV_2023 12473410513109168 1710570188003285 497875705496015 2208376772808292 618539267935040 7765089525066 626262882308349 1582161358845455 2208376772808292 12473410513109168 44371670259669 3917741622460360 203887359442336 7940029480306278 138454132401475 790507664816337 498812904653486 752387344924201 702694518381257 638346425211009 1365161393372083 2209287419976104
Ver código
heatmap(cor(dat_nat[,c(14,17:37)]), 
        Rowv = NA, 
        Colv = NA, 
        col = colorRampPalette(c("#BFEFFF", "turquoise4"))(20), 
        scale = "none", 
        margins = c(5, 5))

Ver código
library(knitr)
library(kableExtra)
library(FactoClass)

# Calcular la matriz de correlaciones
matriz_cor <- cor(dat_nat[, c(14, 17:37)])

# Crear la tabla en HTML y mostrarla en el Viewer
kable(matriz_cor, digits = 2, format = "html") %>%
  kable_styling(full_width = F) %>%
  scroll_box(width = "800px", height = "500px") %>%
  as.character() %>%
  htmltools::HTML() %>%
  htmltools::browsable()
ING-TAM-EMPRESARIAL ACTIVO-CORRIENTE ACTIVO-NO-CORRIENTE ACTIVO-TOTAL PASIVO-CORRIENTE PASIVO-LRG-PLAZO PASIVO-TOTAL PATRIMONIO PASIVO+PATRIM ING-OPERACIONES ING-NO-OPERACIONALES GAS-OPERACIONALES GAS-NO-OPERAC COS-VEN GAS-IMP UTIL-OPERACIONAL UTIL-NETA ACTIV_2019 ACTIV_2020 ACTIV_2021 ACTIV_2022 ACTIV_2023
ING-TAM-EMPRESARIAL 1.00 0.93 0.92 0.94 0.86 0.22 0.87 0.90 0.94 1.00 0.63 0.88 0.78 0.50 0.87 0.94 0.87 0.81 0.82 0.82 0.91 0.94
ACTIVO-CORRIENTE 0.93 1.00 0.90 0.99 0.83 0.29 0.84 0.98 0.99 0.93 0.59 0.83 0.72 0.49 0.91 0.94 0.90 0.79 0.80 0.79 0.98 0.99
ACTIVO-NO-CORRIENTE 0.92 0.90 1.00 0.94 0.88 0.23 0.88 0.88 0.94 0.92 0.63 0.89 0.82 0.45 0.85 0.90 0.85 0.81 0.81 0.82 0.89 0.94
ACTIVO-TOTAL 0.94 0.99 0.94 1.00 0.86 0.28 0.86 0.97 1.00 0.94 0.61 0.86 0.76 0.49 0.92 0.95 0.91 0.81 0.81 0.81 0.98 1.00
PASIVO-CORRIENTE 0.86 0.83 0.88 0.86 1.00 0.07 1.00 0.72 0.86 0.86 0.73 0.98 0.87 0.40 0.79 0.82 0.71 0.96 0.95 0.93 0.76 0.86
PASIVO-LRG-PLAZO 0.22 0.29 0.23 0.28 0.07 1.00 0.11 0.33 0.28 0.22 0.00 0.07 0.14 0.15 0.25 0.32 0.41 0.02 0.05 0.06 0.35 0.28
PASIVO-TOTAL 0.87 0.84 0.88 0.86 1.00 0.11 1.00 0.73 0.86 0.87 0.73 0.98 0.87 0.40 0.79 0.83 0.72 0.96 0.95 0.93 0.77 0.86
PATRIMONIO 0.90 0.98 0.88 0.97 0.72 0.33 0.73 1.00 0.97 0.90 0.50 0.73 0.64 0.49 0.89 0.92 0.91 0.67 0.69 0.69 0.99 0.97
PASIVO+PATRIM 0.94 0.99 0.94 1.00 0.86 0.28 0.86 0.97 1.00 0.94 0.61 0.86 0.76 0.49 0.92 0.95 0.91 0.81 0.81 0.81 0.98 1.00
ING-OPERACIONES 1.00 0.93 0.92 0.94 0.86 0.22 0.87 0.90 0.94 1.00 0.63 0.88 0.78 0.50 0.87 0.94 0.87 0.81 0.82 0.82 0.91 0.94
ING-NO-OPERACIONALES 0.63 0.59 0.63 0.61 0.73 0.00 0.73 0.50 0.61 0.63 1.00 0.75 0.65 0.27 0.57 0.66 0.48 0.73 0.72 0.70 0.52 0.61
GAS-OPERACIONALES 0.88 0.83 0.89 0.86 0.98 0.07 0.98 0.73 0.86 0.88 0.75 1.00 0.89 0.39 0.79 0.83 0.72 0.96 0.95 0.93 0.75 0.86
GAS-NO-OPERAC 0.78 0.72 0.82 0.76 0.87 0.14 0.87 0.64 0.76 0.78 0.65 0.89 1.00 0.35 0.69 0.74 0.65 0.84 0.85 0.84 0.67 0.76
COS-VEN 0.50 0.49 0.45 0.49 0.40 0.15 0.40 0.49 0.49 0.50 0.27 0.39 0.35 1.00 0.44 0.49 0.47 0.37 0.37 0.39 0.49 0.49
GAS-IMP 0.87 0.91 0.85 0.92 0.79 0.25 0.79 0.89 0.92 0.87 0.57 0.79 0.69 0.44 1.00 0.89 0.84 0.74 0.74 0.72 0.89 0.92
UTIL-OPERACIONAL 0.94 0.94 0.90 0.95 0.82 0.32 0.83 0.92 0.95 0.94 0.66 0.83 0.74 0.49 0.89 1.00 0.96 0.76 0.77 0.76 0.93 0.95
UTIL-NETA 0.87 0.90 0.85 0.91 0.71 0.41 0.72 0.91 0.91 0.87 0.48 0.72 0.65 0.47 0.84 0.96 1.00 0.63 0.65 0.65 0.91 0.91
ACTIV_2019 0.81 0.79 0.81 0.81 0.96 0.02 0.96 0.67 0.81 0.81 0.73 0.96 0.84 0.37 0.74 0.76 0.63 1.00 0.99 0.96 0.71 0.81
ACTIV_2020 0.82 0.80 0.81 0.81 0.95 0.05 0.95 0.69 0.81 0.82 0.72 0.95 0.85 0.37 0.74 0.77 0.65 0.99 1.00 0.98 0.73 0.81
ACTIV_2021 0.82 0.79 0.82 0.81 0.93 0.06 0.93 0.69 0.81 0.82 0.70 0.93 0.84 0.39 0.72 0.76 0.65 0.96 0.98 1.00 0.74 0.81
ACTIV_2022 0.91 0.98 0.89 0.98 0.76 0.35 0.77 0.99 0.98 0.91 0.52 0.75 0.67 0.49 0.89 0.93 0.91 0.71 0.73 0.74 1.00 0.98
ACTIV_2023 0.94 0.99 0.94 1.00 0.86 0.28 0.86 0.97 1.00 0.94 0.61 0.86 0.76 0.49 0.92 0.95 0.91 0.81 0.81 0.81 0.98 1.00

ACP

Ver código
library(FactoMineR)
library(knitr)

# Realizar PCA
nat.PCA <- PCA(dat_nat, quali.sup = c(1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16), graph = FALSE)

# Resumen del PCA
summary(nat.PCA)

Call:
PCA(X = dat_nat, quali.sup = c(1, 2, 3, 4, 5, 6, 7, 8, 9, 10,  
     11, 12, 13, 15, 16), graph = FALSE) 


Eigenvalues
                       Dim.1   Dim.2   Dim.3   Dim.4   Dim.5   Dim.6   Dim.7
Variance              17.253   1.891   0.780   0.659   0.431   0.273   0.177
% of var.             78.425   8.594   3.546   2.996   1.958   1.239   0.804
Cumulative % of var.  78.425  87.018  90.564  93.560  95.518  96.758  97.561
                       Dim.8   Dim.9  Dim.10  Dim.11  Dim.12  Dim.13  Dim.14
Variance               0.159   0.123   0.113   0.072   0.031   0.014   0.010
% of var.              0.724   0.560   0.512   0.326   0.140   0.063   0.045
Cumulative % of var.  98.285  98.845  99.358  99.683  99.823  99.886  99.932
                      Dim.15  Dim.16  Dim.17  Dim.18  Dim.19  Dim.20  Dim.21
Variance               0.009   0.006   0.000   0.000   0.000   0.000   0.000
% of var.              0.040   0.027   0.001   0.000   0.000   0.000   0.000
Cumulative % of var.  99.971  99.998 100.000 100.000 100.000 100.000 100.000
                      Dim.22
Variance               0.000
% of var.              0.000
Cumulative % of var. 100.000

Individuals (the 10 first)
                         Dist    Dim.1    ctr   cos2    Dim.2    ctr   cos2  
1                    |  0.681 | -0.643  0.004  0.890 | -0.057  0.000  0.007 |
2                    |  0.533 | -0.434  0.002  0.663 | -0.033  0.000  0.004 |
3                    |  0.711 | -0.670  0.004  0.889 | -0.075  0.001  0.011 |
4                    |  0.729 | -0.166  0.000  0.052 | -0.054  0.000  0.006 |
5                    |  0.666 | -0.637  0.004  0.913 | -0.099  0.001  0.022 |
6                    |  0.482 | -0.393  0.002  0.665 | -0.169  0.003  0.122 |
7                    |  0.714 | -0.675  0.004  0.894 | -0.103  0.001  0.021 |
8                    |  0.942 |  0.100  0.000  0.011 |  0.459  0.019  0.238 |
9                    |  0.533 | -0.502  0.002  0.888 | -0.001  0.000  0.000 |
10                   |  0.702 | -0.647  0.004  0.849 | -0.147  0.002  0.044 |
                      Dim.3    ctr   cos2  
1                     0.002  0.000  0.000 |
2                    -0.026  0.000  0.002 |
3                     0.006  0.000  0.000 |
4                    -0.053  0.001  0.005 |
5                     0.010  0.000  0.000 |
6                     0.009  0.000  0.000 |
7                     0.011  0.000  0.000 |
8                    -0.093  0.002  0.010 |
9                    -0.016  0.000  0.001 |
10                    0.019  0.000  0.001 |

Variables (the 10 first)
                        Dim.1    ctr   cos2    Dim.2    ctr   cos2    Dim.3
ING-TAM-EMPRESARIAL  |  0.962  5.359  0.925 |  0.074  0.292  0.006 | -0.049
ACTIVO-CORRIENTE     |  0.962  5.366  0.926 |  0.194  1.986  0.038 | -0.024
ACTIVO-NO-CORRIENTE  |  0.951  5.243  0.905 |  0.037  0.073  0.001 |  0.020
ACTIVO-TOTAL         |  0.978  5.546  0.957 |  0.160  1.351  0.026 | -0.014
PASIVO-CORRIENTE     |  0.930  5.017  0.866 | -0.310  5.087  0.096 |  0.044
PASIVO-LRG-PLAZO     |  0.233  0.315  0.054 |  0.644 21.939  0.415 |  0.501
PASIVO-TOTAL         |  0.936  5.078  0.876 | -0.284  4.274  0.081 |  0.063
PATRIMONIO           |  0.912  4.825  0.832 |  0.344  6.270  0.119 | -0.047
PASIVO+PATRIM        |  0.978  5.546  0.957 |  0.160  1.351  0.026 | -0.014
ING-OPERACIONES      |  0.962  5.359  0.925 |  0.074  0.292  0.006 | -0.049
                        ctr   cos2  
ING-TAM-EMPRESARIAL   0.308  0.002 |
ACTIVO-CORRIENTE      0.073  0.001 |
ACTIVO-NO-CORRIENTE   0.050  0.000 |
ACTIVO-TOTAL          0.024  0.000 |
PASIVO-CORRIENTE      0.245  0.002 |
PASIVO-LRG-PLAZO     32.220  0.251 |
PASIVO-TOTAL          0.506  0.004 |
PATRIMONIO            0.281  0.002 |
PASIVO+PATRIM         0.024  0.000 |
ING-OPERACIONES       0.308  0.002 |

Supplementary categories (the 10 first)
                         Dist    Dim.1   cos2 v.test    Dim.2   cos2 v.test  
NATURAL              |  0.000 |  0.000    NaN    NaN |  0.000    NaN    NaN |
F                    |  0.248 | -0.237  0.907 -1.336 | -0.040  0.026 -0.688 |
M                    |  0.231 |  0.220  0.907  1.336 |  0.037  0.026  0.688 |
EMPREN-SOCIAL.N      |  0.033 |  0.031  0.907  0.626 |  0.005  0.025  0.313 |
EMPREN-SOCIAL.S      |  0.383 | -0.364  0.907 -0.626 | -0.060  0.025 -0.313 |
COLOMBIANA           |  0.007 |  0.006  0.894  0.331 |  0.000  0.004  0.069 |
OTRO                 |  0.547 | -0.517  0.894 -0.331 | -0.036  0.004 -0.069 |
RURAL                |  0.540 | -0.486  0.809 -1.744 |  0.037  0.005  0.401 |
URBANO               |  0.203 |  0.182  0.809  1.744 | -0.014  0.005 -0.401 |
05002 - ABEJORRAL    |  0.413 | -0.399  0.933 -0.321 | -0.029  0.005 -0.071 |
                      Dim.3   cos2 v.test  
NATURAL               0.000    NaN    NaN |
F                     0.043  0.030  1.148 |
M                    -0.040  0.030 -1.148 |
EMPREN-SOCIAL.N       0.000  0.000  0.008 |
EMPREN-SOCIAL.S      -0.001  0.000 -0.008 |
COLOMBIANA            0.000  0.000  0.013 |
OTRO                 -0.004  0.000 -0.013 |
RURAL                 0.000  0.000  0.008 |
URBANO                0.000  0.000 -0.008 |
05002 - ABEJORRAL    -0.008  0.000 -0.029 |
Ver código
# Extraer información de las contribuciones
var_contrib <- get_pca_var(nat.PCA)

# Crear y mostrar tabla de contribuciones de variables
contrib_table <- var_contrib$contrib
kable(contrib_table, caption = "Contribuciones de las Variables en el PCA")
Contribuciones de las Variables en el PCA
Dim.1 Dim.2 Dim.3 Dim.4 Dim.5
ING-TAM-EMPRESARIAL 5.3587189 0.2916496 0.3075623 0.2458512 0.0035200
ACTIVO-CORRIENTE 5.3661695 1.9857821 0.0728256 1.9021315 0.0086109
ACTIVO-NO-CORRIENTE 5.2432682 0.0726490 0.0504661 0.1491580 0.3341154
ACTIVO-TOTAL 5.5457722 1.3514258 0.0244035 1.3628238 0.0446119
PASIVO-CORRIENTE 5.0167565 5.0866684 0.2445600 0.5591316 0.7926481
PASIVO-LRG-PLAZO 0.3145957 21.9390610 32.2204068 41.2041439 0.0240702
PASIVO-TOTAL 5.0782691 4.2736923 0.5063793 0.9851603 0.7764271
PATRIMONIO 4.8248248 6.2703584 0.2811208 4.1237268 0.0112607
PASIVO+PATRIM 5.5457722 1.3514258 0.0244035 1.3628238 0.0446119
ING-OPERACIONES 5.3587189 0.2916496 0.3075623 0.2458512 0.0035200
ING-NO-OPERACIONALES 2.8109441 7.5463465 0.4305510 0.8172833 83.1168240
GAS-OPERACIONALES 5.0566535 5.0259474 0.2689868 0.3602460 0.2152277
GAS-NO-OPERAC 4.0966348 4.0429825 1.9239189 4.0213688 2.5766553
COS-VEN 1.4452277 2.4311668 62.4408382 32.7582496 0.0508932
GAS-IMP 4.7430186 1.4360080 0.0030795 2.6336869 0.1191147
UTIL-OPERACIONAL 5.2477101 1.8154053 0.0387309 0.1643701 3.9022531
UTIL-NETA 4.4965897 6.7958060 0.1230834 0.3930026 0.2734777
ACTIV_2019 4.6090467 8.2502081 0.1871493 0.7936963 1.8922415
ACTIV_2020 4.6680692 7.1210043 0.3157377 1.1972581 2.5104984
ACTIV_2021 4.6171420 6.3595199 0.1378986 1.3308384 3.2131815
ACTIV_2022 5.0206028 4.9208752 0.0749604 1.9782589 0.0402440
ACTIV_2023 5.5354945 1.3403681 0.0153750 1.4109388 0.0459927
Ver código
# Extraer información de las distancias
var_distances <- get_pca_var(nat.PCA)$cos2

# Crear y mostrar tabla de distancias
distance_table <- var_distances
kable(distance_table, caption = "Distancias de las Variables a los Componentes Principales en el PCA")
Distancias de las Variables a los Componentes Principales en el PCA
Dim.1 Dim.2 Dim.3 Dim.4 Dim.5
ING-TAM-EMPRESARIAL 0.9245628 0.0055140 0.0023992 0.0016205 0.0000152
ACTIVO-CORRIENTE 0.9258483 0.0375435 0.0005681 0.0125379 0.0000371
ACTIVO-NO-CORRIENTE 0.9046436 0.0013735 0.0003937 0.0009832 0.0014392
ACTIVO-TOTAL 0.9568359 0.0255502 0.0001904 0.0089831 0.0001922
PASIVO-CORRIENTE 0.8655626 0.0961692 0.0019077 0.0036855 0.0034142
PASIVO-LRG-PLAZO 0.0542786 0.4147828 0.2513366 0.2715979 0.0001037
PASIVO-TOTAL 0.8761756 0.0807990 0.0039500 0.0064937 0.0033443
PATRIMONIO 0.8324478 0.1185482 0.0021929 0.0271816 0.0000485
PASIVO+PATRIM 0.9568359 0.0255502 0.0001904 0.0089831 0.0001922
ING-OPERACIONES 0.9245628 0.0055140 0.0023992 0.0016205 0.0000152
ING-NO-OPERACIONALES 0.4849843 0.1426722 0.0033585 0.0053871 0.3580132
GAS-OPERACIONALES 0.8724462 0.0950212 0.0020982 0.0023746 0.0009271
GAS-NO-OPERAC 0.7068100 0.0764372 0.0150076 0.0265069 0.0110986
COS-VEN 0.2493513 0.0459640 0.4870723 0.2159267 0.0002192
GAS-IMP 0.8183334 0.0271494 0.0000240 0.0173600 0.0005131
UTIL-OPERACIONAL 0.9054100 0.0343223 0.0003021 0.0010834 0.0168084
UTIL-NETA 0.7758159 0.1284824 0.0009601 0.0025905 0.0011780
ACTIV_2019 0.7952186 0.1559795 0.0014599 0.0052317 0.0081505
ACTIV_2020 0.8054020 0.1346307 0.0024629 0.0078918 0.0108136
ACTIV_2021 0.7966154 0.1202339 0.0010757 0.0087722 0.0138403
ACTIV_2022 0.8662262 0.0930347 0.0005847 0.0130397 0.0001733
ACTIV_2023 0.9550626 0.0253412 0.0001199 0.0093002 0.0001981
Ver código
var_coords <- get_pca_var(nat.PCA)$coord
coords_table <- var_coords
kable(coords_table, caption = "Coordenadas de las Variables en el PCA")
Coordenadas de las Variables en el PCA
Dim.1 Dim.2 Dim.3 Dim.4 Dim.5
ING-TAM-EMPRESARIAL 0.9615419 0.0742561 -0.0489811 -0.0402558 -0.0038938
ACTIVO-CORRIENTE 0.9622101 0.1937614 -0.0238344 -0.1119729 -0.0060902
ACTIVO-NO-CORRIENTE 0.9511275 0.0370609 0.0198409 -0.0313557 -0.0379362
ACTIVO-TOTAL 0.9781799 0.1598444 -0.0137971 -0.0947791 -0.0138621
PASIVO-CORRIENTE 0.9303561 -0.3101117 0.0436772 0.0607085 -0.0584313
PASIVO-LRG-PLAZO 0.2329776 0.6440364 0.5013348 0.5211506 0.0101823
PASIVO-TOTAL 0.9360425 -0.2842517 0.0628493 0.0805835 -0.0578303
PATRIMONIO 0.9123857 0.3443084 -0.0468283 -0.1648685 0.0069645
PASIVO+PATRIM 0.9781799 0.1598444 -0.0137971 -0.0947791 -0.0138621
ING-OPERACIONES 0.9615419 0.0742561 -0.0489811 -0.0402558 -0.0038938
ING-NO-OPERACIONALES 0.6964081 -0.3777198 0.0579528 0.0733971 0.5983421
GAS-OPERACIONALES 0.9340483 -0.3082552 0.0458066 0.0487295 -0.0304477
GAS-NO-OPERAC 0.8407199 -0.2764727 0.1225055 0.1628095 -0.1053497
COS-VEN 0.4993509 0.2143921 -0.6979056 0.4646791 0.0148059
GAS-IMP 0.9046178 0.1647706 -0.0049012 -0.1317574 0.0226510
UTIL-OPERACIONAL 0.9515303 0.1852628 0.0173817 -0.0329158 0.1296471
UTIL-NETA 0.8808041 0.3584445 0.0309858 -0.0508968 0.0343215
ACTIV_2019 0.8917503 -0.3949425 0.0382082 0.0723302 -0.0902804
ACTIV_2020 0.8974419 -0.3669205 0.0496279 0.0888355 -0.1039884
ACTIV_2021 0.8925331 -0.3467477 0.0327976 0.0936603 -0.1176448
ACTIV_2022 0.9307127 0.3050159 -0.0241812 -0.1141917 -0.0131661
ACTIV_2023 0.9772731 0.1591891 -0.0109514 -0.0964377 -0.0140750
Ver código
library(factoextra)

fviz_screeplot(nat.PCA, 
               addlabels = TRUE, 
               ylim = c(0, 100), 
               ggtheme = theme_minimal(), 
               barfill = "#54FF9F", 
               barcolor = "black")

Ver código
library(kableExtra)

eig_values_nat <- nat.PCA$eig

eig_df_nat <- data.frame(
  Component = 1:nrow(eig_values_nat),
  Eigenvalue = eig_values_nat[, 1],
  Variance_Explained = eig_values_nat[, 2],
  Cumulative_Variance_Explained = eig_values_nat[, 3]
)

kable(eig_df_nat, digits = 2, col.names = c("Componente", "Eigenvalor", "Varianza Explicada (%)", "Varianza Acumulada (%)")) %>%
  kable_styling(full_width = FALSE) %>%
  scroll_box(width = "800px", height = "500px")
Componente Eigenvalor Varianza Explicada (%) Varianza Acumulada (%)
comp 1 1 17.25 78.42 78.42
comp 2 2 1.89 8.59 87.02
comp 3 3 0.78 3.55 90.56
comp 4 4 0.66 3.00 93.56
comp 5 5 0.43 1.96 95.52
comp 6 6 0.27 1.24 96.76
comp 7 7 0.18 0.80 97.56
comp 8 8 0.16 0.72 98.29
comp 9 9 0.12 0.56 98.85
comp 10 10 0.11 0.51 99.36
comp 11 11 0.07 0.33 99.68
comp 12 12 0.03 0.14 99.82
comp 13 13 0.01 0.06 99.89
comp 14 14 0.01 0.05 99.93
comp 15 15 0.01 0.04 99.97
comp 16 16 0.01 0.03 100.00
comp 17 17 0.00 0.00 100.00
comp 18 18 0.00 0.00 100.00
comp 19 19 0.00 0.00 100.00
comp 20 20 0.00 0.00 100.00
comp 21 21 0.00 0.00 100.00
comp 22 22 0.00 0.00 100.00

Proyección de las variables en los nuevos ejes

Ver código
plot.PCA(nat.PCA,axes=c(1,2),choix='var')
Warning: ggrepel: 12 unlabeled data points (too many overlaps). Consider
increasing max.overlaps

Ver código
plot.PCA(nat.PCA,axes=c(2,3),choix='var')
Warning: ggrepel: 20 unlabeled data points (too many overlaps). Consider
increasing max.overlaps

Ver código
plot.PCA(nat.PCA,axes=c(1,3),choix='var')
Warning: ggrepel: 20 unlabeled data points (too many overlaps). Consider
increasing max.overlaps

Visualización de categoricas en los nuevos ejes

Ver código
fviz_pca_biplot(nat.PCA, label = "none",                 
                habillage = dat_nat$GENERO,                 
                addEllipses = TRUE)

Ver código
fviz_pca_biplot(nat.PCA, label = "none",                 
                habillage = dat_nat$ESTRATO,                 
                addEllipses = TRUE)
Too few points to calculate an ellipse
Too few points to calculate an ellipse
Too few points to calculate an ellipse

Ver código
fviz_pca_biplot(nat.PCA, label = "none",                 
                habillage = dat_nat$PERSONAL,                 
                addEllipses = TRUE,
                axes = c(2,3))
Too few points to calculate an ellipse
Too few points to calculate an ellipse
Too few points to calculate an ellipse
Too few points to calculate an ellipse
Too few points to calculate an ellipse

Ver código
fviz_pca_biplot(nat.PCA, label = "none",                 
                habillage = dat_nat$CATEGORIA,                 
                addEllipses = TRUE,
                axes = c(2,3))
Too few points to calculate an ellipse
Too few points to calculate an ellipse
Too few points to calculate an ellipse
Too few points to calculate an ellipse

Ver código
fviz_pca_biplot(nat.PCA, label = "none",                 
                habillage = dat_nat$`EMPREN-SOCIAL`,                 
                addEllipses = TRUE,
                axes = c(2,3))

ACS

Ver código
library(dplyr)

# Recategorizar los intervalos 
d_n <- dat_nat %>%
  mutate(
    ACTIV_2023 = case_when(
      ACTIV_2023 < 1000000 ~ "[0 - 1'000.000)",
      ACTIV_2023 >= 1000000 & ACTIV_2023 < 2000000 ~ "[1'000.000 - 2'000.000)",
      ACTIV_2023 >= 2000000 & ACTIV_2023 < 3000000 ~ "[2'000.000 - 3'000.000)",
      ACTIV_2023 >= 3000000 & ACTIV_2023 < 5000000 ~ "[3'000.000 - 5'000.000)",
      ACTIV_2023 >= 5000000 & ACTIV_2023 < 10000000 ~ "[5'000.000 - 10'000.000)",
      ACTIV_2023 >= 10000000 & ACTIV_2023 < 20000000 ~ "[10'000.000 - 20'000.000)",
      ACTIV_2023 >= 20000000 ~ "[20'000.000 - 938'043.000)",
      TRUE ~ as.character(ACTIV_2023)  # Mantener el resto de valores
    ),
    `ING-OPERACIONES` = case_when(
      `ING-OPERACIONES` < 1000000 ~ "[0 - 1'000.000)",
      `ING-OPERACIONES` >= 1000000 & `ING-OPERACIONES` < 5000000 ~ "[1'000.000 - 5'000.000)",
      `ING-OPERACIONES` >= 5000000 & `ING-OPERACIONES` < 15000000 ~ "[5'000.000 - 15'000.000)",
      `ING-OPERACIONES` >= 15000000 & `ING-OPERACIONES` < 50000000 ~ "[15'000.000 - 50'000.000)",
      `ING-OPERACIONES` >= 50000000 ~ "[50'000.000 - 5.720'881.000)",
      TRUE ~ as.character(`ING-OPERACIONES`)  # Mantener el resto de valores
    ),
    ACTIV_2022 = case_when(
      ACTIV_2022 < 1000000 ~ "[0 - 1'000.000)",
      ACTIV_2022 >= 1000000 & ACTIV_2022 < 2000000 ~ "[1'000.000 - 2'000.000)",
      ACTIV_2022 >= 2000000 & ACTIV_2022 < 3000000 ~ "[2'000.000 - 3'000.000)",
      ACTIV_2022 >= 3000000 & ACTIV_2022 < 5000000 ~ "[3'000.000 - 5'000.000)",
      ACTIV_2022 >= 5000000 & ACTIV_2022 < 10000000 ~ "[5'000.000 - 10'000.000)",
      ACTIV_2022 >= 10000000 & ACTIV_2022 < 20000000 ~ "[10'000.000 - 20'000.000)",
      ACTIV_2022 >= 20000000 ~ "[20'000.000 - 509'312.000)",
      TRUE ~ as.character(ACTIV_2022)  # Mantener el resto de valores
    ),
ACTIV_2021 = case_when(
      ACTIV_2021 < 1000000 ~ "[0 - 1'000.000)",
      ACTIV_2021 >= 1000000 & ACTIV_2021 < 2000000 ~ "[1'000.000 - 2'000.000)",
      ACTIV_2021 >= 2000000 & ACTIV_2021 < 3000000 ~ "[2'000.000 - 3'000.000)",
      ACTIV_2021 >= 3000000 & ACTIV_2021 < 5000000 ~ "[3'000.000 - 5'000.000)",
      ACTIV_2021 >= 5000000 & ACTIV_2021 < 10000000 ~ "[5'000.000 - 10'000.000)",
      ACTIV_2021 >= 10000000 & ACTIV_2021 < 20000000 ~ "[10'000.000 - 20'000.000)",
      ACTIV_2021 >= 20000000 ~ "[20'000.000 - 379'325.000)",
      TRUE ~ as.character(ACTIV_2021)  # Mantener el resto de valores
    ),
`ACTIVO-TOTAL` = case_when(
      `ACTIVO-TOTAL` < 1000000 ~ "[0 - 1'000.000)",
      `ACTIVO-TOTAL` >=1000000 & `ACTIVO-TOTAL` < 2000000 ~ 
        "[1'000.000 - 2'000.000)", 
      `ACTIVO-TOTAL` >=2000000 & `ACTIVO-TOTAL` < 3000000 ~ 
        "[2'000.000 - 3'000.000)", 
      `ACTIVO-TOTAL` >=3000000 & `ACTIVO-TOTAL` < 5000000 ~ 
        "[3'000.000 - 5'000.000)", 
      `ACTIVO-TOTAL` >=5000000 & `ACTIVO-TOTAL` < 10000000 ~ 
        "[5'000.000 - 10'000.000)", 
      `ACTIVO-TOTAL` >=10000000 & `ACTIVO-TOTAL` < 20000000 ~ 
        "[10'000.000 - 20'000.000)",`ACTIVO-TOTAL` >=20000000  ~ 
        "[20'000.000 - 938'043.000)" ,    
      TRUE ~ as.character(`ACTIVO-TOTAL`)  # Mantener el resto de valores
    ),
`ACTIVO-CORRIENTE` = case_when(
      `ACTIVO-CORRIENTE` < 1000000 ~ "[0 - 1'000.000)",
      `ACTIVO-CORRIENTE` >= 1000000 & `ACTIVO-CORRIENTE` < 2000000 ~ "[1'000.000 - 2'000.000)",
      `ACTIVO-CORRIENTE` >= 2000000 & `ACTIVO-CORRIENTE` < 3000000 ~ "[2'000.000 - 3'000.000)",
      `ACTIVO-CORRIENTE` >= 3000000 & `ACTIVO-CORRIENTE` < 5000000 ~ "[3'000.000 - 5'000.000)",
      `ACTIVO-CORRIENTE` >= 5000000 & `ACTIVO-CORRIENTE` < 10000000 ~ "[5'000.000 - 10'000.000)",
      `ACTIVO-CORRIENTE` >= 10000000 & `ACTIVO-CORRIENTE` < 20000000 ~ "[10'000.000 - 20'000.000)",
      `ACTIVO-CORRIENTE` >= 20000000 ~ "[20'000.000 - 706'777.000)",
      TRUE ~ as.character(`ACTIVO-CORRIENTE`)  # Mantener el resto de valores
    ),
`PATRIMONIO` = case_when(
      `PATRIMONIO` < 1000000 ~ "[0 - 1'000.000)",
      `PATRIMONIO` >= 1000000 & `PATRIMONIO` < 2000000 ~ "[1'000.000 - 2'000.000)",
      `PATRIMONIO` >= 2000000 & `PATRIMONIO` < 3000000 ~ "[2'000.000 - 3'000.000)",
      `PATRIMONIO` >= 3000000 & `PATRIMONIO` < 5000000 ~ "[3'000.000 - 5'000.000)",
      `PATRIMONIO` >= 5000000 & `PATRIMONIO` < 10000000 ~ "[5'000.000 - 10'000.000)",
      `PATRIMONIO` >= 10000000 & `PATRIMONIO` < 20000000 ~ "[10'000.000 - 20'000.000)",
      `PATRIMONIO` >= 20000000 ~ "[20'000.000 - 604'967.325)",
      TRUE ~ as.character(`PATRIMONIO`)  # Mantener el resto de valores
    ),
`ING-TAM-EMPRESARIAL` = case_when(
      `ING-TAM-EMPRESARIAL` < 1000000 ~ "[0 - 1'000.000)",
      `ING-TAM-EMPRESARIAL` >= 1000000 & `ING-TAM-EMPRESARIAL` < 100000000 ~ "[1'000.000 - 100'000.000)",
      `ING-TAM-EMPRESARIAL` >= 100000000  ~ "[100'000.000 - 5.720'881.000)",
      TRUE ~ as.character(`ING-TAM-EMPRESARIAL`)  # Mantener el resto de valores
    ),
`UTIL-OPERACIONAL` = case_when(
      `UTIL-OPERACIONAL`  < 0 ~ "[-23'200.000 - 0)",
      `UTIL-OPERACIONAL`  >= 0 & `UTIL-OPERACIONAL`  < 1 ~ "0",
      `UTIL-OPERACIONAL`  >= 1  ~ "(0 - 338'606.000]",
      TRUE ~ as.character(`UTIL-OPERACIONAL`)  # Mantener el resto de valores
    ),
`UTIL-NETA` = case_when(
      `UTIL-NETA`  < 0 ~ "[-23'200.000 - 0)",
      `UTIL-NETA`  >= 0 & `UTIL-NETA` < 1 ~ "0",
      `UTIL-NETA`  >= 1  ~ "(0 - 186'132.000]",
      TRUE ~ as.character(`UTIL-NETA`)  # Mantener el resto de valores
    ),
`PASIVO-TOTAL` = case_when(
      `PASIVO-TOTAL`  >= 0 & `PASIVO-TOTAL` < 1 ~ "0",
      `PASIVO-TOTAL` >=1 & `PASIVO-TOTAL` < 1000000 ~ "[0 - 1'000.000)",
      `PASIVO-TOTAL` >= 1000000  ~ "[1'000.000 - 367'530.000)",
      TRUE ~ as.character(`PASIVO-TOTAL`)  # Mantener el resto de valores
    ),
`GAS-OPERACIONALES` = case_when(
      `GAS-OPERACIONALES`  >= 0 & `GAS-OPERACIONALES` < 1 ~ "0",
      `GAS-OPERACIONALES` >=1 & `GAS-OPERACIONALES` < 1000000 ~ "[0 - 1'000.000)",
      `GAS-OPERACIONALES` >= 1000000  ~ "[1'000.000 - 2.351'202.000)",
      TRUE ~ as.character(`GAS-OPERACIONALES`)  # Mantener el resto de valores
    ),
`COS-VEN` = case_when(
      `COS-VEN`  >= 0 & `COS-VEN` < 1 ~ "0",
      `COS-VEN` >=1 & `COS-VEN` < 1000000 ~ "[0 - 1'000.000)",
      `COS-VEN` >= 1000000  ~ "[1'000.000 - 200'000.000)",
      TRUE ~ as.character(`COS-VEN`)  # Mantener el resto de valores
    ),
ACTIV_2019 = case_when(
      ACTIV_2019 >= 0 & `UTIL-NETA` < 1 ~ "0",
      ACTIV_2019 >=1 & ACTIV_2019 < 1000000 ~ "[0 - 1'000.000)",
      ACTIV_2019 >= 1000000  ~ "[1'000.000 - 470'937.000)",
      TRUE ~ as.character(ACTIV_2019)  # Mantener el resto de valores
    ),
ACTIV_2020 = case_when(
      ACTIV_2020  >= 0 & `UTIL-NETA` < 1 ~ "0",
      ACTIV_2020 >=1 & ACTIV_2020 < 1000000 ~ "[0 - 1'000.000)",
      ACTIV_2020 >= 1000000  ~ "[1'000.000 - 428'599.117)",
      TRUE ~ as.character(ACTIV_2020)  # Mantener el resto de valores
    ),
`PASIVO+PATRIM` = case_when(
      `PASIVO+PATRIM` < 1000000 ~ "[0 - 1'000.000)",
      `PASIVO+PATRIM` >=1000000 & `PASIVO+PATRIM` < 2000000 ~ 
        "[1'000.000 - 2'000.000)", 
      `PASIVO+PATRIM` >=2000000 & `PASIVO+PATRIM` < 3000000 ~ 
        "[2'000.000 - 3'000.000)", 
      `PASIVO+PATRIM` >=3000000 & `PASIVO+PATRIM` < 5000000 ~ 
        "[3'000.000 - 5'000.000)", 
      `PASIVO+PATRIM` >=5000000 & `PASIVO+PATRIM` < 10000000 ~ 
        "[5'000.000 - 10'000.000)", 
      `PASIVO+PATRIM` >=10000000 & `PASIVO+PATRIM` < 20000000 ~ 
        "[10'000.000 - 20'000.000)",`PASIVO+PATRIM` >=20000000  ~ 
        "[20'000.000 - 938'043.000)" ,    
      TRUE ~ as.character(`PASIVO+PATRIM`)  # Mantener el resto de valores
    ),

`PASIVO-LRG-PLAZO` = case_when(
      `PASIVO-LRG-PLAZO`  >= 0 & `PASIVO-LRG-PLAZO` < 1 ~ "0",
      `PASIVO-LRG-PLAZO` >=1 & `PASIVO-LRG-PLAZO` < 1000000 ~ "[0 - 1'000.000)",
      `PASIVO-LRG-PLAZO` >= 1000000  ~ "[1'000.000 - 367'530.000)",
      TRUE ~ as.character(`PASIVO-LRG-PLAZO`)  # Mantener el resto de valores
    ),
`ING-NO-OPERACIONALES` = case_when(
      `ING-NO-OPERACIONALES`  >= 0 & `ING-NO-OPERACIONALES` < 1 ~ "0",
      `ING-NO-OPERACIONALES`>=1 & `ING-NO-OPERACIONALES` < 1000000 ~ "[0 - 1'000.000)",
      `ING-NO-OPERACIONALES` >= 1000000  ~ "[1'000.000 - 367'530.000)",
      TRUE ~ as.character(`ING-NO-OPERACIONALES`)  # Mantener el resto de valores
    ),
SUBREGION = case_when(
    `MUN-COMERCIAL` %in% c("05002 - ABEJORRAL", "05756 - SONSON", "05055 - ARGELIA", "05483 - NARIÑO") ~ "Páramo",
    `MUN-COMERCIAL` %in% c("05652 - SAN FRANCISCO", "05660 - SAN LUIS", "05197 - COCORNA") ~ "Bosques",
    `MUN-COMERCIAL` %in% c("05649 - SAN CARLOS", "05313 - GRANADA", "05321 - GUATAPE", "05667 - SAN RAFAEL", "05541 - EL PENOL", "05021 - ALEJANDRIA", "05206 - CONCEPCION") ~ "Embalses",
    TRUE ~ "Valle de San Nicolás"),
CATEGORIA=case_when(
  CATEGORIA %in% c("ELABORACION DE PRODUCTOS DE CONSUMO")~"ELABORACION DE PRODUCTOS DE CONSUMO",
  CATEGORIA %in% c("HOTELERÍA Y TURISMO")~"HOTELERÍA Y TURISMO",
  CATEGORIA %in% c("COMERCIO","AGROPECUARIA","RECREACION","AUDIOVISUAL", "INVESTIGACION", "RECREACION","TERAPEUTICO","TRANSPORTADORA") ~"OTROS"
  ),
 `CANT-MUJERES`=case_when(
   `CANT-MUJERES`%in% c("0")~"0",
   `CANT-MUJERES`%in% c("1","2","3","4","5","6","7","12","35")~"MAYOR A 0"
 ),
  ESTRATO=case_when(
    ESTRATO%in% c("1","2","3")~"BAJO-MEDIO",
    ESTRATO%in% c("4","5","6")~"MEDIO_ALTO "
  ),
  PERSONAL=case_when(
    PERSONAL%in% c("0")~"0",
    PERSONAL%in% c("1","2","3")~"1-3",
    PERSONAL%in% c("4","5","6","7","10","11","20","76")~"4-76"
  )
)

d_n$`CANT-MUJERES` <- as.factor(d_n$`CANT-MUJERES`)
d_n$PERSONAL <- as.factor(d_n$PERSONAL)
d_n$ESTRATO <- as.factor(d_n$ESTRATO)
d_n$CATEGORIA <- as.factor(d_n$CATEGORIA)
d_n$SUBREGION <- as.factor(d_n$SUBREGION)
d_n$`ING-NO-OPERACIONALES` <- as.factor(d_n$`ING-NO-OPERACIONALES`)
d_n$`PASIVO-LRG-PLAZO` <- as.factor(d_n$`PASIVO-LRG-PLAZO`)
d_n$`PASIVO-CORRIENTE` <- as.factor(d_n$`PASIVO-CORRIENTE`)
d_n$`ACTIVO-NO-CORRIENTE` <- as.factor(d_n$`ACTIVO-NO-CORRIENTE`)
d_n$`PASIVO+PATRIM` <- as.factor(d_n$`PASIVO+PATRIM`)
d_n$`ACTIV_2020` <- as.factor(d_n$`ACTIV_2020`)
d_n$`ACTIV_2019` <- as.factor(d_n$`ACTIV_2019`)
d_n$`GAS-IMP` <- as.factor(d_n$`GAS-IMP`)
d_n$`COS-VEN` <- as.factor(d_n$`COS-VEN`)
d_n$`GAS-NO-OPERAC` <- as.factor(d_n$`GAS-NO-OPERAC`)
d_n$`GAS-OPERACIONALES` <- as.factor(d_n$`GAS-OPERACIONALES`)
d_n$`PASIVO-TOTAL` <- as.factor(d_n$`PASIVO-TOTAL`)
d_n$`UTIL-NETA` <- as.factor(d_n$`UTIL-NETA`)
d_n$`UTIL-OPERACIONAL` <- as.factor(d_n$`UTIL-OPERACIONAL`)
d_n$`ING-TAM-EMPRESARIAL` <- as.factor(d_n$`ING-TAM-EMPRESARIAL`)
d_n$`PATRIMONIO` <- as.factor(d_n$`PATRIMONIO`)
d_n$`ACTIVO-CORRIENTE` <- as.factor(d_n$`ACTIVO-CORRIENTE`)
d_n$`ACTIVO-TOTAL` <- as.factor(d_n$`ACTIVO-TOTAL`)
d_n$`ACTIV_2021` <- as.factor(d_n$`ACTIV_2021`)
d_n$`ACTIV_2022` <- as.factor(d_n$`ACTIV_2022`)
d_n$`ING-OPERACIONES` <- as.factor(d_n$`ING-OPERACIONES`)
d_n$`ACTIV_2023` <- as.factor(d_n$`ACTIV_2023`)

dna <- d_n %>%
  select(GENERO, `EMPREN-SOCIAL`,SUBREGION, `DIR-COMERCIAL`, CATEGORIA, `CANT-EST-BD`, `CANT-MUJERES`, `ING-TAM-EMPRESARIAL`, ESTRATO, PERSONAL, `ACTIVO-CORRIENTE`,`PASIVO-LRG-PLAZO`, `PASIVO-TOTAL`, PATRIMONIO, `ING-NO-OPERACIONALES`, `GAS-OPERACIONALES`, `COS-VEN`, `UTIL-NETA`, ACTIV_2019, ACTIV_2020, ACTIV_2021, ACTIV_2022, ACTIV_2023)

summary(dna)
 GENERO  EMPREN-SOCIAL                SUBREGION   DIR-COMERCIAL
 F:286   N:547         Bosques             : 22   RURAL :162   
 M:308   S: 47         Embalses            : 74   URBANO:432   
                       Páramo              : 32                
                       Valle de San Nicolás:466                
                                                               
                                                               
                                                               
                               CATEGORIA      CANT-EST-BD     CANT-MUJERES
 ELABORACION DE PRODUCTOS DE CONSUMO:492   cero     : 48   0        :447  
 HOTELERÍA Y TURISMO                : 56   dos_o_mas: 14   MAYOR A 0:147  
 OTROS                              : 46   uno      :532                  
                                                                          
                                                                          
                                                                          
                                                                          
                    ING-TAM-EMPRESARIAL        ESTRATO    PERSONAL  
 [0 - 1'000.000)              :181      BAJO-MEDIO :413   0   :381  
 [1'000.000 - 100'000.000)    :364      MEDIO_ALTO :181   1-3 :175  
 [100'000.000 - 5.720'881.000): 49                        4-76: 38  
                                                                    
                                                                    
                                                                    
                                                                    
                   ACTIVO-CORRIENTE                  PASIVO-LRG-PLAZO
 [0 - 1'000.000)           : 58     [0 - 1'000.000)          :  9    
 [1'000.000 - 2'000.000)   :115     [1'000.000 - 367'530.000):  8    
 [10'000.000 - 20'000.000) : 97     0                        :577    
 [2'000.000 - 3'000.000)   : 90                                      
 [20'000.000 - 706'777.000): 37                                      
 [3'000.000 - 5'000.000)   : 90                                      
 [5'000.000 - 10'000.000)  :107                                      
                    PASIVO-TOTAL                      PATRIMONIO 
 [0 - 1'000.000)          : 18   [0 - 1'000.000)           : 89  
 [1'000.000 - 367'530.000): 75   [1'000.000 - 2'000.000)   :100  
 0                        :501   [10'000.000 - 20'000.000) : 90  
                                 [2'000.000 - 3'000.000)   : 89  
                                 [20'000.000 - 604'967.325): 35  
                                 [3'000.000 - 5'000.000)   : 88  
                                 [5'000.000 - 10'000.000)  :103  
                ING-NO-OPERACIONALES                   GAS-OPERACIONALES
 [0 - 1'000.000)          :  9       [0 - 1'000.000)            :  4    
 [1'000.000 - 367'530.000):  2       [1'000.000 - 2.351'202.000): 55    
 0                        :583       0                          :535    
                                                                        
                                                                        
                                                                        
                                                                        
                      COS-VEN                UTIL-NETA   ACTIV_2019 ACTIV_2020
 [0 - 1'000.000)          :  8   (0 - 186'132.000]: 52   0:594      0:594     
 [1'000.000 - 200'000.000): 63   [-23'200.000 - 0):  2                        
 0                        :523   0                :540                        
                                                                              
                                                                              
                                                                              
                                                                              
                      ACTIV_2021                       ACTIV_2022 
 [0 - 1'000.000)           :268   [0 - 1'000.000)           :175  
 [1'000.000 - 2'000.000)   : 74   [1'000.000 - 2'000.000)   : 87  
 [10'000.000 - 20'000.000) : 59   [10'000.000 - 20'000.000) : 70  
 [2'000.000 - 3'000.000)   : 52   [2'000.000 - 3'000.000)   : 66  
 [20'000.000 - 379'325.000): 19   [20'000.000 - 509'312.000): 30  
 [3'000.000 - 5'000.000)   : 57   [3'000.000 - 5'000.000)   : 74  
 [5'000.000 - 10'000.000)  : 65   [5'000.000 - 10'000.000)  : 92  
                      ACTIV_2023 
 [0 - 1'000.000)           : 46  
 [1'000.000 - 2'000.000)   :109  
 [10'000.000 - 20'000.000) : 96  
 [2'000.000 - 3'000.000)   : 94  
 [20'000.000 - 938'043.000): 44  
 [3'000.000 - 5'000.000)   : 89  
 [5'000.000 - 10'000.000)  :116  

ACM

ACM genero en la industria

Ver código
gen <- dna %>%
  select(GENERO, `CANT-MUJERES`, `ING-TAM-EMPRESARIAL`, PATRIMONIO, `ING-NO-OPERACIONALES`, `COS-VEN`, `UTIL-NETA`)


# Realizar el ACM
acm_gen <- MCA(gen, graph=FALSE)
Ver código
#Benzecri
s <- 7
l <- acm_gen$eig[acm_gen$eig[,1] > 1/s, 1]
tau <- ( s / (s - 1) )^2 * ( l - (1/s) )^2
ptau <- tau / sum( tau ) * 100
barplot(ptau, col="darkred", ylim = c(0,100))+text(ptau, labels = paste(round(ptau,3),"%"), pos=3)

numeric(0)
Ver código
library(knitr)

kable(round(acm_gen$var$contrib, 2), caption = "Contribuciones de las variables") %>%
   kable_styling(full_width = F) %>%
   scroll_box(width="800px", height="500px")
Contribuciones de las variables
Dim 1 Dim 2 Dim 3 Dim 4 Dim 5
F 0.12 1.25 3.80 16.80 0.00
M 0.12 1.16 3.52 15.60 0.00
CANT-MUJERES_0 1.59 5.32 2.43 0.64 0.48
CANT-MUJERES_MAYOR A 0 4.85 16.19 7.40 1.95 1.47
ING-TAM-EMPRESARIAL_[0 - 1'000.000) 4.12 0.11 21.07 0.00 0.67
ING-TAM-EMPRESARIAL_[1'000.000 - 100'000.000) 0.08 1.59 14.53 0.14 1.17
ING-TAM-EMPRESARIAL_[100'000.000 - 5.720'881.000) 9.94 16.74 2.46 1.26 1.89
PATRIMONIO_[0 - 1'000.000) 0.81 1.55 0.16 7.74 0.66
PATRIMONIO_[1'000.000 - 2'000.000) 0.66 5.63 10.58 0.65 5.95
PATRIMONIO_[10'000.000 - 20'000.000) 0.18 4.13 1.32 1.43 2.64
PATRIMONIO_[2'000.000 - 3'000.000) 0.48 0.85 0.30 9.95 11.57
PATRIMONIO_[20'000.000 - 604'967.325) 7.41 3.17 10.96 0.06 0.00
PATRIMONIO_[3'000.000 - 5'000.000) 0.00 1.05 6.61 0.61 9.19
PATRIMONIO_[5'000.000 - 10'000.000) 0.12 0.00 6.55 17.57 7.95
ING-NO-OPERACIONALES_[0 - 1'000.000) 12.35 14.48 0.85 0.35 2.47
ING-NO-OPERACIONALES_[1'000.000 - 367'530.000) 3.31 11.29 4.60 0.02 1.39
ING-NO-OPERACIONALES_0 0.30 0.08 0.06 0.00 0.02
COS-VEN_[0 - 1'000.000) 0.04 0.45 2.74 24.04 0.08
COS-VEN_[1'000.000 - 200'000.000) 24.38 4.45 0.00 0.00 1.22
COS-VEN_0 2.85 0.66 0.05 0.35 0.18
UTIL-NETA_(0 - 186'132.000] 21.76 4.07 0.01 0.72 6.46
UTIL-NETA_[-23'200.000 - 0) 2.17 5.17 0.01 0.06 44.39
UTIL-NETA_0 2.36 0.58 0.00 0.06 0.15
Ver código
kable(round(acm_gen$var$coord, 2), caption = "Coordenadas de las variables") %>%
   kable_styling(full_width = F) %>%
   scroll_box(width="800px", height="500px")
Coordenadas de las variables
Dim 1 Dim 2 Dim 3 Dim 4 Dim 5
F -0.08 0.19 -0.31 0.63 -0.01
M 0.07 -0.17 0.29 -0.59 0.00
CANT-MUJERES_0 -0.23 0.31 0.20 -0.10 -0.08
CANT-MUJERES_MAYOR A 0 0.69 -0.94 -0.60 0.30 0.26
ING-TAM-EMPRESARIAL_[0 - 1'000.000) -0.57 0.07 0.92 -0.01 0.16
ING-TAM-EMPRESARIAL_[1'000.000 - 100'000.000) 0.05 0.19 -0.54 -0.05 -0.15
ING-TAM-EMPRESARIAL_[100'000.000 - 5.720'881.000) 1.70 -1.66 0.60 0.42 0.51
PATRIMONIO_[0 - 1'000.000) -0.36 -0.37 0.11 0.77 0.22
PATRIMONIO_[1'000.000 - 2'000.000) -0.31 0.67 0.88 -0.21 -0.63
PATRIMONIO_[10'000.000 - 20'000.000) 0.17 -0.61 -0.33 -0.33 -0.44
PATRIMONIO_[2'000.000 - 3'000.000) -0.28 0.28 0.16 0.87 0.93
PATRIMONIO_[20'000.000 - 604'967.325) 1.74 -0.85 1.51 -0.11 -0.01
PATRIMONIO_[3'000.000 - 5'000.000) -0.02 0.31 -0.74 0.22 -0.83
PATRIMONIO_[5'000.000 - 10'000.000) 0.13 -0.01 -0.68 -1.08 0.71
ING-NO-OPERACIONALES_[0 - 1'000.000) 4.43 3.60 0.83 -0.51 1.35
ING-NO-OPERACIONALES_[1'000.000 - 367'530.000) 4.87 -6.74 4.08 0.25 -2.15
ING-NO-OPERACIONALES_0 -0.09 -0.03 -0.03 0.01 -0.01
COS-VEN_[0 - 1'000.000) -0.28 0.67 1.58 4.52 -0.26
COS-VEN_[1'000.000 - 200'000.000) 2.35 0.75 0.01 -0.02 -0.36
COS-VEN_0 -0.28 -0.10 -0.02 -0.07 0.05
UTIL-NETA_(0 - 186'132.000] 2.45 0.79 0.03 0.31 -0.91
UTIL-NETA_[-23'200.000 - 0) 3.94 4.56 -0.17 -0.45 12.12
UTIL-NETA_0 -0.25 -0.09 0.00 -0.03 0.04
Ver código
kable(round(acm_gen$eig, 2), caption = "Valores propios (Eigenvalues)") %>%
   kable_styling(full_width = F) %>%
   scroll_box(width="800px", height="500px")
Valores propios (Eigenvalues)
eigenvalue percentage of variance cumulative percentage of variance
dim 1 0.34 15.07 15.07
dim 2 0.19 8.48 23.55
dim 3 0.17 7.62 31.17
dim 4 0.16 7.15 38.32
dim 5 0.16 6.97 45.29
dim 6 0.15 6.52 51.81
dim 7 0.14 6.24 58.05
dim 8 0.14 6.01 64.06
dim 9 0.13 5.89 69.95
dim 10 0.13 5.77 75.72
dim 11 0.13 5.47 81.19
dim 12 0.12 5.07 86.26
dim 13 0.11 4.83 91.08
dim 14 0.09 3.80 94.89
dim 15 0.08 3.39 98.27
dim 16 0.04 1.73 100.00
Ver código
dv_acm_gen <- data.frame(Variable = rownames(acm_gen$var$eta2), 
                     Eje1 = acm_gen$var$eta2[,1],
                     Eje2 = acm_gen$var$eta2[,2])

Valores test,contribución y calidad de representación de las variables con el Eje1:

Ver código
fviz_contrib(acm_gen, choice = "var", axes = 1)+
  theme(axis.text.x = element_text(angle = 90, hjust = 1))

Ver código
fviz_cos2(acm_gen, choice="var",axes=1)+
  theme(axis.text.x = element_text(angle = 90, hjust = 1))

Ver código
# Histograma de correlaciones con los ejes
ggplot(dv_acm_gen, aes(x = reorder(Variable,-Eje1), y = Eje1)) +
  geom_bar(stat = "identity", fill = "steelblue") +
  geom_text(aes(label = round(Eje1, 3)), 
            vjust = -0.5, 
            color = "black", 
            size = 3.5)+
  ylim(c(0,1))+
  labs(title="Correlaciones Eje 1", x="Variables", y="Correlacion")+
  theme(plot.title = element_text(hjust = 0.5, face = "bold"),
        axis.text.x = element_text(angle = 90, hjust = 1))

Ver código
kable(acm_gen[["var"]][["v.test"]][,1], caption = "Valores Test") %>%
  kable_styling(full_width = F) %>%
  scroll_box(width = "800px", height = "500px")
Valores Test
x
F -1.8482458
M 1.8482458
CANT-MUJERES_0 -9.6003112
CANT-MUJERES_MAYOR A 0 9.6003112
ING-TAM-EMPRESARIAL_[0 - 1'000.000) -9.2038508
ING-TAM-EMPRESARIAL_[1'000.000 - 100'000.000) 1.6680164
ING-TAM-EMPRESARIAL_[100'000.000 - 5.720'881.000) 12.4454501
PATRIMONIO_[0 - 1'000.000) -3.6916824
PATRIMONIO_[1'000.000 - 2'000.000) -3.3663496
PATRIMONIO_[10'000.000 - 20'000.000) 1.7273556
PATRIMONIO_[2'000.000 - 3'000.000) -2.8281453
PATRIMONIO_[20'000.000 - 604'967.325) 10.6130899
PATRIMONIO_[3'000.000 - 5'000.000) -0.2458205
PATRIMONIO_[5'000.000 - 10'000.000) 1.4669938
ING-NO-OPERACIONALES_[0 - 1'000.000) 13.3932143
ING-NO-OPERACIONALES_[1'000.000 - 367'530.000) 6.8922147
ING-NO-OPERACIONALES_0 -15.0968277
COS-VEN_[0 - 1'000.000) -0.7863824
COS-VEN_[1'000.000 - 200'000.000) 19.7490139
COS-VEN_0 -18.4654779
UTIL-NETA_(0 - 186'132.000] 18.4655133
UTIL-NETA_[-23'200.000 - 0) 5.5791374
UTIL-NETA_0 -19.2780727

Valores test,contribución y calidad de representación de las variables con el Eje2:

Ver código
fviz_contrib(acm_gen, choice = "var", axes = 2)+
  theme(axis.text.x = element_text(angle = 90, hjust = 1))

Ver código
fviz_cos2(acm_gen, choice="var",axes=2)+
  theme(axis.text.x = element_text(angle = 90, hjust = 1))

Ver código
ggplot(dv_acm_gen, aes(x = reorder(Variable,-Eje2), y = Eje2)) +
  geom_bar(stat = "identity", fill = "steelblue") +
  geom_text(aes(label = round(Eje2, 3)), 
            vjust = -0.5, 
            color = "black", 
            size = 3.5)+
  ylim(c(0,1))+
  labs(title="Correlaciones Eje 2", x="Variables", y="Correlacion")+
  theme(plot.title = element_text(hjust = 0.5, face = "bold"),
        axis.text.x = element_text(angle = 90, hjust = 1))

Ver código
kable(acm_gen[["var"]][["v.test"]][,2], caption = "Valores Test") %>%
  kable_styling(full_width = F) %>%
  scroll_box(width = "800px", height = "500px")
Valores Test
x
F 4.4025703
M -4.4025703
CANT-MUJERES_0 13.1546798
CANT-MUJERES_MAYOR A 0 -13.1546798
ING-TAM-EMPRESARIAL_[0 - 1'000.000) 1.1523426
ING-TAM-EMPRESARIAL_[1'000.000 - 100'000.000) 5.7521898
ING-TAM-EMPRESARIAL_[100'000.000 - 5.720'881.000) -12.1127442
PATRIMONIO_[0 - 1'000.000) -3.8334863
PATRIMONIO_[1'000.000 - 2'000.000) 7.3799054
PATRIMONIO_[10'000.000 - 20'000.000) -6.2591399
PATRIMONIO_[2'000.000 - 3'000.000) 2.8426533
PATRIMONIO_[20'000.000 - 604'967.325) -5.2060124
PATRIMONIO_[3'000.000 - 5'000.000) 3.1505846
PATRIMONIO_[5'000.000 - 10'000.000) -0.1501988
ING-NO-OPERACIONALES_[0 - 1'000.000) 10.8747551
ING-NO-OPERACIONALES_[1'000.000 - 367'530.000) -9.5431653
ING-NO-OPERACIONALES_0 -5.7529359
COS-VEN_[0 - 1'000.000) 1.9148697
COS-VEN_[1'000.000 - 200'000.000) 6.3270482
COS-VEN_0 -6.6857369
UTIL-NETA_(0 - 186'132.000] 5.9880503
UTIL-NETA_[-23'200.000 - 0) 6.4590516
UTIL-NETA_0 -7.1885059

####Proyección de variables en los Ejes(1,2)

Ver código
fviz_mca_var(acm_gen, axes = c(1, 2),
             choice = "mca.cor", repel = TRUE,
             select.var = list(name = c(colnames(gen))),
             ggtheme = theme_minimal())

ACM capacidad de endeudamiento

Ver código
ende <- dna %>%
  select(`DIR-COMERCIAL`, `CANT-EST-BD`, ESTRATO, PERSONAL, `PASIVO-LRG-PLAZO`, `PASIVO-TOTAL`, `GAS-OPERACIONALES`)


# Realizar el ACM
acm_ende <- MCA(ende, graph=FALSE)
Ver código
#Benzecri
s <- 7
l <- acm_ende$eig[acm_ende$eig[,1] > 1/s, 1]
tau <- ( s / (s - 1) )^2 * ( l - (1/s) )^2
ptau <- tau / sum( tau ) * 100
barplot(ptau, col="darkred", ylim = c(0,100))+text(ptau, labels = paste(round(ptau,3),"%"), pos=3)

numeric(0)
Ver código
library(knitr)

kable(round(acm_ende$var$contrib, 2), caption = "Contribuciones de las variables") %>%
   kable_styling(full_width = F) %>%
   scroll_box(width="800px", height="500px")
Contribuciones de las variables
Dim 1 Dim 2 Dim 3 Dim 4 Dim 5
RURAL 9.30 0.53 0.74 5.12 0.12
URBANO 3.49 0.20 0.28 1.92 0.04
cero 0.06 14.04 7.87 16.13 1.93
dos_o_mas 2.77 6.14 0.48 18.18 1.38
uno 0.12 0.52 0.53 3.60 0.05
BAJO-MEDIO 1.16 6.66 3.25 2.26 0.28
MEDIO_ALTO 2.65 15.19 7.41 5.16 0.65
PERSONAL_0 8.47 1.95 0.93 0.00 1.37
PERSONAL_1-3 11.15 0.41 2.13 2.68 11.06
PERSONAL_4-76 4.20 9.30 0.01 13.89 11.73
PASIVO-LRG-PLAZO_[0 - 1'000.000) 3.28 12.97 9.61 3.80 36.42
PASIVO-LRG-PLAZO_[1'000.000 - 367'530.000) 8.18 1.80 26.90 9.78 0.19
PASIVO-LRG-PLAZO_0 0.32 0.37 0.05 0.37 0.49
PASIVO-TOTAL_[0 - 1'000.000) 2.99 20.89 19.93 1.16 0.51
PASIVO-TOTAL_[1'000.000 - 367'530.000) 19.32 0.27 4.66 8.80 0.84
PASIVO-TOTAL_0 4.11 1.14 0.00 0.89 0.24
GAS-OPERACIONALES_[0 - 1'000.000) 2.59 7.58 7.46 1.35 32.18
GAS-OPERACIONALES_[1'000.000 - 2.351'202.000) 14.06 0.00 7.37 4.30 0.42
GAS-OPERACIONALES_0 1.80 0.05 0.40 0.59 0.08
Ver código
kable(round(acm_ende$var$coord, 2), caption = "Coordenadas de las variables") %>%
   kable_styling(full_width = F) %>%
   scroll_box(width="800px", height="500px")
Coordenadas de las variables
Dim 1 Dim 2 Dim 3 Dim 4 Dim 5
RURAL -0.78 0.17 0.19 -0.46 0.07
URBANO 0.29 -0.06 -0.07 0.17 -0.02
cero 0.11 1.62 1.11 1.51 -0.50
dos_o_mas 1.45 -1.98 -0.51 2.97 0.78
uno -0.05 -0.09 -0.09 -0.21 0.02
BAJO-MEDIO 0.17 -0.38 -0.24 -0.19 -0.06
MEDIO_ALTO -0.39 0.87 0.56 0.44 0.15
PERSONAL_0 -0.49 0.21 0.14 -0.01 0.15
PERSONAL_1-3 0.82 -0.14 -0.30 -0.32 -0.62
PERSONAL_4-76 1.09 -1.48 0.04 1.58 1.38
PASIVO-LRG-PLAZO_[0 - 1'000.000) 1.97 3.59 -2.84 -1.70 4.99
PASIVO-LRG-PLAZO_[1'000.000 - 367'530.000) 3.30 1.42 5.04 -2.89 -0.38
PASIVO-LRG-PLAZO_0 -0.08 -0.08 -0.03 0.07 -0.07
PASIVO-TOTAL_[0 - 1'000.000) 1.33 3.22 -2.89 0.66 0.42
PASIVO-TOTAL_[1'000.000 - 367'530.000) 1.66 0.18 0.69 -0.89 0.26
PASIVO-TOTAL_0 -0.30 -0.14 0.00 0.11 -0.05
GAS-OPERACIONALES_[0 - 1'000.000) 2.63 4.12 -3.75 1.51 -7.04
GAS-OPERACIONALES_[1'000.000 - 2.351'202.000) 1.65 -0.02 1.01 0.73 0.22
GAS-OPERACIONALES_0 -0.19 -0.03 -0.08 -0.09 0.03
Ver código
kable(round(acm_ende$eig, 2), caption = "Valores propios (Eigenvalues)") %>%
   kable_styling(full_width = F) %>%
   scroll_box(width="800px", height="500px")
Valores propios (Eigenvalues)
eigenvalue percentage of variance cumulative percentage of variance
dim 1 0.26 14.96 14.96
dim 2 0.22 12.55 27.51
dim 3 0.18 10.61 38.12
dim 4 0.16 9.55 47.67
dim 5 0.15 8.63 56.30
dim 6 0.14 7.89 64.19
dim 7 0.13 7.36 71.56
dim 8 0.13 7.33 78.89
dim 9 0.11 6.21 85.10
dim 10 0.10 5.78 90.88
dim 11 0.08 4.91 95.79
dim 12 0.07 4.21 100.00
Ver código
dv_acm_ende <- data.frame(Variable = rownames(acm_ende$var$eta2), 
                     Eje1 = acm_ende$var$eta2[,1],
                     Eje2 = acm_ende$var$eta2[,2],
                     Eje3 = acm_ende$var$eta2[,3])

Valores test,contribución y calidad de representación de las variables con el Eje1:

Ver código
fviz_contrib(acm_ende, choice = "var", axes = 1)+
  theme(axis.text.x = element_text(angle = 90, hjust = 1))

Ver código
fviz_cos2(acm_ende, choice="var",axes=1)+
  theme(axis.text.x = element_text(angle = 90, hjust = 1))

Ver código
# Histograma de correlaciones con los ejes
ggplot(dv_acm_ende, aes(x = reorder(Variable,-Eje1), y = Eje1)) +
  geom_bar(stat = "identity", fill = "steelblue") +
  geom_text(aes(label = round(Eje1, 3)), 
            vjust = -0.5, 
            color = "black", 
            size = 3.5)+
  ylim(c(0,1))+
  labs(title="Correlaciones Eje 1", x="Variables", y="Correlacion")+
  theme(plot.title = element_text(hjust = 0.5, face = "bold"),
        axis.text.x = element_text(angle = 90, hjust = 1))

Ver código
kable(acm_ende[["var"]][["v.test"]][,1], caption = "Valores Test") %>%
  kable_styling(full_width = F) %>%
  scroll_box(width = "800px", height = "500px")
Valores Test
x
RURAL -11.6663044
URBANO 11.6663044
cero 0.8085733
dos_o_mas 5.4966263
uno -3.4479850
BAJO-MEDIO 6.3672853
MEDIO_ALTO -6.3672853
PERSONAL_0 -15.8603599
PERSONAL_1-3 12.9735835
PERSONAL_4-76 6.9150502
PASIVO-LRG-PLAZO_[0 - 1'000.000) 5.9538281
PASIVO-LRG-PLAZO_[1'000.000 - 367'530.000) 9.3934118
PASIVO-LRG-PLAZO_0 -10.8558624
PASIVO-TOTAL_[0 - 1'000.000) 5.7318991
PASIVO-TOTAL_[1'000.000 - 367'530.000) 15.3426442
PASIVO-TOTAL_0 -16.7272972
GAS-OPERACIONALES_[0 - 1'000.000) 5.2648923
GAS-OPERACIONALES_[1'000.000 - 2.351'202.000) 12.8427031
GAS-OPERACIONALES_0 -13.8855875

Valores test,contribución y calidad de representación de las variables con el Eje2:

Ver código
fviz_contrib(acm_ende, choice = "var", axes = 2)+
  theme(axis.text.x = element_text(angle = 90, hjust = 1))

Ver código
fviz_cos2(acm_ende, choice="var",axes=2)+
  theme(axis.text.x = element_text(angle = 90, hjust = 1))

Ver código
# Histograma de correlaciones con los ejes
ggplot(dv_acm_ende, aes(x = reorder(Variable,-Eje2), y = Eje2)) +
  geom_bar(stat = "identity", fill = "steelblue") +
  geom_text(aes(label = round(Eje2, 3)), 
            vjust = -0.5, 
            color = "black", 
            size = 3.5)+
  ylim(c(0,1))+
  labs(title="Correlaciones Eje 2", x="Variables", y="Correlacion")+
  theme(plot.title = element_text(hjust = 0.5, face = "bold"),
        axis.text.x = element_text(angle = 90, hjust = 1))

Ver código
kable(acm_ende[["var"]][["v.test"]][,2], caption = "Valores Test") %>%
  kable_styling(full_width = F) %>%
  scroll_box(width = "800px", height = "500px")
Valores Test
x
RURAL 2.5403346
URBANO -2.5403346
cero 11.6807595
dos_o_mas -7.4966312
uno -6.6924848
BAJO-MEDIO -13.9672886
MEDIO_ALTO 13.9672886
PERSONAL_0 6.9681773
PERSONAL_1-3 -2.2752660
PERSONAL_4-76 -9.4179263
PASIVO-LRG-PLAZO_[0 - 1'000.000) 10.8453871
PASIVO-LRG-PLAZO_[1'000.000 - 367'530.000) 4.0325691
PASIVO-LRG-PLAZO_0 -10.7335053
PASIVO-TOTAL_[0 - 1'000.000) 13.8704615
PASIVO-TOTAL_[1'000.000 - 367'530.000) 1.6510628
PASIVO-TOTAL_0 -8.0521158
GAS-OPERACIONALES_[0 - 1'000.000) 8.2556982
GAS-OPERACIONALES_[1'000.000 - 2.351'202.000) -0.1365172
GAS-OPERACIONALES_0 -2.1250915

Valores test,contribución y calidad de representación de las variables con el Eje3:

Ver código
fviz_contrib(acm_ende, choice = "var", axes = 3)+
  theme(axis.text.x = element_text(angle = 90, hjust = 1))

Ver código
fviz_cos2(acm_ende, choice="var",axes=3)+
  theme(axis.text.x = element_text(angle = 90, hjust = 1))

Ver código
# Histograma de correlaciones con los ejes
ggplot(dv_acm_ende, aes(x = reorder(Variable,-Eje3), y = Eje3)) +
  geom_bar(stat = "identity", fill = "steelblue") +
  geom_text(aes(label = round(Eje3, 3)), 
            vjust = -0.5, 
            color = "black", 
            size = 3.5)+
  ylim(c(0,1))+
  labs(title="Correlaciones Eje 3", x="Variables", y="Correlacion")+
  theme(plot.title = element_text(hjust = 0.5, face = "bold"),
        axis.text.x = element_text(angle = 90, hjust = 1))

Ver código
kable(acm_ende[["var"]][["v.test"]][,3], caption = "Valores Test") %>%
  kable_styling(full_width = F) %>%
  scroll_box(width = "800px", height = "500px")
Valores Test
x
RURAL 2.7733782
URBANO -2.7733782
cero 8.0378414
dos_o_mas -1.9176857
uno -6.2133215
BAJO-MEDIO -8.9669790
MEDIO_ALTO 8.9669790
PERSONAL_0 4.4159357
PERSONAL_1-3 -4.7762590
PERSONAL_4-76 0.2432656
PASIVO-LRG-PLAZO_[0 - 1'000.000) -8.5833468
PASIVO-LRG-PLAZO_[1'000.000 - 367'530.000) 14.3454460
PASIVO-LRG-PLAZO_0 -3.6288985
PASIVO-TOTAL_[0 - 1'000.000) -12.4562263
PASIVO-TOTAL_[1'000.000 - 367'530.000) 6.3417974
PASIVO-TOTAL_0 0.0793832
GAS-OPERACIONALES_[0 - 1'000.000) -7.5287581
GAS-OPERACIONALES_[1'000.000 - 2.351'202.000) 7.8278020
GAS-OPERACIONALES_0 -5.5273757

####Proyección de variables en los Ejes(1,2)

Ver código
fviz_mca_var(acm_ende, axes = c(1, 2),
             choice = "mca.cor", repel = TRUE,
             select.var = list(name = c(colnames(ende))),
             ggtheme = theme_minimal())

####Proyección de variables en los Ejes(1,3)

Ver código
fviz_mca_var(acm_ende, axes = c(1, 3),
             choice = "mca.cor", repel = TRUE,
             select.var = list(name = c(colnames(ende))),
             ggtheme = theme_minimal())

####Proyección de variables en los Ejes(2,3)

Ver código
fviz_mca_var(acm_ende, axes = c(2, 3),
             choice = "mca.cor", repel = TRUE,
             select.var = list(name = c(colnames(ende))),
             ggtheme = theme_minimal())

ACM Inversión

Ver código
inv <- dna %>%
  select(`EMPREN-SOCIAL`,SUBREGION, `DIR-COMERCIAL`, CATEGORIA, `ING-TAM-EMPRESARIAL`, `ACTIVO-CORRIENTE`, PATRIMONIO, `UTIL-NETA`, ACTIV_2019, ACTIV_2020, ACTIV_2021, ACTIV_2022, ACTIV_2023)


# Realizar el ACM
acm_inv <- MCA(inv, graph=FALSE)
Ver código
#Benzecri
s <- 13
l <- acm_inv$eig[acm_inv$eig[,1] > 1/s, 1]
tau <- ( s / (s - 1) )^2 * ( l - (1/s) )^2
ptau <- tau / sum( tau ) * 100
barplot(ptau, col="darkred", ylim = c(0,100))+text(ptau, labels = paste(round(ptau,3),"%"), pos=3)

numeric(0)
Ver código
library(knitr)

kable(round(acm_inv$var$contrib, 2), caption = "Contribuciones de las variables") %>%
   kable_styling(full_width = F) %>%
   scroll_box(width="800px", height="500px")
Contribuciones de las variables
Dim 1 Dim 2 Dim 3 Dim 4 Dim 5
EMPREN-SOCIAL.N 0.00 0.03 0.01 0.00 0.00
S 0.00 0.34 0.09 0.04 0.02
Bosques 0.29 0.13 0.10 0.00 0.05
Embalses 0.10 0.10 0.16 0.00 0.00
Páramo 0.01 0.35 0.41 0.06 0.01
Valle de San Nicolás 0.05 0.01 0.15 0.00 0.01
RURAL 0.36 1.19 0.45 0.00 0.00
URBANO 0.13 0.45 0.17 0.00 0.00
ELABORACION DE PRODUCTOS DE CONSUMO 0.05 0.00 0.04 0.00 0.00
HOTELERÍA Y TURISMO 0.48 0.05 0.07 0.00 0.16
OTROS 0.00 0.07 0.12 0.00 0.21
ING-TAM-EMPRESARIAL_[0 - 1'000.000) 0.66 1.78 0.21 0.00 0.00
ING-TAM-EMPRESARIAL_[1'000.000 - 100'000.000) 0.01 0.83 0.00 0.02 0.01
ING-TAM-EMPRESARIAL_[100'000.000 - 5.720'881.000) 3.21 0.01 0.59 0.16 0.03
ACTIVO-CORRIENTE_[0 - 1'000.000) 0.20 0.26 0.19 0.00 0.03
ACTIVO-CORRIENTE_[1'000.000 - 2'000.000) 2.05 5.05 0.27 1.69 5.85
ACTIVO-CORRIENTE_[10'000.000 - 20'000.000) 2.07 0.01 7.42 8.30 0.16
ACTIVO-CORRIENTE_[2'000.000 - 3'000.000) 1.08 1.59 1.52 0.04 14.83
ACTIVO-CORRIENTE_[20'000.000 - 706'777.000) 13.26 1.10 2.15 1.44 0.15
ACTIVO-CORRIENTE_[3'000.000 - 5'000.000) 0.58 2.55 8.29 4.75 2.26
ACTIVO-CORRIENTE_[5'000.000 - 10'000.000) 0.00 9.61 1.39 6.16 0.11
PATRIMONIO_[0 - 1'000.000) 0.15 0.21 0.19 0.00 0.03
PATRIMONIO_[1'000.000 - 2'000.000) 2.07 4.92 0.37 1.67 5.65
PATRIMONIO_[10'000.000 - 20'000.000) 2.04 0.02 7.01 7.88 0.14
PATRIMONIO_[2'000.000 - 3'000.000) 0.93 1.47 1.67 0.02 13.44
PATRIMONIO_[20'000.000 - 604'967.325) 12.74 1.14 2.28 1.62 0.18
PATRIMONIO_[3'000.000 - 5'000.000) 0.51 2.75 7.75 4.43 2.16
PATRIMONIO_[5'000.000 - 10'000.000) 0.01 8.69 1.38 5.66 0.13
UTIL-NETA_(0 - 186'132.000] 1.55 0.00 0.20 0.03 0.03
UTIL-NETA_[-23'200.000 - 0) 0.00 0.02 0.02 0.02 0.17
UTIL-NETA_0 0.15 0.00 0.02 0.00 0.00
ACTIV_2019_0 0.00 0.00 0.00 0.00 0.00
ACTIV_2020_0 0.00 0.00 0.00 0.00 0.00
ACTIV_2021_[0 - 1'000.000) 0.58 0.91 0.43 0.01 0.00
ACTIV_2021_[1'000.000 - 2'000.000) 1.36 2.54 0.02 0.92 2.09
ACTIV_2021_[10'000.000 - 20'000.000) 3.91 0.00 2.87 4.26 0.04
ACTIV_2021_[2'000.000 - 3'000.000) 0.31 0.21 2.08 0.01 8.04
ACTIV_2021_[20'000.000 - 379'325.000) 9.44 0.67 1.97 1.32 0.14
ACTIV_2021_[3'000.000 - 5'000.000) 0.22 3.49 5.23 2.17 1.58
ACTIV_2021_[5'000.000 - 10'000.000) 0.03 7.25 1.23 3.98 0.11
ACTIV_2022_[0 - 1'000.000) 0.54 1.35 0.40 0.01 0.00
ACTIV_2022_[1'000.000 - 2'000.000) 1.66 3.83 0.17 1.40 4.32
ACTIV_2022_[10'000.000 - 20'000.000) 2.55 0.02 5.88 7.37 0.13
ACTIV_2022_[2'000.000 - 3'000.000) 0.67 0.69 1.99 0.00 11.14
ACTIV_2022_[20'000.000 - 509'312.000) 13.47 0.94 2.46 1.59 0.17
ACTIV_2022_[3'000.000 - 5'000.000) 0.40 2.91 7.38 3.82 2.15
ACTIV_2022_[5'000.000 - 10'000.000) 0.00 9.76 1.29 5.74 0.14
ACTIV_2023_[0 - 1'000.000) 0.22 0.37 0.17 0.01 0.03
ACTIV_2023_[1'000.000 - 2'000.000) 2.24 5.22 0.41 1.72 6.73
ACTIV_2023_[10'000.000 - 20'000.000) 1.68 0.00 7.89 8.70 0.16
ACTIV_2023_[2'000.000 - 3'000.000) 1.15 1.77 1.54 0.04 14.72
ACTIV_2023_[20'000.000 - 938'043.000) 14.20 1.15 1.95 1.29 0.16
ACTIV_2023_[3'000.000 - 5'000.000) 0.60 2.40 8.71 5.05 2.22
ACTIV_2023_[5'000.000 - 10'000.000) 0.01 9.82 1.28 6.57 0.12
Ver código
kable(round(acm_inv$eig, 2), caption = "Valores propios (Eigenvalues)") %>%
   kable_styling(full_width = F) %>%
   scroll_box(width="800px", height="500px")
Valores propios (Eigenvalues)
eigenvalue percentage of variance cumulative percentage of variance
dim 1 0.34 10.93 10.93
dim 2 0.33 10.35 21.28
dim 3 0.31 9.78 31.06
dim 4 0.29 9.31 40.37
dim 5 0.28 8.97 49.34
dim 6 0.24 7.75 57.09
dim 7 0.17 5.27 62.36
dim 8 0.09 2.93 65.29
dim 9 0.09 2.83 68.12
dim 10 0.08 2.58 70.70
dim 11 0.08 2.57 73.27
dim 12 0.08 2.38 75.66
dim 13 0.07 2.33 77.98
dim 14 0.07 2.23 80.22
dim 15 0.06 2.05 82.27
dim 16 0.06 1.98 84.25
dim 17 0.06 1.83 86.08
dim 18 0.05 1.74 87.83
dim 19 0.05 1.62 89.44
dim 20 0.05 1.43 90.87
dim 21 0.04 1.18 92.06
dim 22 0.03 1.06 93.12
dim 23 0.03 1.01 94.13
dim 24 0.02 0.75 94.88
dim 25 0.02 0.58 95.46
dim 26 0.02 0.53 95.98
dim 27 0.02 0.50 96.49
dim 28 0.01 0.47 96.95
dim 29 0.01 0.42 97.37
dim 30 0.01 0.39 97.76
dim 31 0.01 0.34 98.09
dim 32 0.01 0.31 98.40
dim 33 0.01 0.28 98.68
dim 34 0.01 0.26 98.94
dim 35 0.01 0.22 99.15
dim 36 0.01 0.21 99.36
dim 37 0.01 0.18 99.55
dim 38 0.01 0.17 99.72
dim 39 0.00 0.13 99.85
dim 40 0.00 0.08 99.93
dim 41 0.00 0.07 100.00
Ver código
kable(round(acm_inv$var$coord, 2), caption = "Coordenadas de las variables") %>%
   kable_styling(full_width = F) %>%
   scroll_box(width="800px", height="500px")
Coordenadas de las variables
Dim 1 Dim 2 Dim 3 Dim 4 Dim 5
EMPREN-SOCIAL.N 0.00 -0.04 -0.02 -0.01 -0.01
S -0.01 0.43 0.21 0.14 0.09
Bosques -0.60 0.39 0.32 -0.04 0.21
Embalses -0.19 -0.18 0.23 0.01 0.04
Páramo 0.10 0.53 0.55 0.20 0.10
Valle de San Nicolás 0.05 -0.03 -0.09 -0.01 -0.02
RURAL -0.24 0.43 -0.26 -0.01 -0.02
URBANO 0.09 -0.16 0.10 0.00 0.01
ELABORACION DE PRODUCTOS DE CONSUMO -0.05 0.00 -0.04 0.00 0.00
HOTELERÍA Y TURISMO 0.48 -0.15 0.17 -0.01 0.25
OTROS -0.04 0.20 0.25 0.01 -0.31
ING-TAM-EMPRESARIAL_[0 - 1'000.000) -0.31 0.50 -0.17 0.00 0.02
ING-TAM-EMPRESARIAL_[1'000.000 - 100'000.000) -0.02 -0.24 0.01 -0.04 -0.02
ING-TAM-EMPRESARIAL_[100'000.000 - 5.720'881.000) 1.32 -0.05 0.53 0.27 0.11
ACTIVO-CORRIENTE_[0 - 1'000.000) -0.31 0.34 -0.28 0.02 -0.11
ACTIVO-CORRIENTE_[1'000.000 - 2'000.000) -0.69 1.05 -0.24 0.58 -1.05
ACTIVO-CORRIENTE_[10'000.000 - 20'000.000) 0.75 0.05 -1.35 -1.39 0.19
ACTIVO-CORRIENTE_[2'000.000 - 3'000.000) -0.56 0.67 0.63 0.10 1.90
ACTIVO-CORRIENTE_[20'000.000 - 706'777.000) 3.09 0.87 1.18 0.94 -0.30
ACTIVO-CORRIENTE_[3'000.000 - 5'000.000) -0.42 -0.85 1.48 -1.09 -0.74
ACTIVO-CORRIENTE_[5'000.000 - 10'000.000) -0.02 -1.50 -0.56 1.14 0.15
PATRIMONIO_[0 - 1'000.000) -0.21 0.24 -0.22 0.02 -0.08
PATRIMONIO_[1'000.000 - 2'000.000) -0.74 1.11 -0.30 0.62 -1.11
PATRIMONIO_[10'000.000 - 20'000.000) 0.78 0.07 -1.36 -1.41 0.18
PATRIMONIO_[2'000.000 - 3'000.000) -0.53 0.64 0.67 0.08 1.82
PATRIMONIO_[20'000.000 - 604'967.325) 3.11 0.90 1.24 1.03 -0.34
PATRIMONIO_[3'000.000 - 5'000.000) -0.39 -0.89 1.45 -1.07 -0.73
PATRIMONIO_[5'000.000 - 10'000.000) -0.04 -1.46 -0.56 1.12 0.16
UTIL-NETA_(0 - 186'132.000] 0.89 0.04 0.30 0.11 -0.12
UTIL-NETA_[-23'200.000 - 0) -0.24 -0.47 0.44 0.49 1.35
UTIL-NETA_0 -0.08 0.00 -0.03 -0.01 0.01
ACTIV_2019_0 0.00 0.00 0.00 0.00 0.00
ACTIV_2020_0 0.00 0.00 0.00 0.00 0.00
ACTIV_2021_[0 - 1'000.000) -0.24 0.29 -0.19 -0.03 -0.02
ACTIV_2021_[1'000.000 - 2'000.000) -0.70 0.93 -0.08 0.53 -0.79
ACTIV_2021_[10'000.000 - 20'000.000) 1.33 -0.03 -1.08 -1.28 0.12
ACTIV_2021_[2'000.000 - 3'000.000) -0.40 0.32 0.98 -0.05 1.84
ACTIV_2021_[20'000.000 - 379'325.000) 3.64 0.94 1.57 1.26 -0.40
ACTIV_2021_[3'000.000 - 5'000.000) -0.32 -1.24 1.48 -0.93 -0.78
ACTIV_2021_[5'000.000 - 10'000.000) 0.12 -1.68 -0.67 1.18 0.19
ACTIV_2022_[0 - 1'000.000) -0.29 0.44 -0.23 -0.04 0.01
ACTIV_2022_[1'000.000 - 2'000.000) -0.71 1.05 -0.22 0.60 -1.04
ACTIV_2022_[10'000.000 - 20'000.000) 0.99 -0.07 -1.41 -1.54 0.20
ACTIV_2022_[2'000.000 - 3'000.000) -0.52 0.51 0.85 0.01 1.92
ACTIV_2022_[20'000.000 - 509'312.000) 3.46 0.89 1.40 1.10 -0.35
ACTIV_2022_[3'000.000 - 5'000.000) -0.38 -0.99 1.54 -1.08 -0.80
ACTIV_2022_[5'000.000 - 10'000.000) 0.02 -1.63 -0.58 1.19 0.18
ACTIV_2023_[0 - 1'000.000) -0.36 0.45 -0.30 -0.08 -0.11
ACTIV_2023_[1'000.000 - 2'000.000) -0.74 1.10 -0.30 0.60 -1.16
ACTIV_2023_[10'000.000 - 20'000.000) 0.68 0.02 -1.40 -1.43 0.19
ACTIV_2023_[2'000.000 - 3'000.000) -0.57 0.69 0.62 0.10 1.85
ACTIV_2023_[20'000.000 - 938'043.000) 2.93 0.81 1.03 0.82 -0.28
ACTIV_2023_[3'000.000 - 5'000.000) -0.42 -0.82 1.53 -1.13 -0.74
ACTIV_2023_[5'000.000 - 10'000.000) -0.05 -1.46 -0.51 1.13 0.15
Ver código
dv_acm_inv <- data.frame(Variable = rownames(acm_inv$var$eta2), 
                     Eje1 = acm_inv$var$eta2[,1],
                     Eje2 = acm_inv$var$eta2[,2],
                     Eje3 = acm_inv$var$eta2[,3],
                     Eje4 = acm_inv$var$eta2[,4],
                     Eje5 = acm_inv$var$eta2[5])

Valores test,contribución y calidad de representación de las variables con el Eje1:

Ver código
fviz_contrib(acm_inv, choice = "var", axes = 1)+
  theme(axis.text.x = element_text(angle = 90, hjust = 1))

Ver código
fviz_cos2(acm_inv, choice="var",axes=1)+
  theme(axis.text.x = element_text(angle = 90, hjust = 1))
Warning: Removed 2 rows containing missing values or values outside the scale range
(`geom_bar()`).

Ver código
# Histograma de correlaciones con los ejes
ggplot(dv_acm_inv, aes(x = reorder(Variable,-Eje1), y = Eje1)) +
  geom_bar(stat = "identity", fill = "steelblue") +
  geom_text(aes(label = round(Eje1, 3)), 
            vjust = -0.5, 
            color = "black", 
            size = 3.5)+
  ylim(c(0,1))+
  labs(title="Correlaciones Eje 1", x="Variables", y="Correlacion")+
  theme(plot.title = element_text(hjust = 0.5, face = "bold"),
        axis.text.x = element_text(angle = 90, hjust = 1))

Ver código
kable(acm_inv[["var"]][["v.test"]][,1], caption = "Valores Test") %>%
  kable_styling(full_width = F) %>%
  scroll_box(width = "800px", height = "500px")
Valores Test
x
EMPREN-SOCIAL.N 0.1018646
S -0.1018646
Bosques -2.8470681
Embalses -1.7324342
Páramo 0.5667170
Valle de San Nicolás 2.3880016
RURAL -3.6049331
URBANO 3.6049331
ELABORACION DE PRODUCTOS DE CONSUMO -2.7233821
HOTELERÍA Y TURISMO 3.7687182
OTROS -0.2775456
ING-TAM-EMPRESARIAL_[0 - 1'000.000) -5.0190221
ING-TAM-EMPRESARIAL_[1'000.000 - 100'000.000) -0.7055347
ING-TAM-EMPRESARIAL_[100'000.000 - 5.720'881.000) 9.6464646
ACTIVO-CORRIENTE_[0 - 1'000.000) -2.4529676
ACTIVO-CORRIENTE_[1'000.000 - 2'000.000) -8.2104683
ACTIVO-CORRIENTE_[10'000.000 - 20'000.000) 8.1170098
ACTIVO-CORRIENTE_[2'000.000 - 3'000.000) -5.8088094
ACTIVO-CORRIENTE_[20'000.000 - 706'777.000) 19.3881284
ACTIVO-CORRIENTE_[3'000.000 - 5'000.000) -4.2803129
ACTIVO-CORRIENTE_[5'000.000 - 10'000.000) -0.2508306
PATRIMONIO_[0 - 1'000.000) -2.1798001
PATRIMONIO_[1'000.000 - 2'000.000) -8.1294851
PATRIMONIO_[10'000.000 - 20'000.000) 7.9928963
PATRIMONIO_[2'000.000 - 3'000.000) -5.3876625
PATRIMONIO_[20'000.000 - 604'967.325) 18.9697070
PATRIMONIO_[3'000.000 - 5'000.000) -4.0058610
PATRIMONIO_[5'000.000 - 10'000.000) -0.4411748
UTIL-NETA_(0 - 186'132.000] 6.7245524
UTIL-NETA_[-23'200.000 - 0) -0.3381413
UTIL-NETA_0 -6.5429210
ACTIV_2019_0 NaN
ACTIV_2020_0 NaN
ACTIV_2021_[0 - 1'000.000) -5.3082587
ACTIV_2021_[1'000.000 - 2'000.000) -6.4154449
ACTIV_2021_[10'000.000 - 20'000.000) 10.7384435
ACTIV_2021_[2'000.000 - 3'000.000) -2.9998320
ACTIV_2021_[20'000.000 - 379'325.000) 16.0975240
ACTIV_2021_[3'000.000 - 5'000.000) -2.5240769
ACTIV_2021_[5'000.000 - 10'000.000) 0.9831042
ACTIV_2022_[0 - 1'000.000) -4.5275213
ACTIV_2022_[1'000.000 - 2'000.000) -7.1813243
ACTIV_2022_[10'000.000 - 20'000.000) 8.7710491
ACTIV_2022_[2'000.000 - 3'000.000) -4.4666235
ACTIV_2022_[20'000.000 - 509'312.000) 19.4185522
ACTIV_2022_[3'000.000 - 5'000.000) -3.4968763
ACTIV_2022_[5'000.000 - 10'000.000) 0.2245327
ACTIV_2023_[0 - 1'000.000) -2.5429438
ACTIV_2023_[1'000.000 - 2'000.000) -8.5431937
ACTIV_2023_[10'000.000 - 20'000.000) 7.3004341
ACTIV_2023_[2'000.000 - 3'000.000) -6.0154957
ACTIV_2023_[20'000.000 - 938'043.000) 20.1862143
ACTIV_2023_[3'000.000 - 5'000.000) -4.3334137
ACTIV_2023_[5'000.000 - 10'000.000) -0.6184558

Valores test,contribución y calidad de representación de las variables con el Eje2:

Ver código
fviz_contrib(acm_inv, choice = "var", axes = 2)+
  theme(axis.text.x = element_text(angle = 90, hjust = 1))

Ver código
fviz_cos2(acm_inv, choice="var",axes=2)+
  theme(axis.text.x = element_text(angle = 90, hjust = 1))
Warning: Removed 2 rows containing missing values or values outside the scale range
(`geom_bar()`).

Ver código
# Histograma de correlaciones con los ejes
ggplot(dv_acm_inv, aes(x = reorder(Variable,-Eje2), y = Eje2)) +
  geom_bar(stat = "identity", fill = "steelblue") +
  geom_text(aes(label = round(Eje2, 3)), 
            vjust = -0.5, 
            color = "black", 
            size = 3.5)+
  ylim(c(0,1))+
  labs(title="Correlaciones Eje 2", x="Variables", y="Correlacion")+
  theme(plot.title = element_text(hjust = 0.5, face = "bold"),
        axis.text.x = element_text(angle = 90, hjust = 1))

Ver código
kable(acm_inv[["var"]][["v.test"]][,2], caption = "Valores Test") %>%
  kable_styling(full_width = F) %>%
  scroll_box(width = "800px", height = "500px")
Valores Test
x
EMPREN-SOCIAL.N -3.0493090
S 3.0493090
Bosques 1.8434052
Embalses -1.6922186
Páramo 3.0594470
Valle de San Nicolás -1.1674462
RURAL 6.4087728
URBANO -6.4087728
ELABORACION DE PRODUCTOS DE CONSUMO -0.1253168
HOTELERÍA Y TURISMO -1.1397191
OTROS 1.4228043
ING-TAM-EMPRESARIAL_[0 - 1'000.000) 8.0176103
ING-TAM-EMPRESARIAL_[1'000.000 - 100'000.000) -7.3559167
ING-TAM-EMPRESARIAL_[100'000.000 - 5.720'881.000) -0.3898221
ACTIVO-CORRIENTE_[0 - 1'000.000) 2.7000602
ACTIVO-CORRIENTE_[1'000.000 - 2'000.000) 12.5562836
ACTIVO-CORRIENTE_[10'000.000 - 20'000.000) 0.4842187
ACTIVO-CORRIENTE_[2'000.000 - 3'000.000) 6.8643469
ACTIVO-CORRIENTE_[20'000.000 - 706'777.000) 5.4330799
ACTIVO-CORRIENTE_[3'000.000 - 5'000.000) -8.6971421
ACTIVO-CORRIENTE_[5'000.000 - 10'000.000) -17.1679158
PATRIMONIO_[0 - 1'000.000) 2.4661341
PATRIMONIO_[1'000.000 - 2'000.000) 12.2046044
PATRIMONIO_[10'000.000 - 20'000.000) 0.7258893
PATRIMONIO_[2'000.000 - 3'000.000) 6.5901778
PATRIMONIO_[20'000.000 - 604'967.325) 5.5123844
PATRIMONIO_[3'000.000 - 5'000.000) -9.0063582
PATRIMONIO_[5'000.000 - 10'000.000) -16.2648929
UTIL-NETA_(0 - 186'132.000] 0.3188771
UTIL-NETA_[-23'200.000 - 0) -0.6647736
UTIL-NETA_0 -0.1795411
ACTIV_2019_0 NaN
ACTIV_2020_0 NaN
ACTIV_2021_[0 - 1'000.000) 6.4426381
ACTIV_2021_[1'000.000 - 2'000.000) 8.5386859
ACTIV_2021_[10'000.000 - 20'000.000) -0.2341884
ACTIV_2021_[2'000.000 - 3'000.000) 2.4104525
ACTIV_2021_[20'000.000 - 379'325.000) 4.1740457
ACTIV_2021_[3'000.000 - 5'000.000) -9.8572440
ACTIV_2021_[5'000.000 - 10'000.000) -14.3129253
ACTIV_2022_[0 - 1'000.000) 6.9344062
ACTIV_2022_[1'000.000 - 2'000.000) 10.6180797
ACTIV_2022_[10'000.000 - 20'000.000) -0.6653121
ACTIV_2022_[2'000.000 - 3'000.000) 4.4231790
ACTIV_2022_[20'000.000 - 509'312.000) 4.9882127
ACTIV_2022_[3'000.000 - 5'000.000) -9.1371874
ACTIV_2022_[5'000.000 - 10'000.000) -17.0425199
ACTIV_2023_[0 - 1'000.000) 3.1738189
ACTIV_2023_[1'000.000 - 2'000.000) 12.6787929
ACTIV_2023_[10'000.000 - 20'000.000) 0.2173972
ACTIV_2023_[2'000.000 - 3'000.000) 7.2701515
ACTIV_2023_[20'000.000 - 938'043.000) 5.5979114
ACTIV_2023_[3'000.000 - 5'000.000) -8.4300628
ACTIV_2023_[5'000.000 - 10'000.000) -17.5236693

Valores test,contribución y calidad de representación de las variables con el Eje3:

Ver código
fviz_contrib(acm_inv, choice = "var", axes = 3)+
  theme(axis.text.x = element_text(angle = 90, hjust = 1))

Ver código
fviz_cos2(acm_inv, choice="var",axes=3)+
  theme(axis.text.x = element_text(angle = 90, hjust = 1))
Warning: Removed 2 rows containing missing values or values outside the scale range
(`geom_bar()`).

Ver código
# Histograma de correlaciones con los ejes
ggplot(dv_acm_inv, aes(x = reorder(Variable,-Eje3), y = Eje3)) +
  geom_bar(stat = "identity", fill = "steelblue") +
  geom_text(aes(label = round(Eje3, 3)), 
            vjust = -0.5, 
            color = "black", 
            size = 3.5)+
  ylim(c(0,1))+
  labs(title="Correlaciones Eje 3", x="Variables", y="Correlacion")+
  theme(plot.title = element_text(hjust = 0.5, face = "bold"),
        axis.text.x = element_text(angle = 90, hjust = 1))

Ver código
kable(acm_inv[["var"]][["v.test"]][,3], caption = "Valores Test") %>%
  kable_styling(full_width = F) %>%
  scroll_box(width = "800px", height = "500px")
Valores Test
x
EMPREN-SOCIAL.N -1.4839022
S 1.4839022
Bosques 1.5464462
Embalses 2.0761508
Páramo 3.1986815
Valle de San Nicolás -4.1342265
RURAL -3.8171437
URBANO 3.8171437
ELABORACION DE PRODUCTOS DE CONSUMO -2.3034424
HOTELERÍA Y TURISMO 1.3547021
OTROS 1.7690395
ING-TAM-EMPRESARIAL_[0 - 1'000.000) -2.6788722
ING-TAM-EMPRESARIAL_[1'000.000 - 100'000.000) 0.3309632
ING-TAM-EMPRESARIAL_[100'000.000 - 5.720'881.000) 3.8959804
ACTIVO-CORRIENTE_[0 - 1'000.000) -2.2476809
ACTIVO-CORRIENTE_[1'000.000 - 2'000.000) -2.8189842
ACTIVO-CORRIENTE_[10'000.000 - 20'000.000) -14.5183558
ACTIVO-CORRIENTE_[2'000.000 - 3'000.000) 6.5172845
ACTIVO-CORRIENTE_[20'000.000 - 706'777.000) 7.3872407
ACTIVO-CORRIENTE_[3'000.000 - 5'000.000) 15.2440505
ACTIVO-CORRIENTE_[5'000.000 - 10'000.000) -6.3500344
PATRIMONIO_[0 - 1'000.000) -2.2939142
PATRIMONIO_[1'000.000 - 2'000.000) -3.2640929
PATRIMONIO_[10'000.000 - 20'000.000) -14.0183177
PATRIMONIO_[2'000.000 - 3'000.000) 6.8325732
PATRIMONIO_[20'000.000 - 604'967.325) 7.5836085
PATRIMONIO_[3'000.000 - 5'000.000) 14.7039198
PATRIMONIO_[5'000.000 - 10'000.000) -6.2905552
UTIL-NETA_(0 - 186'132.000] 2.2571087
UTIL-NETA_[-23'200.000 - 0) 0.6228789
UTIL-NETA_0 -2.3445261
ACTIV_2019_0 NaN
ACTIV_2020_0 NaN
ACTIV_2021_[0 - 1'000.000) -4.2933695
ACTIV_2021_[1'000.000 - 2'000.000) -0.6971729
ACTIV_2021_[10'000.000 - 20'000.000) -8.7027664
ACTIV_2021_[2'000.000 - 3'000.000) 7.3559233
ACTIV_2021_[20'000.000 - 379'325.000) 6.9588349
ACTIV_2021_[3'000.000 - 5'000.000) 11.7271548
ACTIV_2021_[5'000.000 - 10'000.000) -5.7272423
ACTIV_2022_[0 - 1'000.000) -3.6654099
ACTIV_2022_[1'000.000 - 2'000.000) -2.1879638
ACTIV_2022_[10'000.000 - 20'000.000) -12.5829452
ACTIV_2022_[2'000.000 - 3'000.000) 7.2940846
ACTIV_2022_[20'000.000 - 509'312.000) 7.8402073
ACTIV_2022_[3'000.000 - 5'000.000) 14.1575135
ACTIV_2022_[5'000.000 - 10'000.000) -6.0338194
ACTIV_2023_[0 - 1'000.000) -2.0860808
ACTIV_2023_[1'000.000 - 2'000.000) -3.4483472
ACTIV_2023_[10'000.000 - 20'000.000) -14.9597017
ACTIV_2023_[2'000.000 - 3'000.000) 6.5967472
ACTIV_2023_[20'000.000 - 938'043.000) 7.0817309
ACTIV_2023_[3'000.000 - 5'000.000) 15.6071418
ACTIV_2023_[5'000.000 - 10'000.000) -6.1388541

Valores test,contribución y calidad de representación de las variables con el Eje4:

Ver código
fviz_contrib(acm_inv, choice = "var", axes = 4)+
  theme(axis.text.x = element_text(angle = 90, hjust = 1))

Ver código
fviz_cos2(acm_inv, choice="var",axes=4)+
  theme(axis.text.x = element_text(angle = 90, hjust = 1))
Warning: Removed 2 rows containing missing values or values outside the scale range
(`geom_bar()`).

Ver código
# Histograma de correlaciones con los ejes
ggplot(dv_acm_inv, aes(x = reorder(Variable,-Eje4), y = Eje4)) +
  geom_bar(stat = "identity", fill = "steelblue") +
  geom_text(aes(label = round(Eje4, 3)), 
            vjust = -0.5, 
            color = "black", 
            size = 3.5)+
  ylim(c(0,1))+
  labs(title="Correlaciones Eje 4", x="Variables", y="Correlacion")+
  theme(plot.title = element_text(hjust = 0.5, face = "bold"),
        axis.text.x = element_text(angle = 90, hjust = 1))

Ver código
kable(acm_inv[["var"]][["v.test"]][,4], caption = "Valores Test") %>%
  kable_styling(full_width = F) %>%
  scroll_box(width = "800px", height = "500px")
Valores Test
x
EMPREN-SOCIAL.N -1.0212458
S 1.0212458
Bosques -0.2012439
Embalses 0.0563783
Páramo 1.1607908
Valle de San Nicolás -0.5902291
RURAL -0.0747335
URBANO 0.0747335
ELABORACION DE PRODUCTOS DE CONSUMO -0.0248060
HOTELERÍA Y TURISMO -0.0461147
OTROS 0.0854146
ING-TAM-EMPRESARIAL_[0 - 1'000.000) -0.0009110
ING-TAM-EMPRESARIAL_[1'000.000 - 100'000.000) -1.1296826
ING-TAM-EMPRESARIAL_[100'000.000 - 5.720'881.000) 2.0017304
ACTIVO-CORRIENTE_[0 - 1'000.000) 0.1890511
ACTIVO-CORRIENTE_[1'000.000 - 2'000.000) 6.8871921
ACTIVO-CORRIENTE_[10'000.000 - 20'000.000) -14.9841548
ACTIVO-CORRIENTE_[2'000.000 - 3'000.000) 1.0055286
ACTIVO-CORRIENTE_[20'000.000 - 706'777.000) 5.8896127
ACTIVO-CORRIENTE_[3'000.000 - 5'000.000) -11.2583270
ACTIVO-CORRIENTE_[5'000.000 - 10'000.000) 13.0473011
PATRIMONIO_[0 - 1'000.000) 0.1802507
PATRIMONIO_[1'000.000 - 2'000.000) 6.7518752
PATRIMONIO_[10'000.000 - 20'000.000) -14.5040428
PATRIMONIO_[2'000.000 - 3'000.000) 0.7782930
PATRIMONIO_[20'000.000 - 604'967.325) 6.2516304
PATRIMONIO_[3'000.000 - 5'000.000) -10.8448944
PATRIMONIO_[5'000.000 - 10'000.000) 12.4471410
UTIL-NETA_(0 - 186'132.000] 0.8374651
UTIL-NETA_[-23'200.000 - 0) 0.6925365
UTIL-NETA_0 -0.9628789
ACTIV_2019_0 NaN
ACTIV_2020_0 NaN
ACTIV_2021_[0 - 1'000.000) -0.6997614
ACTIV_2021_[1'000.000 - 2'000.000) 4.8711092
ACTIV_2021_[10'000.000 - 20'000.000) -10.3534395
ACTIV_2021_[2'000.000 - 3'000.000) -0.3976550
ACTIV_2021_[20'000.000 - 379'325.000) 5.5563302
ACTIV_2021_[3'000.000 - 5'000.000) -7.3658906
ACTIV_2021_[5'000.000 - 10'000.000) 10.0599816
ACTIV_2022_[0 - 1'000.000) -0.6463244
ACTIV_2022_[1'000.000 - 2'000.000) 6.0857722
ACTIV_2022_[10'000.000 - 20'000.000) -13.7488118
ACTIV_2022_[2'000.000 - 3'000.000) 0.0844056
ACTIV_2022_[20'000.000 - 509'312.000) 6.1548144
ACTIV_2022_[3'000.000 - 5'000.000) -9.9453677
ACTIV_2022_[5'000.000 - 10'000.000) 12.3990258
ACTIV_2023_[0 - 1'000.000) -0.5665378
ACTIV_2023_[1'000.000 - 2'000.000) 6.9108538
ACTIV_2023_[10'000.000 - 20'000.000) -15.3269912
ACTIV_2023_[2'000.000 - 3'000.000) 1.0789625
ACTIV_2023_[20'000.000 - 938'043.000) 5.6207841
ACTIV_2023_[3'000.000 - 5'000.000) -11.5938771
ACTIV_2023_[5'000.000 - 10'000.000) 13.5975050

####Proyección de variables en los Ejes(1,2)

Ver código
fviz_mca_var(acm_inv, axes = c(1, 2),
             choice = "mca.cor", repel = TRUE,
             select.var = list(name = c(colnames(inv))),
             ggtheme = theme_minimal())

####Proyección de variables en los Ejes(1,3)

Ver código
fviz_mca_var(acm_inv, axes = c(1, 3),
             choice = "mca.cor", repel = TRUE,
             select.var = list(name = c(colnames(inv))),
             ggtheme = theme_minimal())

####Proyección de variables en los Ejes(1,4)

Ver código
fviz_mca_var(acm_inv, axes = c(1, 4),
             choice = "mca.cor", repel = TRUE,
             select.var = list(name = c(colnames(inv))),
             ggtheme = theme_minimal())

####Proyección de variables en los Ejes(2,3)

Ver código
fviz_mca_var(acm_inv, axes = c(2, 3),
             choice = "mca.cor", repel = TRUE,
             select.var = list(name = c(colnames(inv))),
             ggtheme = theme_minimal())

####Proyección de variables en los Ejes(2,4)

Ver código
fviz_mca_var(acm_inv, axes = c(2, 4),
             choice = "mca.cor", repel = TRUE,
             select.var = list(name = c(colnames(inv))),
             ggtheme = theme_minimal())

####Proyección de variables en los Ejes(3,4)

Ver código
fviz_mca_var(acm_inv, axes = c(3, 4),
             choice = "mca.cor", repel = TRUE,
             select.var = list(name = c(colnames(inv))),
             ggtheme = theme_minimal())

Conclusiones

  • El sector alimenticio predominante en el conjunto de datos son las panaderías y restaurantes, adicionalmente el municipio con más cantidad de emprendedores individuales es rionegro. Esto indica que existe una alta demanda de productos alimenticios en la región.
  • Los emprendedores individuales cuentan en promedio con 1 empleado y un patrimonio de 7,8 millones de pesos. Además de tener un bajo nivel de endeudamiento, con un pasivo total promedio de 1,5 millones de pesos.
  • Las empresas son rentables, con una utilidad neta promedio de 1,6 millones de pesos.

Bibliografía

Cámara de Comercio de Bogotá (s/f). Registro Único de Proponentes - RUP. Org.co. Recuperado el 10 de marzo de 2024, de https://www.ccb.org.co

Cámara de Comercio del Oriente Antioqueño. (2023). Base de datos empresas que se dedican a procesar alimentos CCOA Data set. https://www.datos.gov.co/Estad-sticas-Nacionales/Base-de-datos-empresas-que-se-dedican-a-procesar-a/ffwh-mgaw/about_data

Economipedia, la mayor plataforma de educación financiera. (2023, mayo 11). Economipedia. https://economipedia.com

Finanzas y contabilidad. (s/f). Finanzas y contabilidad. Recuperado el 10 de marzo de 2024, de https://finanzascontabilidad.com

Inicio. (2023, noviembre 14). Camara de Comercio del Oriente Antioqueño; Cámara de Comercio del Oriente Antioqueño. https://ccoa.org.co

Jorge A. Rivera Godoy, D. R. A. (2006). Análisis del desempeño financiero de empresas innovadoras del Sector Alimentos y Bebidas en Colombia. scielo.org.co. http://scielo.org.co/pdf/pege/n31/n31a07.pdf

Osorio, E. M. (s/f). DIAGNÓSTICO DEL ESTADO ACTUAL DE LAS AGROINDUSTRIAS Y EMPRENDIMIENTOS DEL MUNICIPIO DE SONSÓN. Edu.co. Recuperado marzo de 2024, de https://bibliotecadigital.udea.edu.co/bitstream/10495/19687/5/MosqueraEliana_2021_Diagn%C3%B3sticoAgroindustriasEmprendedores.pdf

Suarez, J. (s/f). Gerencie.com. Gerencie sus asuntos y negocios. Gerencie.com. Recuperado el 10 de marzo de 2024, de https://www.gerencie.com

Alcalde, R. H. A. (s/f). Plan de Desarrollo 2020-2023. Gov.co. Recuperado el 10 de marzo de 2024, de https://rionegro.gov.co/wp-content/uploads/2020/10/Plan-de-Desarrollo-2020-2023.pdf