El presente análisis tiene como objetivo identificar patrones de desarrollo y similitudes entre países a partir de indicadores económicos y de entorno empresarial del año 2008, obtenidos de la base de datos del Banco Mundial.
A través del Análisis de Componentes Principales (ACP) se busca reducir la dimensionalidad de la información y resumir las variables más relevantes que explican la variabilidad entre naciones. Posteriormente, se aplica el método de clusterización de Ward para agrupar los países con características similares.
Esta combinación metodológica permite visualizar de manera clara cómo se diferencian los países según su nivel de competitividad, eficiencia institucional y desempeño económico, ofreciendo una herramienta útil para el análisis comparativo y el diseño de políticas públicas orientadas al desarrollo.
Fue elegido ya que en el año 2008 fue un periodo clave en la historia económica mundial debido a la crisis financiera global que afectó a empresas, bancos y mercados de casi todos los países. Este contexto lo convierte en un año relevante para el estudio de los negocios, ya que marcó un punto de inflexión en la manera en que las organizaciones manejan sus finanzas, gestionan riesgos y toman decisiones estratégicas. Analizar este año permite comprender cómo los negocios enfrentaron una de las crisis más significativas del siglo XXI y cómo surgieron nuevas oportunidades de innovación y adaptación empresarial.
X1: Gestión de permisos de construcción: Coste (% del valor del almacén) - Puntuación Evalúa la eficiencia en los costos para obtener permisos de construcción. En 2008, los costos de inversión eran críticos; los países con costos bajos favorecían la reactivación económica y la inversión privada.
X2: Trámites de permisos de construcción: Procedimientos (número) Mide cuántos trámites se requieren para construir legalmente. En tiempos de crisis, menos trámites implican menor carga burocrática y mayor incentivo para nuevos proyectos.
X3: Trámites de permisos de construcción: Procedimientos (número) - Puntuación. Puntuación normalizada de eficiencia administrativa. Refleja qué tan simplificado era el entorno regulatorio, algo clave para promover empleo e inversión tras el colapso financiero.
X4: Trámites de permisos de construcción: Tiempo (días) Días necesarios para completar los permisos de construcción. Un proceso más rápido favorecía la recuperación económica al permitir que nuevas obras e infraestructuras se iniciaran sin demoras.
X5: Trámites de permisos de construcción: Tiempo (días) - Puntuación Puntuación basada en la rapidez del trámite. Cuanto mayor la puntuación, más ágil el entorno para invertir en construcción y desarrollo urbano.
X6: Cumplimiento de contratos (metodología DB04-15) - Puntuación Evalúa la eficiencia judicial para hacer cumplir los contratos. En 2008, la confianza en las instituciones era vital. Países con sistemas judiciales sólidos inspiraban seguridad a inversionistas y empresas.
X7: Ejecución de contratos: Costo (% de la reclamación) Costo de resolver una disputa contractual en porcentaje del valor del reclamo. Durante la crisis, altos costos legales podían desincentivar el comercio o la inversión extranjera.
X8:Cumplimiento de contratos: Coste (% de la reclamación) - Puntuación Versión estandarizada del costo anterior. Un país con buena puntuación mostraba que proteger los derechos contractuales no era excesivamente costoso.
X9: Ejecución de contratos: Procedimientos (número) Número de pasos necesarios para resolver una disputa. La agilidad en los tribunales fue esencial para mantener la actividad empresarial durante un año de quiebras y conflictos financieros.
X10: Ejecución de contratos: Procedimientos (número) - Puntuación Mide la eficiencia procesal. Países con buena puntuación ofrecían entornos más estables para las transacciones comerciales.
X11: Cumplimiento de contratos: Tiempo (días) Tiempo total para resolver una disputa comercial. En 2008, tiempos judiciales largos significaban mayor riesgo y menos confianza para invertir o financiar.
X12: Cumplimiento de contratos: Tiempo (días) - Puntuación Puntuación que resume la rapidez judicial. Una justicia más rápida era una señal de resiliencia institucional en medio de la crisis.
X13: Obtención de crédito (metodología DB05-14) - Puntuación Mide la facilidad general para acceder al crédito. En 2008, el crédito se contrajo drásticamente; países con buen puntaje resistieron mejor el impacto financiero.
X14: Obtención de la puntuación total de crédito (metodología DB05-14) Valor compuesto que combina derechos legales y cobertura crediticia. Indicador clave para entender qué países mantuvieron liquidez y acceso a financiamiento en plena crisis.
X15: Obtención de crédito: Cobertura de las agencias de crédito (% de adultos) Porcentaje de población cubierta por agencias de crédito privadas La transparencia crediticia ayudó a sostener los préstamos en un momento de desconfianza bancaria.
X16: Obtención de crédito: Cobertura del registro de crédito (% de adultos) Porcentaje cubierto por registros públicos de crédito. Los registros amplios facilitaron el control del riesgo financiero tras el colapso de muchas instituciones.
X17: Obtención de crédito:Índice de profundidad de la información crediticia (0-6) (metodología DB05-14) Evalúa la cantidad y calidad de datos sobre historial crediticio. En 2008, una mayor transparencia crediticia redujo el riesgo y fortaleció la confianza de los inversionistas.
X18: Obtención de crédito: Índice de profundidad de la información crediticia (0- 6) (metodología DB05-14) - Puntuación Versión estandarizada del indicador anterior. Una buena puntuación reflejaba sistemas financieros más resilientes ante la crisis.
X19: Obtención de crédito:Índice de fortaleza de los derechos legales (0-10) (Metodología DB05-14) Evalúa la protección de los derechos de prestamistas y prestatarios. Países con leyes sólidas en materia crediticia enfrentaron menores pérdidas y recuperaron más rápido el crédito.
X20: Obtención de crédito: Índice de solidez de los derechos legales (0-10) (metodología DB05-14) - Puntuación Puntuación ajustada del indicador anterior. Representa qué tan confiable era el marco legal en medio del colapso financiero.
X21: Pago de impuestos: Impuesto sobre las ganancias (% de las ganancias) Porcentaje de utilidades que se destinan a impuestos. En 2008, los impuestos altos reducían la capacidad de reinversión de las empresas durante la crisis.
X22: Pago de impuestos: Tiempo (horas por año) Horas que una empresa invierte en cumplir con las obligaciones tributarias. Un sistema tributario más simple liberaba recursos en un periodo de contracción económica.
X23: Tramitación de permisos de construcción (metodología DB06-15) Índice general que combina los factores de costo, tiempo y procedimientos. Resume la eficiencia del entorno regulatorio para construir en plena crisis.
X24: Gestión de permisos de construcción: Coste (% del valor del almacén) Porcentaje del valor de la obra destinado a trámites administrativos. Refleja la carga financiera que afectaba la inversión en infraestructura en un año de recesión global.
El estudio se desarrolló en varias etapas con el fin de analizar la estructura y relación entre los indicadores económicos de distintos países para el año 2008.
En primer lugar, se construyó una base de datos con 24 variables cuantitativas (denominadas X1 a X24) que describen distintos aspectos del entorno económico y empresarial de cada país. Los datos fueron normalizados para garantizar la comparabilidad entre variables medidas en diferentes escalas.
Posteriormente, se aplicó un Análisis de Componentes Principales (ACP), técnica estadística que permite reducir la dimensionalidad del conjunto de variables transformándolas en un número menor de componentes no correlacionados. Estos componentes concentran la mayor parte de la varianza total y facilitan la interpretación de los patrones subyacentes.
Con base en las coordenadas factoriales obtenidas del ACP, se realizó una clusterización jerárquica utilizando el método de Ward, el cual agrupa los países de forma que minimiza la variabilidad dentro de cada grupo y maximiza las diferencias entre ellos. El número óptimo de clusters se determinó mediante los criterios del codo (WSS) y silhouette.
Finalmente, se caracterizaron los grupos formados analizando los promedios de las variables originales dentro de cada cluster, lo que permitió identificar similitudes y diferencias estructurales entre los países en términos de desarrollo económico e institucional.
Se realizó un análisis descriptivo de las 24 variables cuantitativas. Los resultados muestran que algunas variables presentan mayor dispersión, lo cual sugiere diferencias significativas entre países.
library(DT)
descriptivos <- datos %>% select(-Pais)
datatable(
descriptivos,
options = list(
scrollX = TRUE,
pageLength = 10,
autoWidth = TRUE
),
caption = htmltools::tags$caption(
style = "caption-side: top; text-align: center;
font-size:18px; font-weight:bold;",
"Estadísticos descriptivos de las variables"
)
) %>%
formatStyle(
columns = names(descriptivos),
backgroundColor = "#ffe6f2"
)
datos %>%
pivot_longer(cols = starts_with("X"), names_to = "Variable", values_to = "Valor") %>%
ggplot(aes(x = Valor)) +
geom_histogram(bins = 20, fill = "#FFB6C1", color = "white") +
facet_wrap(~ Variable, scales = "free") +
labs(title = "Distribución de las variables cuantitativas",
x = "Valor", y = "Frecuencia") +
theme_minimal()
las variables del entorno empresarial (tiempos, costos, procedimientos) presenten distribuciones asimétricas, debido a que: Hay países con procesos muy eficientes (valores pequeños) Otros con procesos mucho más extensos o costosos (valores grandes).
Esto genera histogramas con colas largas hacia la derecha, lo que sugiere la existencia de valores atípicos o países con condiciones extremas; También se observa que las escalas varían entre variables.
En conclusión , no todas las variables siguen una distribución normal, y existen diferencias marcadas entre países en varios indicadores del entorno de negocios.
paleta_rosada <- colorRampPalette(c("#ffe6f2", "#ff99cc", "#ff4fa3", "#cc0077"))
datos %>%
pivot_longer(cols = starts_with("X"), names_to = "Variable", values_to = "Valor") %>%
ggplot(aes(x = Variable, y = Valor, fill = Variable)) +
geom_boxplot(show.legend = FALSE) +
scale_fill_manual(values = paleta_rosada(length(unique(datos %>% select(starts_with("X")))))) +
theme_minimal() +
theme(axis.text.x = element_text(angle = 45, hjust = 1)) +
labs(title = "Distribución (boxplot) de las variables cuantitativas",
x = "Variable", y = "Valor")
Se observa que algunas variables (como las relacionadas con tiempos y costos, posiblemente X4, X6, X10, X14…) presentan cajas altas y con varios outliers, lo que evidencia una alta heterogeneidad entre países.
Otras variables tienen rango más pequeño, indicando comportamientos más homogéneos.
En general, los boxplots confirman asimetrías y diferencias notables en los indicadores de facilidad para hacer negocios.
La matriz de correlaciones nos muestra que varias de las variables cuantitativas están fuertemente correlacionadas entre sí, lo que indica redundancia en la información. Por ejemplo, si algunos indicadores miden aspectos similares del entorno empresarial (como número de procedimientos, tiempo y costos para abrir un negocio), estas correlaciones justifican la aplicación del ACP, ya que el objetivo es reducir la dimensionalidad conservando la mayor parte de la información posible.
country_col <- "Nombre del país"
vars <- paste0("X", 1:24)
# Crear data frame con solo las variables numéricas
datos <- df %>%
select(all_of(vars)) %>%
mutate(across(everything(), as.numeric))
cor_matrix <- cor(datos, use = "pairwise.complete.obs")
cor_matrix %>%
round(2) %>%
kable(format = "html",
caption = "Matriz de Correlaciones",
align = "c") %>%
kable_styling(
full_width = FALSE,
bootstrap_options = c("striped", "hover", "condensed"),
font_size = 12
) %>%
row_spec(
0,
background = "#ffb3d9",
bold = TRUE,
color = "white"
)
| X1 | X2 | X3 | X4 | X5 | X6 | X7 | X8 | X9 | X10 | X11 | X12 | X13 | X14 | X15 | X16 | X17 | X18 | X19 | X20 | X21 | X22 | X23 | X24 | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| X1 | 1.00 | -0.10 | 0.11 | -0.11 | 0.14 | 0.26 | -0.25 | 0.30 | -0.10 | 0.10 | -0.12 | 0.12 | 0.38 | 0.38 | 0.23 | 0.14 | 0.33 | 0.33 | 0.27 | 0.27 | 0.07 | -0.09 | 0.76 | -0.67 |
| X2 | -0.10 | 1.00 | -1.00 | 0.23 | -0.26 | 0.03 | -0.10 | 0.11 | 0.07 | -0.07 | -0.03 | 0.02 | -0.02 | -0.02 | -0.04 | 0.04 | 0.06 | 0.06 | -0.09 | -0.09 | -0.10 | 0.10 | -0.56 | 0.13 |
| X3 | 0.11 | -1.00 | 1.00 | -0.24 | 0.26 | -0.03 | 0.10 | -0.11 | -0.07 | 0.07 | 0.03 | -0.02 | 0.02 | 0.02 | 0.05 | -0.05 | -0.06 | -0.06 | 0.09 | 0.09 | 0.11 | -0.10 | 0.56 | -0.13 |
| X4 | -0.11 | 0.23 | -0.24 | 1.00 | -0.93 | -0.10 | 0.08 | -0.08 | -0.01 | 0.01 | 0.11 | -0.11 | -0.03 | -0.03 | -0.02 | 0.10 | -0.04 | -0.04 | 0.00 | 0.00 | -0.17 | 0.23 | -0.59 | 0.00 |
| X5 | 0.14 | -0.26 | 0.26 | -0.93 | 1.00 | 0.11 | -0.06 | 0.05 | 0.02 | -0.02 | -0.16 | 0.17 | 0.04 | 0.04 | -0.01 | -0.17 | -0.01 | -0.01 | 0.08 | 0.08 | 0.17 | -0.28 | 0.65 | -0.02 |
| X6 | 0.26 | 0.03 | -0.03 | -0.10 | 0.11 | 1.00 | -0.60 | 0.61 | -0.67 | 0.67 | -0.72 | 0.72 | 0.46 | 0.46 | 0.34 | 0.14 | 0.37 | 0.37 | 0.35 | 0.35 | -0.18 | -0.11 | 0.21 | -0.29 |
| X7 | -0.25 | -0.10 | 0.10 | 0.08 | -0.06 | -0.60 | 1.00 | -0.94 | 0.15 | -0.15 | 0.16 | -0.13 | -0.28 | -0.28 | -0.21 | -0.18 | -0.31 | -0.31 | -0.13 | -0.13 | 0.21 | 0.12 | -0.15 | 0.14 |
| X8 | 0.30 | 0.11 | -0.11 | -0.08 | 0.05 | 0.61 | -0.94 | 1.00 | -0.11 | 0.12 | -0.15 | 0.14 | 0.30 | 0.30 | 0.23 | 0.20 | 0.33 | 0.33 | 0.14 | 0.14 | -0.18 | -0.11 | 0.18 | -0.17 |
| X9 | -0.10 | 0.07 | -0.07 | -0.01 | 0.02 | -0.67 | 0.15 | -0.11 | 1.00 | -1.00 | 0.27 | -0.26 | -0.40 | -0.40 | -0.38 | -0.08 | -0.33 | -0.33 | -0.30 | -0.30 | 0.06 | 0.05 | -0.08 | 0.12 |
| X10 | 0.10 | -0.07 | 0.07 | 0.01 | -0.02 | 0.67 | -0.15 | 0.12 | -1.00 | 1.00 | -0.27 | 0.26 | 0.40 | 0.40 | 0.38 | 0.07 | 0.33 | 0.33 | 0.30 | 0.30 | -0.06 | -0.05 | 0.08 | -0.12 |
| X11 | -0.12 | -0.03 | 0.03 | 0.11 | -0.16 | -0.72 | 0.16 | -0.15 | 0.27 | -0.27 | 1.00 | -0.98 | -0.25 | -0.25 | -0.10 | -0.02 | -0.12 | -0.12 | -0.27 | -0.27 | 0.13 | 0.06 | -0.14 | 0.30 |
| X12 | 0.12 | 0.02 | -0.02 | -0.11 | 0.17 | 0.72 | -0.13 | 0.14 | -0.26 | 0.26 | -0.98 | 1.00 | 0.24 | 0.24 | 0.09 | 0.01 | 0.10 | 0.10 | 0.27 | 0.27 | -0.13 | -0.05 | 0.15 | -0.28 |
| X13 | 0.38 | -0.02 | 0.02 | -0.03 | 0.04 | 0.46 | -0.28 | 0.30 | -0.40 | 0.40 | -0.25 | 0.24 | 1.00 | 1.00 | 0.63 | 0.21 | 0.78 | 0.78 | 0.79 | 0.79 | -0.06 | -0.16 | 0.28 | -0.30 |
| X14 | 0.38 | -0.02 | 0.02 | -0.03 | 0.04 | 0.46 | -0.28 | 0.30 | -0.40 | 0.40 | -0.25 | 0.24 | 1.00 | 1.00 | 0.63 | 0.21 | 0.78 | 0.78 | 0.79 | 0.79 | -0.06 | -0.16 | 0.28 | -0.30 |
| X15 | 0.23 | -0.04 | 0.05 | -0.02 | -0.01 | 0.34 | -0.21 | 0.23 | -0.38 | 0.38 | -0.10 | 0.09 | 0.63 | 0.63 | 1.00 | 0.00 | 0.70 | 0.70 | 0.28 | 0.28 | 0.05 | -0.08 | 0.16 | -0.16 |
| X16 | 0.14 | 0.04 | -0.05 | 0.10 | -0.17 | 0.14 | -0.18 | 0.20 | -0.08 | 0.07 | -0.02 | 0.01 | 0.21 | 0.21 | 0.00 | 1.00 | 0.38 | 0.38 | -0.06 | -0.06 | -0.12 | 0.10 | 0.00 | -0.12 |
| X17 | 0.33 | 0.06 | -0.06 | -0.04 | -0.01 | 0.37 | -0.31 | 0.33 | -0.33 | 0.33 | -0.12 | 0.10 | 0.78 | 0.78 | 0.70 | 0.38 | 1.00 | 1.00 | 0.23 | 0.23 | -0.07 | -0.02 | 0.19 | -0.25 |
| X18 | 0.33 | 0.06 | -0.06 | -0.04 | -0.01 | 0.37 | -0.31 | 0.33 | -0.33 | 0.33 | -0.12 | 0.10 | 0.78 | 0.78 | 0.70 | 0.38 | 1.00 | 1.00 | 0.23 | 0.23 | -0.07 | -0.02 | 0.19 | -0.25 |
| X19 | 0.27 | -0.09 | 0.09 | 0.00 | 0.08 | 0.35 | -0.13 | 0.14 | -0.30 | 0.30 | -0.27 | 0.27 | 0.79 | 0.79 | 0.28 | -0.06 | 0.23 | 0.23 | 1.00 | 1.00 | -0.02 | -0.24 | 0.24 | -0.22 |
| X20 | 0.27 | -0.09 | 0.09 | 0.00 | 0.08 | 0.35 | -0.13 | 0.14 | -0.30 | 0.30 | -0.27 | 0.27 | 0.79 | 0.79 | 0.28 | -0.06 | 0.23 | 0.23 | 1.00 | 1.00 | -0.02 | -0.24 | 0.24 | -0.22 |
| X21 | 0.07 | -0.10 | 0.11 | -0.17 | 0.17 | -0.18 | 0.21 | -0.18 | 0.06 | -0.06 | 0.13 | -0.13 | -0.06 | -0.06 | 0.05 | -0.12 | -0.07 | -0.07 | -0.02 | -0.02 | 1.00 | -0.02 | 0.17 | -0.13 |
| X22 | -0.09 | 0.10 | -0.10 | 0.23 | -0.28 | -0.11 | 0.12 | -0.11 | 0.05 | -0.05 | 0.06 | -0.05 | -0.16 | -0.16 | -0.08 | 0.10 | -0.02 | -0.02 | -0.24 | -0.24 | -0.02 | 1.00 | -0.23 | -0.03 |
| X23 | 0.76 | -0.56 | 0.56 | -0.59 | 0.65 | 0.21 | -0.15 | 0.18 | -0.08 | 0.08 | -0.14 | 0.15 | 0.28 | 0.28 | 0.16 | 0.00 | 0.19 | 0.19 | 0.24 | 0.24 | 0.17 | -0.23 | 1.00 | -0.49 |
| X24 | -0.67 | 0.13 | -0.13 | 0.00 | -0.02 | -0.29 | 0.14 | -0.17 | 0.12 | -0.12 | 0.30 | -0.28 | -0.30 | -0.30 | -0.16 | -0.12 | -0.25 | -0.25 | -0.22 | -0.22 | -0.13 | -0.03 | -0.49 | 1.00 |
# Visualización de la matriz de correlaciones
#paleta rosada
paleta_contraste <- colorRampPalette(c("#ffd6e7", "#ff8ebf", "#ff4fa3", "#cc0066"))
# Graficar la matriz de correlación
corrplot(cor_matrix,
method = "color",
type = "upper",
col = paleta_contraste(200),
addgrid.col = "white", # bordes blancos
tl.col = "black",
tl.cex = 0.7,
cl.cex = 0.8,
title = "Matriz de correlación entre variables",
mar = c(0, 0, 2, 0))
En la gráfica podemos observar que los primeros siete componentes explican aproximadamente el 82,27 % de la varianza total de los datos. Esto significa que la mayoría de la información contenida en las 24 variables originales puede resumirse en siete componentes principales, reduciendo así la complejidad del análisis sin perder información relevante.
En particular: El primer componente (PC1) concentra el 29,15 % de la varianza total, lo que indica que existe una dimensión dominante que resume gran parte de las diferencias entre países.
El segundo componente (PC2) agrega un 14,02 %, complementando al primero y ofreciendo una segunda perspectiva de variación.
A partir del tercer componente (PC3) la ganancia de varianza comienza a ser menor, lo que sugiere que los dos o tres primeros componentes son los más relevantes para la interpretación inicial.
pca_result <- prcomp(datos, scale. = TRUE)
var_exp <- pca_result$sdev^2 / sum(pca_result$sdev^2)
var_exp_df <- data.frame(
Componente = paste0("PC", 1:length(var_exp)),
Varianza_Explicada = round(var_exp * 100, 2),
Varianza_Acumulada = round(cumsum(var_exp) * 100, 2)
)
var_exp_df %>%
gt() %>%
tab_header(
title = "Varianza Explicada por Componente"
) %>%
data_color(
columns = c(Varianza_Explicada, Varianza_Acumulada),
colors = scales::col_numeric(
palette = c("#f7fbff", "#FFB6C1"),
domain = c(0, max(var_exp_df$Varianza_Acumulada))
)
) %>%
tab_options(table.font.size = px(14))
| Varianza Explicada por Componente | ||
| Componente | Varianza_Explicada | Varianza_Acumulada |
|---|---|---|
| PC1 | 29.15 | 29.15 |
| PC2 | 14.02 | 43.17 |
| PC3 | 10.16 | 53.33 |
| PC4 | 9.07 | 62.40 |
| PC5 | 7.30 | 69.70 |
| PC6 | 6.67 | 76.38 |
| PC7 | 5.89 | 82.27 |
| PC8 | 4.79 | 87.06 |
| PC9 | 3.62 | 90.68 |
| PC10 | 3.23 | 93.91 |
| PC11 | 3.17 | 97.08 |
| PC12 | 1.31 | 98.39 |
| PC13 | 1.04 | 99.43 |
| PC14 | 0.27 | 99.70 |
| PC15 | 0.23 | 99.93 |
| PC16 | 0.06 | 99.99 |
| PC17 | 0.01 | 100.00 |
| PC18 | 0.00 | 100.00 |
| PC19 | 0.00 | 100.00 |
| PC20 | 0.00 | 100.00 |
| PC21 | 0.00 | 100.00 |
| PC22 | 0.00 | 100.00 |
| PC23 | 0.00 | 100.00 |
| PC24 | 0.00 | 100.00 |
# Gráfico de varianza explicada
fviz_eig(
pca_result,
addlabels = TRUE,
ylim = c(0, 50),
barfill = "#FFB6C1",
barcolor = "white"
) +
ggtitle("Varianza explicada por los Componentes Principales") +
theme_minimal() +
theme(plot.title = element_text(hjust = 0.5))
fviz_pca_biplot(
pca_result,
repel = TRUE,
col.var = "contrib",
gradient.cols = c("#32CD32", "#3399FF", "#FF69B4"),
col.ind = "gray50",
alpha.ind = 0.8,
label = "var",
arrowsize = 1.1,
pointshape = 19,
title = "Biplot del Análisis de Componentes Principales (ACP)"
) +
theme_minimal() +
theme(
plot.title = element_text(hjust = 0.5, face = "bold", size = 14),
legend.position = "right",
panel.grid = element_line(color = "gray90"),
axis.text = element_text(size = 10),
axis.title = element_text(size = 11)
)
PC1 probablemente está asociado a variables que representan la eficiencia del entorno empresarial, como:
tiempo y número de procedimientos para abrir un negocio costos administrativos facilidad para obtener permisos o registrar propiedades.
Los países con puntuaciones altas en este componente se caracterizan por un ambiente más ágil y eficiente para hacer negocios.
PC2 podría estar más vinculado con indicadores de financiamiento, impuestos o comercio exterior, reflejando aspectos del acceso al crédito o facilidad para pagar impuestos y realizar operaciones internacionales.
En conjunto, los dos primeros componentes permiten representar los datos en un plano bidimensional (biplot), donde los países más próximos entre sí comparten características similares en su entorno empresarial.
contrib <- get_pca_var(pca_result)$contrib
cat("\nTop 10 variables que más aportan al Componente 1:\n")
##
## Top 10 variables que más aportan al Componente 1:
print(head(contrib[order(-contrib[,1]), 1, drop = FALSE], 10))
## Dim.1
## X13 11.509746
## X14 11.509746
## X6 8.251988
## X18 7.807088
## X17 7.807088
## X19 6.397883
## X20 6.397883
## X15 5.846646
## X9 4.837204
## X10 4.831138
# Contribución al Componente 1
fviz_contrib(
pca_result,
choice = "var",
axes = 1,
top = 10,
fill = "#FFB6C1",
color = "white"
) +
labs(title = "Contribución de variables al Componente 1") +
theme_minimal() +
theme(
plot.title = element_text(hjust = 0.5),
axis.text.x = element_text(angle = 45, hjust = 1)
)
El Componente 1 (PC1) explica el 29,15 % de la varianza total. estas variables están asociadas con los procesos administrativos y regulatorios, como:
el tiempo y costo para obtener permisos de construcción.
la facilidad para registrar propiedades.
la protección a los inversionistas y la resolución de contratos.
las barreras regulatorias generales al hacer negocios.
Por lo tanto, el PC1 puede interpretarse como un eje de “eficiencia y entorno regulatorio”. Los países con valores altos en PC1 tienden a poseer entornos empresariales más favorables, con menor carga burocrática y mejores condiciones legales para la actividad económica. En cambio, los países con valores bajos presentan mayores obstáculos administrativos o procesos más lentos y costosos.
cat("\nTop 10 variables que más aportan al Componente 2:\n")
##
## Top 10 variables que más aportan al Componente 2:
print(head(contrib[order(-contrib[,2]), 2, drop = FALSE], 10))
## Dim.2
## X23 19.087632
## X5 16.362426
## X3 15.343414
## X2 15.281251
## X4 13.985855
## X21 2.912770
## X1 2.627699
## X22 2.339849
## X17 1.970736
## X18 1.970736
# Contribución al Componente 2
fviz_contrib(
pca_result,
choice = "var",
axes = 2,
top = 10,
fill = "#FFB6C1",
color = "white"
) +
labs(title = "Contribución de variables al Componente 2") +
theme_minimal() +
theme(
plot.title = element_text(hjust = 0.5),
axis.text.x = element_text(angle = 45, hjust = 1)
)
El Componente 2 (PC2) explica el 14,02 % adicional Estas variables están relacionarse con aspectos económicos y financieros, como:
acceso al crédito y financiamiento.
pago de impuestos.
comercio exterior (importaciones y exportaciones),
costos de transacción o infraestructura empresarial.
Por ello, el PC2 representa un eje de “entorno financiero y comercial”, que diferencia a los países según:
la facilidad para acceder a capital o realizar operaciones internacionales, y la eficiencia de sus sistemas tributarios y financieros. Los países con valores altos en PC2 suelen tener mercados financieros más desarrollados y regulaciones favorables para la inversión y el comercio, mientras que los de valores bajos podrían enfrentar mayores restricciones financieras o costos fiscales elevados.
#componentes principales del ACP
scores_pca <- as.data.frame(pca_result$x)
#primeros componentes que explican la mayor parte de la varianza.
scores_pca_sel <- scores_pca[, 1:6]
#matriz de distancias
distancias <- dist(scores_pca_sel, method = "euclidean")
#mEtodo jerárquico de Ward
modelo_ward <- hclust(distancias, method = "ward")
# dendrograma completo
plot(modelo_ward, labels = FALSE, hang = -1, main = "Dendrograma - Método de Ward", xlab = "Países", ylab = "Distancia")
fviz_nbclust(scores_pca_sel, FUN = hcut, method = "wss") +
labs(title = "Número óptimo de clusters (Método del Codo)")
fviz_nbclust(scores_pca_sel, FUN = hcut, method = "silhouette") +
labs(title = "Número óptimo de clusters (Método del Silhouette)")
Al analizar los gráficos del método del codo (WSS) y del índice de silhouette, se observó un punto de estabilidad alrededor de tres grupos (k = 3), lo que justifica dividir los países en tres segmentos principales de acuerdo con sus características.
# Cortar el dendrograma según k
k <- 3
grupos <- cutree(modelo_ward, k = k)
# Visualizar los clusters en el dendrograma
dend <- as.dendrogram(modelo_ward)
dend_colored <- color_branches(dend, k = k)
plot(dend_colored, main = paste("Dendrograma con", k, "clusters (Ward)"))
rect.hclust(modelo_ward, k = k, border = 2:(k+1))
El dendrograma permitió identificar tres grupos bien diferenciados, confirmando que los países tienden a agruparse según su nivel de eficiencia regulatoria y financiera. En el gráfico de dispersión (PCA + Ward) se observan tres segmentos claramente separados:
Grupo 1 (azul): países con condiciones más favorables para hacer negocios.
Grupo 2 (naranja): países con desempeño intermedio.
Grupo 3 (verde): países con mayores restricciones y procesos administrativos más complejos.
df_clusters <- df %>%
mutate(Cluster = grupos)
resumen_clusters <- df_clusters %>%
group_by(Cluster) %>%
summarise(across(starts_with("X"), mean, na.rm = TRUE))
resumen_clusters_redondo <- resumen_clusters %>%
mutate(across(starts_with("X"), ~round(.x, 2)))
resumen_clusters_redondo %>%
kable(
format = "html",
caption = "Promedio de cada variable por Cluster",
align = "c",
escape = FALSE
) %>%
kable_styling(
bootstrap_options = c("striped", "hover", "condensed"),
full_width = FALSE,
font_size = 10
) %>%
row_spec(0, bold = TRUE, background = "#FFB6C1")
| Cluster | X23 | X24 | X1 | X2 | X3 | X4 | X5 | X6 | X7 | X8 | X9 | X10 | X11 | X12 | X13 | X14 | X15 | X16 | X17 | X18 | X19 | X20 | X21 | X22 |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 1 | 53.34 | 23.51 | 46.56 | 14.92 | 60.30 | 189.43 | 53.17 | 45.06 | 48.71 | 51.10 | 41.23 | 36.91 | 794.45 | 47.18 | 19.81 | 3.17 | 0.10 | 1.33 | 0.06 | 0.94 | 3.11 | 31.13 | 19.02 | 311.16 |
| 2 | 57.64 | 5.89 | 74.16 | 17.25 | 51.21 | 222.34 | 47.56 | 57.94 | 28.75 | 67.95 | 38.42 | 45.57 | 605.86 | 60.29 | 53.64 | 8.58 | 19.99 | 7.82 | 2.78 | 46.34 | 5.80 | 58.02 | 15.76 | 282.18 |
| 3 | 75.81 | 2.04 | 89.82 | 12.08 | 71.69 | 144.23 | 65.93 | 73.20 | 23.44 | 73.75 | 30.46 | 70.43 | 420.04 | 75.41 | 76.20 | 12.19 | 59.87 | 4.24 | 4.81 | 80.13 | 7.38 | 73.85 | 18.14 | 187.52 |
cluster 1: entornos empresariales más favorables: Presenta valores moderados en indicadores como X1, X6, X7 y X10, junto con costos administrativos más bajos (X24 = 32.1). Tienden a tener menores tiempos y costos para realizar trámites, mejor acceso al crédito y procedimientos más eficientes.
cluster 2: Países con desempeño intermedio: Muestra valores más altos en variables como X1 (80.9), X6 (62.7) y X8 (70.3), lo que indica procesos más largos o costosos, aunque compensados por cierta eficiencia en variables regulatorias (X4 = 194). Son países en transición hacia un entorno más competitivo.
cluster 3: Entornos menos eficientes o con mayores barreras: Presenta valores elevados en costos y tiempos (por ejemplo X1 = 70.9, X4 = 199) y costos administrativos más altos que el Cluster 1, aunque menores que el Cluster 2 en algunas dimensiones. Refleja países con procesos burocráticos, mayor número de procedimientos y obstáculos regulatorios.
fviz_cluster(
list(data = scores_pca_sel, cluster = grupos),
geom = "point",
ellipse.type = "norm",
main = paste("Segmentación de países - Método de Ward (k =", k, ")"),
palette = c("#FF69B4", "#3399FF", "#32CD32"), # rosa, azul y verde más vivos
repel = TRUE,
pointsize = 3,
show.clust.cent = TRUE
) +
theme_minimal() +
theme(
plot.title = element_text(hjust = 0.5, face = "bold"),
panel.grid = element_line(color = "gray90")
)
El método de Ward permitió identificar tres tipologías de países con base en su desempeño en los indicadores de facilidad para hacer negocios. El análisis refleja un gradiente de eficiencia que va desde entornos altamente competitivos hasta economías con limitaciones institucionales. Estos resultados pueden servir para:
Priorizar políticas de mejora regulatoria.
Comparar desempeño regional.
Orientar estrategias de inversión o desarrollo económico.
tabla_clusters <- df_clusters %>%
select(`Nombre del país`, Cluster) %>%
arrange(Cluster)
#Paleta rosada
num_clusters <- length(unique(tabla_clusters$Cluster))
colores_rosados <- scales::seq_gradient_pal("#ffe6f2", "#ff66b3", "Lab")(seq(0, 1, length.out = num_clusters))
datatable(
tabla_clusters,
rownames = FALSE,
caption = htmltools::tags$caption(
style = "caption-side: top; text-align: center;
font-size:18px; font-weight:bold;",
"Países agrupados por cluster"
),
options = list(
pageLength = 15,
scrollX = TRUE,
autoWidth = TRUE,
class = 'compact stripe hover'
)
) %>%
formatStyle(
"Cluster",
backgroundColor = styleEqual(
unique(tabla_clusters$Cluster),
colores_rosados # colores generados automáticamente
),
fontWeight = "bold"
)
El análisis realizado sobre nuestra base de datos para el año 2008 permitió comprender de manera integral las diferencias estructurales que existen entre los países en términos de facilidad para hacer negocios, a partir de indicadores que reflejan eficiencia regulatoria, agilidad administrativa, solidez judicial y acceso al crédito. Este año resulta particularmente relevante debido a la crisis financiera global, que puso a prueba la capacidad institucional y económica de los países, situación que se refleja claramente en los resultados obtenidos.
En primer lugar, el análisis descriptivo evidenció una heterogeneidad marcada entre países. Las distribuciones de muchas variables mostraron asimetrías hacia la derecha, indicando que, aunque algunos países presentan procesos muy eficientes (bajos tiempos, menores costos y menos procedimientos) otros enfrentan trámites largos, costosos y con una gran cantidad de pasos administrativos. Los boxplots confirmaron la presencia de valores atípicos y altos niveles de dispersión, lo que refleja realidades institucionales muy distintas. Esto sugiere que, incluso dentro de un mismo indicador, los países no comparten patrones homogéneos de eficiencia regulatoria.
A partir de estas diferencias, se justificó la aplicación del Análisis de Componentes Principales (ACP). Los resultados mostraron que las 24 variables originales pueden reducirse a un conjunto de componentes que explican más del 82 % de la variabilidad total, destacando especialmente los dos primeros. El Componente 1 se interpretó como un eje de eficiencia regulatoria y administrativa, concentrando información relacionada con tiempos, costos y procedimientos asociados a permisos y cumplimiento de contratos. Por su parte, el Componente 2 se relacionó con un entorno financiero y comercial, reflejando factores como acceso al crédito, cobertura de agencias de información y carga tributaria. Esto permitió sintetizar dimensiones clave que caracterizan el desempeño institucional de los países, facilitando la interpretación y comparación entre ellos.
Con base en estos componentes, la clusterización mediante el método de Ward permitió identificar tres grandes grupos de países con comportamientos similares. El primer grupo reúne economías con entornos empresariales altamente favorables, caracterizadas por menores tiempos, costos administrativos y mejores sistemas judiciales y crediticios. El segundo grupo corresponde a países con desempeño intermedio, donde existen avances regulatorios, pero aún persisten barreras estructurales importantes. El tercer grupo agrupa países con condiciones menos eficientes, donde predominan trámites extensos, mayores costos, tiempos judiciales prolongados y menor acceso a financiamiento. Esta segmentación confirma la existencia de brechas significativas entre países en términos de competitividad institucional.
En conjunto, el estudio muestra que la facilidad para hacer negocios en 2008 no fue uniforme entre los países, y que estas diferencias están estrechamente vinculadas con la capacidad de respuesta de cada nación ante un contexto de crisis económica global. Las economías con mejores indicadores regulatorios y financieros pudieron adaptarse más rápido y mantener un entorno relativamente estable para la actividad empresarial, mientras que aquellas con mayores barreras administrativas enfrentaron mayores dificultades para impulsar la recuperación económica.
Finalmente, los resultados obtenidos no solo permiten clasificar países según su desempeño, sino que también ofrecen información valiosa para la formulación de políticas públicas. Los países con menores niveles de eficiencia regulatoria requieren reformas orientadas a simplificar procedimientos, mejorar la calidad institucional y fortalecer su sistema financiero. Asimismo, el análisis proporciona una herramienta para inversionistas y gobiernos interesados en identificar oportunidades, riesgos y áreas prioritarias de intervención.
Este estudio evidencia cómo los factores institucionales, regulatorios y financieros determinan significativamente la facilidad para hacer negocios y cómo estos elementos se relacionan con la resiliencia económica de los países. El uso conjunto del análisis descriptivo, el ACP y la clusterización permitió construir una visión completa y profunda de las dinámicas internacionales en un año crítico como 2008, y resalta la importancia de promover entornos empresariales sólidos como base para el desarrollo económico sostenible.