Este trabajo tiene como objetivo construir un modelo de scoring crediticio para evaluar el perfil financiero de empresas del sector construcción. El propósito es estimar el nivel de riesgo de incumplimiento de cada empresa y, con base en esa información, facilitar decisiones como otorgar o no un crédito, asignar montos o definir condiciones de financiamiento. Para ello, se utilizó una base de datos que contiene información financiera de 20 empresas constructoras observadas durante el periodo 2020 a 2024. En total se recopilaron 100 registros, uno por empresa y por año, lo que permite observar cómo ha variado su situación financiera en el tiempo.
El modelo elegido fue la regresión logística ordinal generalizada. Este tipo de modelo se utiliza cuando la variable que queremos predecir no es numérica continua, sino categórica con un orden definido. Es decir, las posibles categorías tienen un orden lógico o jerárquico, como por ejemplo: bajo, medio y alto, o en este caso: A, B, C, D y E. En este trabajo, se asignaron a las empresas cinco niveles de riesgo crediticio: • A: muy bajo riesgo • B: bajo riesgo • C: riesgo medio • D: alto riesgo • E: muy alto riesgo
Estas categorías se definieron con base en un puntaje financiero agregado, el cual resume el desempeño de cada empresa en distintas variables financieras. Luego se aplicó una segmentación estadística que dividió el conjunto de empresas en cinco grupos iguales (quintiles), y a cada grupo se le asignó una letra, desde A hasta E, de mejor a peor perfil. Este modelo es adecuado porque permite capturar la estructura ordinal de la variable objetivo, es decir, tener en cuenta que las categorías no son simplemente diferentes, sino que tienen un orden natural entre sí. Por ejemplo, estar en la categoría B es mejor que estar en C, y peor que estar en A. Este tipo de modelos también permite estimar la probabilidad de que una empresa esté en una categoría específica o en una mejor o peor. Además, este enfoque tiene la ventaja de ser más interpretable que otros modelos más complejos como los árboles de decisión o redes neuronales. En el contexto financiero, donde se requieren explicaciones claras y justificables para tomar decisiones, la interpretabilidad es una característica muy valiosa.
Inicialmente se seleccionaron ocho variables financieras clave por su relevancia en el análisis del riesgo de crédito. Estas variables permiten evaluar la capacidad de una empresa para cumplir con sus obligaciones, generar ingresos sostenibles y mantener una estructura financiera equilibrada. A continuación, se presenta cada variable, su significado y su importancia.
1. Endeudamiento (pasivo total / activo total) Mide el grado de apalancamiento financiero de la empresa. Un nivel alto indica que la empresa depende en gran medida del endeudamiento para operar. Esto representa un mayor riesgo, ya que puede tener dificultades para responder a sus compromisos si sus ingresos se ven afectados.
2. ROE (rentabilidad sobre el patrimonio) Mide cuánta utilidad genera la empresa por cada peso de capital aportado por los accionistas. Un ROE alto refleja eficiencia en el uso del capital y suele asociarse con empresas más rentables y estables, lo que reduce el riesgo de crédito.
3. Razón corriente (activos corrientes / pasivos corrientes) Evalúa la liquidez de la empresa, es decir, su capacidad para cubrir sus deudas de corto plazo. Una razón corriente baja sugiere problemas de liquidez, lo que podría llevar a un incumplimiento aun cuando la empresa sea rentable en el largo plazo.
4. Margen neto (utilidad neta / ventas) Representa la rentabilidad final de la empresa, después de todos los gastos e impuestos. Un margen neto bajo o negativo indica poca eficiencia financiera y reduce la capacidad de la empresa para hacer frente a sus obligaciones.
5. Margen EBITDA (EBITDA / ventas) Mide la rentabilidad operativa del negocio antes de intereses, impuestos, depreciaciones y amortizaciones. Al centrarse en la operación pura, permite identificar si el negocio es realmente rentable, independientemente de factores contables o financieros.
6. Margen operativo (utilidad operativa / ventas) Indica qué parte de las ventas se convierte en utilidad operativa. Si este margen es bajo, implica que la empresa tiene problemas para generar valor desde su actividad principal, lo que incrementa su riesgo.
7. Margen bruto (utilidad bruta / ventas) Mide cuánto queda de las ventas después de cubrir los costos directos. Es útil para evaluar la eficiencia en la gestión de costos. Un margen bruto bajo puede reflejar debilidad estructural o baja competitividad.
8. Cobertura de intereses (EBIT / gastos financieros) Mide cuántas veces la empresa puede cubrir sus intereses con sus utilidades operativas. Una cobertura baja o negativa es una señal clara de riesgo financiero, ya que indica que la empresa podría no ser capaz de pagar ni siquiera los intereses de su deuda.
Para que todas las variables pudieran compararse en la misma escala, se estandarizaron. Esto significa que fueron transformadas para tener una media de cero y una desviación estándar de uno. Estandarizar permite evitar que variables con valores más grandes influyan desproporcionadamente en el resultado del modelo. Finalmente, se construyó un score financiero agregado, que es un puntaje general para cada empresa calculado como la suma de sus variables estandarizadas.
Aunque inicialmente se incluyeron ocho variables financieras, se decidió reducir el modelo a cuatro variables clave. Esta decisión respondió a razones estadísticas, prácticas y analíticas. Por un lado, al tener una muestra de 100 observaciones, incluir un número elevado de variables puede hacer que el modelo se sobreajuste o se vuelva inestable, dificultando la interpretación y reduciendo su capacidad predictiva. Por eso se buscó un modelo más compacto, que mantuviera solidez y claridad. Por otro lado, se aplicaron dos criterios para seleccionar las variables más representativas:
1. Relevancia financiera, es decir, su importancia teórica y práctica como indicadores del perfil de riesgo de una empresa.
2. Comportamiento dentro del modelo, evaluado por el signo del coeficiente (coherente con la lógica financiera) y por su significancia estadística, medida a través del valor t. Un t-value superior a ±2 generalmente indica que la variable es estadísticamente significativa.
Con base en esos criterios, se eligieron las siguientes variables:
1. Endeudamiento Se incluyó por ser un indicador clave del riesgo financiero. En el modelo, presentó un coeficiente negativo de -2.1138 y un t-value de -6.755, lo que indica alta significancia y coherencia: a mayor endeudamiento, mayor es el riesgo de incumplimiento.
2. ROE (rentabilidad sobre el patrimonio) Es fundamental para evaluar la rentabilidad del capital propio. El modelo arrojó un coeficiente positivo de 3.7008 y un t-value de 4.406, lo que respalda su inclusión: empresas más rentables tienden a tener mejor perfil crediticio.
3. Razón corriente Representa la capacidad de pago en el corto plazo. Su coeficiente fue de 0.7316 y su t-value de 3.069, confirmando que una mayor liquidez se asocia con menor riesgo.
4. Margen EBITDA Evalúa la eficiencia operativa antes de gastos financieros y contables. Tuvo un coeficiente positivo de 2.0220 y un t-value de 3.893, lo que lo convierte en un indicador sólido de estabilidad operativa.
Las otras cuatro variables fueron descartadas por no cumplir con ambos criterios. Por ejemplo, el margen neto y el margen operativo, si bien son financieramente relevantes, presentaron t-values bajos y menor impacto predictivo. En algunos casos, los coeficientes no eran coherentes con la lógica esperada, o bien no contribuían significativamente al modelo. De esta forma, se logró un modelo más simple, estadísticamente robusto y coherente con la teoría del riesgo de crédito.
## Call:
## polr(formula = riesgo_crediticio ~ endeudamiento + roe + razon_corriente +
## margen_ebitda, data = variables_escaladas, Hess = TRUE)
##
## Coefficients:
## Value Std. Error t value
## endeudamiento -2.1138 0.3129 -6.755
## roe 3.7008 0.8400 4.406
## razon_corriente 0.7316 0.2384 3.069
## margen_ebitda 2.0220 0.5194 3.893
##
## Intercepts:
## Value Std. Error t value
## E|D -3.1280 0.4530 -6.9055
## D|C -0.9275 0.3098 -2.9940
## C|B 0.9707 0.3211 3.0230
## B|A 3.2952 0.4807 6.8545
##
## Residual Deviance: 195.4849
## AIC: 211.4849
Después de estandarizar las ocho variables financieras y escoger las 4 mas significativas, se construyó un score financiero ajustado para cada observación. Este score es un valor numérico que resume el perfil financiero global de cada empresa, integrando indicadores que reflejan tanto aspectos positivos como señales de riesgo. Para su cálculo, se sumaron las variables estandarizadas asignando signo positivo a aquellas que reflejan buena salud financiera (como el ROE, razon corriente y el margen EBITDA), y signo negativo a aquellas que representan mayor exposición al riesgo de crédito (como el endeudamiento). El resultado fue un puntaje único para cada empresa y año, que permite compararlas entre sí desde una perspectiva integral. Una vez construido este score, se procedió a su segmentación mediante quintiles, es decir, se dividió el conjunto de observaciones en cinco grupos de igual tamaño, cada uno representando el 20 % de los registros. A cada grupo se le asignó una categoría de riesgo, ordenada de mejor a peor desempeño:
• A: muy bajo riesgo
• B: bajo riesgo
• C: riesgo medio
• D: alto riesgo
• E: muy alto riesgo
Esta clasificación sirvió como variable dependiente del modelo. La decisión de utilizar quintiles responde a dos razones principales. En primer lugar, permite una distribución balanceada de las observaciones en cada categoría, lo cual es importante para garantizar la estabilidad del modelo y evitar el desbalance entre clases. En segundo lugar, se trata de una técnica objetiva y replicable que evita asignaciones arbitrarias. Al basarse en la distribución del score y no en supuestos externos, asegura que las categorías de riesgo reflejan el desempeño financiero relativo de cada empresa.
Con las cuatro variables seleccionadas como explicativas y la variable de riesgo como dependiente, se construyó el modelo utilizando la función polr() del paquete MASS en R. Esta función permite estimar una regresión logística ordinal, adecuada cuando la variable dependiente tiene una estructura categórica ordenada, como es el caso de las calificaciones de riesgo (A–E). El modelo fue ajustado con éxito y los resultados obtenidos confirmaron la relevancia de las variables elegidas. Además de los coeficientes ya mencionados, el modelo estimó los umbrales o puntos de corte entre las distintas categorías, lo que permite interpretar en qué nivel del score una empresa pasa de una categoría a otra. El modelo también generó métricas como la desviación residual y el AIC (Criterio de Información de Akaike), que sirven para evaluar la calidad del ajuste.
## empresa año riesgo_predicho
## 5 UBM Development AG (UBMV.VI) 2024 E
## 10 Bastogi SpA (BTGI.MI) 2024 C
## 15 Brioschi Sviluppo Immobiliare SpA (BRUI.MI) 2024 C
## 20 Compagnie Immobiliere de Belgique (IMMO.BR) 2024 E
## 25 Atenor SA (ATEO.BR) 2024 E
## 30 Associated International Hotels Ltd (0105.HK) 2024 A
## 35 Parkwood Holdings Bhd (PARW.KL) 2024 B
## 40 City Developments Ltd (CTDM.SI) 2024 D
## 45 FRP Holdings Inc (FRPH.OQ) 2024 A
## 50 Compagnie Immobiliere de Belgique (IMMO.BR) 2024 E
## 55 Magna Prima Bhd (MAGN.KL) 2024 A
## 60 Great China Holdings Hong Kong Ltd (0021.HK) 2024 A
## 65 Bukit Sembawang Estates Ltd (BSES.SI) 2024 A
## 70 Bright Real Estate Group Co Ltd (600708.SS) 2024 E
## 75 Grand Field Group Holdings Ltd (0115.HK) 2024 E
## 80 Pebblebrook Hotel Trust (PEB.N) 2024 C
## 85 Ryman Hospitality Properties Inc (RHP.N) 2024 B
## 90 Park Hotels & Resorts Inc (PK.N) 2024 D
## 95 Sunstone Hotel Investors Inc (SHO.N) 2024 B
## 100 Host Hotels & Resorts Inc (HST.OQ) 2024 C
Una vez entrenado el modelo logístico ordinal con las cuatro variables seleccionadas (endeudamiento, ROE, razón corriente y margen EBITDA), se procedió a evaluar su capacidad predictiva. Para ello, se generaron predicciones de la calificación de riesgo para todas las observaciones del conjunto de datos, y estas se compararon con las calificaciones reales obtenidas a partir de la segmentación por quintiles del score financiero. El resultado se presentó en forma de matriz de confusión, la cual muestra cuántas observaciones fueron clasificadas correctamente por el modelo (coincidencia entre predicción y clasificación real) y cuántas fueron clasificadas en una categoría diferente.
## Original
## Predicho E D C B A
## E 16 2 1 0 0
## D 3 12 8 1 0
## C 1 5 6 4 2
## B 0 0 4 9 4
## A 0 1 1 6 14
## Porcentaje de aciertos: 57 %
La asignación del capital se realizó en función del scoring obtenido por cada empresa a partir del modelo de riesgo crediticio desarrollado, el cual tiene una exactitud del 57%. Este scoring refleja la probabilidad de incumplimiento o el nivel de riesgo de cada compañía, y fue utilizado como base para determinar cuánto capital se le debe asignar a cada una. Para transformar el scoring en una distribución de cupos, se normalizaron los valores asignándoles ponderaciones proporcionales inversas al riesgo: es decir, a menor riesgo (mayor scoring), mayor ponderación y, por tanto, mayor asignación de cupo. Luego, estas ponderaciones se multiplicaron por el capital total disponible (en este caso, 10 millones de dólares) para determinar el monto específico que recibiría cada empresa. Este enfoque permite distribuir el capital de forma técnica y objetiva, priorizando a las empresas con mejor perfil crediticio y minimizando el riesgo agregado de la cartera.
## empresa año riesgo_predicho
## 5 UBM Development AG (UBMV.VI) 2024 E
## 10 Bastogi SpA (BTGI.MI) 2024 C
## 15 Brioschi Sviluppo Immobiliare SpA (BRUI.MI) 2024 C
## 20 Compagnie Immobiliere de Belgique (IMMO.BR) 2024 E
## 25 Atenor SA (ATEO.BR) 2024 E
## 30 Associated International Hotels Ltd (0105.HK) 2024 A
## 35 Parkwood Holdings Bhd (PARW.KL) 2024 B
## 40 City Developments Ltd (CTDM.SI) 2024 D
## 45 FRP Holdings Inc (FRPH.OQ) 2024 A
## 50 Compagnie Immobiliere de Belgique (IMMO.BR) 2024 E
## 55 Magna Prima Bhd (MAGN.KL) 2024 A
## 60 Great China Holdings Hong Kong Ltd (0021.HK) 2024 A
## 65 Bukit Sembawang Estates Ltd (BSES.SI) 2024 A
## 70 Bright Real Estate Group Co Ltd (600708.SS) 2024 E
## 75 Grand Field Group Holdings Ltd (0115.HK) 2024 E
## 80 Pebblebrook Hotel Trust (PEB.N) 2024 C
## 85 Ryman Hospitality Properties Inc (RHP.N) 2024 B
## 90 Park Hotels & Resorts Inc (PK.N) 2024 D
## 95 Sunstone Hotel Investors Inc (SHO.N) 2024 B
## 100 Host Hotels & Resorts Inc (HST.OQ) 2024 C
## ponderacion peso_relativo cupo_asignado_usd
## 5 1 0.01694915 169491.5
## 10 3 0.05084746 508474.6
## 15 3 0.05084746 508474.6
## 20 1 0.01694915 169491.5
## 25 1 0.01694915 169491.5
## 30 5 0.08474576 847457.6
## 35 4 0.06779661 677966.1
## 40 2 0.03389831 338983.0
## 45 5 0.08474576 847457.6
## 50 1 0.01694915 169491.5
## 55 5 0.08474576 847457.6
## 60 5 0.08474576 847457.6
## 65 5 0.08474576 847457.6
## 70 1 0.01694915 169491.5
## 75 1 0.01694915 169491.5
## 80 3 0.05084746 508474.6
## 85 4 0.06779661 677966.1
## 90 2 0.03389831 338983.0
## 95 4 0.06779661 677966.1
## 100 3 0.05084746 508474.6