Selección de predictores mediante Odds Ratio

Validación cruzada(dataset de entrenamiento)

Resultados de validación cruzada de modelos según métricas de efectividad

Modelado:Comparación de curvas ROC por modelo

Ranking de modelos según perfomance en muestra externa(dataset de testing)

Consenso de modelos

Modelo de Consenso de los diferentes ajustes
Dependent variable:
Clase
RF 10.715***
(2.551)
SVMP 9.547***
(1.948)
SVMR 0.418
(1.587)
BLR -1.202
(1.640)
GBM -2.194
(1.750)
Constant -9.142***
(1.235)
Observations 1,199
Log Likelihood -34.880
Akaike Inf. Crit. 81.760
Note: p<0.1; p<0.05; p<0.01

Para el modelo de consenso se obtiene una

  1. tasa de acierto de 98.832 %.

  2. Precisión (Documentos clasificados LAFT que son verdaderamente LAFT) de 98.827 %

  3. Recall (De todos los documentos LAFT, cuantos son clasificados LAFT) de 98.827 %