Árboles de decisión y Random Forest

Son herramientas que usan un grafo en forma de arbol para dar soporte a una decisión.
Cada nodo representa una "elección" en algún atributo (característica o feature).
En cada rama se asocia el porcentaje esperado de eventos que llegan a esa rama (\(E\)), y el valor esperado de la variable de interés en la submuestra uncluida en dicha rama \(P\), (por ejemplo: ganancia, fracción de buenos pagadores, etc).
Se necesita un critero para optimizar nuestra selección, por ejemplo el Gini index, que maximiza la suma \(\sum_{i=1}^{n} E_{i}*P_{i}(1-P_{i})\), donde \(n\) es el número de ramas que salen de un nodo.
Existen otros criterios, como
Cross entropy: \(\sum_{i=1}^{n} -E_{i}*\left(P\ln{(P)}+(1-P)\ln{(1-P)}\right)\),
Error de clasificación: \(\sum_{i=1}^{n} E_{i}*\left(1-\max{(P,1-P)}\right)\), Significacia estadística: \(\sum_{i=1}^{n} E_{i}*S/\sqrt{(S+B)}\), con \(S\): señal (buenos), \(B\) ruido (malos), entre otros.