Primero tenemos que conseguir variables y datos con las cuales poder tomar decisiónes.
Una vez obtenidas las variables, ahora tenemos que determinar cual variable es menos impura (es decir, cual es la que es mas acertada) con los siguientes datos.La variable menos impura es la raíz de nuestro árbol de decisión.
Para esto necesitamos la formula de Gini para determinar la impureza.
Una vez obtenida la impureza de la hoja izquierda, ahora necesitamos determinar la impureza de la hoja derecha.
Calcular la impuridad total de la variable Chest Pain.
En esta parte tenemos que comparar la impuridad de todas las variables y determinar la raíz.
Ahora hacemos lo mismo con las variables restantes para determinar la siguiente rama del árbol, hasta obtener el árbol completo.
Video referencia: https://www.youtube.com/watch?v=7VeUPuFGJHk