Introdución

Es un algoritmo de aprendizaje supervisado, ya que siempre necesita alimentarse de entradas con sus respectivas salidas.
Partiendo de una condición desarrollamos los árboles de decisión, y Random forest está compuesto por muchos árboles de decisión. Al final cada conjunto de estos árboles se arroja un resultado según las entradas señaladas, y la respuesta que mas se repita en estos árboles, sera la predicción del análisis. Entre mas arboles de decisión este contenga, más exacta es la respuesta.



Árbol de decisión

Primero tenemos que conseguir variables y datos con las cuales poder tomar decisiónes.

Una vez obtenidas las variables, ahora tenemos que determinar cual variable es menos impura (es decir, cual es la que es mas acertada) con los siguientes datos.La variable menos impura es la raíz de nuestro árbol de decisión.

Para esto necesitamos la formula de Gini para determinar la impureza.

Una vez obtenida la impureza de la hoja izquierda, ahora necesitamos determinar la impureza de la hoja derecha.

Calcular la impuridad total de la variable Chest Pain.

En esta parte tenemos que comparar la impuridad de todas las variables y determinar la raíz.

Ahora hacemos lo mismo con las variables restantes para determinar la siguiente rama del árbol, hasta obtener el árbol completo.

Video referencia: https://www.youtube.com/watch?v=7VeUPuFGJHk