Instalar paquetes y llamar librerías

library(rpart)
library(rpart.plot)

Importar la base de datos

cancer <- read.csv("C:/Users/joseo/Downloads/cancer_de_mama.csv")

Entender la base de datos

# Usamos el método 'class' porque es una clasificación (M o B)
arbol_cancer <- rpart(diagnosis ~ ., 
                      data = cancer, 
                      method = "class")

Visualización del Árbol

# Graficamos el árbol de manera estética
# Creamos el modelo para predecir el diagnosis
arbol_cancer <- rpart(diagnosis ~ ., 
                      data = cancer, 
                      method = "class")

Visualización del Árbol

# Hacemos la visualizacion del árbol de decisión
prp(arbol_cancer, 
    main = "Árbol de Decisión: Diagnóstico de Cáncer de Mama",
    type = 2, 
    extra = 104, 
    nn = TRUE, 
    fallen.leaves = TRUE, 
    branch.lty = 3, 
    shadow.col = "gray", 
    box.palette = "RdGn")

Conclusiones

En conclusión, las mayores probabilidades de diagnóstico benigno (B) según el árbol de decisión son

  • 91% benigno: Si radius_worst < 17.

  • 98% benigno: Si radius_worst < 17 y concave.points_worst < 0.14.

  • 79% benigno: Si radius_worst < 17, concave.points_worst ≥ 0.14 y texture_worst < 26.

Por el contrario, las mayores probabilidades de diagnóstico maligno (M) son

  • 94% maligno: Si radius_worst ≥ 17.

  • 89% maligno: Si radius_worst < 17, concave.points_worst ≥ 0.14 y texture_worst ≥ 26

Interpretación general

  • La variable más importante es radius_worst (primer nodo de decisión).

  • Valores altos de radius_worst se asocian fuertemente con malignidad.

  • Cuando radius_worst es bajo, el diagnóstico depende de concave.points_worst y texture_worst.

  • Combinaciones de valores bajos en estas variables incrementan fuertemente la probabilidad de benignidad.

LS0tDQp0aXRsZTogIkFuw6FsaXNpcyBkZSBDw6FuY2VyIGRlIE1hbWEgLSDDgXJib2wgZGUgRGVjaXNpw7NuIg0KYXV0aG9yOiAiSm9zZSBNaWd1ZWwgT3J0aXoiDQpkYXRlOiAiYHIgU3lzLkRhdGUoKWAiDQpvdXRwdXQ6IA0KICBodG1sX2RvY3VtZW50Og0KICAgIHRvYzogVFJVRQ0KICAgIHRvY19mbG9hdDogVFJVRQ0KICAgIGNvZGVfZG93bmxvYWQ6IFRSVUUNCiAgICB0aGVtZTogY29zbW8NCi0tLQ0KDQpgYGB7ciBzZXR1cCwgaW5jbHVkZT1GQUxTRX0NCmtuaXRyOjpvcHRzX2NodW5rJHNldChlY2hvID0gVFJVRSkNCmBgYA0KDQojIFtJbnN0YWxhciBwYXF1ZXRlcyB5IGxsYW1hciBsaWJyZXLDrWFzXXtzdHlsZT0iY29sb3I6bGlnaHRwaW5rIn0NCg0KYGBge3J9DQpsaWJyYXJ5KHJwYXJ0KQ0KbGlicmFyeShycGFydC5wbG90KQ0KYGBgDQoNCiMgW0ltcG9ydGFyIGxhIGJhc2UgZGUgZGF0b3Nde3N0eWxlPSJjb2xvcjpsaWdodHBpbmsifQ0KDQpgYGB7cn0NCmNhbmNlciA8LSByZWFkLmNzdigiQzovVXNlcnMvam9zZW8vRG93bmxvYWRzL2NhbmNlcl9kZV9tYW1hLmNzdiIpDQpgYGANCg0KIyBbRW50ZW5kZXIgbGEgYmFzZSBkZSBkYXRvc117c3R5bGU9ImNvbG9yOmxpZ2h0cGluayJ9DQoNCmBgYHtyfQ0KIyBVc2Ftb3MgZWwgbcOpdG9kbyAnY2xhc3MnIHBvcnF1ZSBlcyB1bmEgY2xhc2lmaWNhY2nDs24gKE0gbyBCKQ0KYXJib2xfY2FuY2VyIDwtIHJwYXJ0KGRpYWdub3NpcyB+IC4sIA0KICAgICAgICAgICAgICAgICAgICAgIGRhdGEgPSBjYW5jZXIsIA0KICAgICAgICAgICAgICAgICAgICAgIG1ldGhvZCA9ICJjbGFzcyIpDQpgYGANCg0KIyBbVmlzdWFsaXphY2nDs24gZGVsIMOBcmJvbF17c3R5bGU9ImNvbG9yOmxpZ2h0cGluayJ9DQoNCmBgYHtyfQ0KIyBHcmFmaWNhbW9zIGVsIMOhcmJvbCBkZSBtYW5lcmEgZXN0w6l0aWNhDQojIENyZWFtb3MgZWwgbW9kZWxvIHBhcmEgcHJlZGVjaXIgZWwgZGlhZ25vc2lzDQphcmJvbF9jYW5jZXIgPC0gcnBhcnQoZGlhZ25vc2lzIH4gLiwgDQogICAgICAgICAgICAgICAgICAgICAgZGF0YSA9IGNhbmNlciwgDQogICAgICAgICAgICAgICAgICAgICAgbWV0aG9kID0gImNsYXNzIikNCmBgYA0KDQojIFtWaXN1YWxpemFjacOzbiBkZWwgw4FyYm9sXXtzdHlsZT0iY29sb3I6bGlnaHRwaW5rIn0NCg0KYGBge3J9DQojIEhhY2Vtb3MgbGEgdmlzdWFsaXphY2lvbiBkZWwgw6FyYm9sIGRlIGRlY2lzacOzbg0KcHJwKGFyYm9sX2NhbmNlciwgDQogICAgbWFpbiA9ICLDgXJib2wgZGUgRGVjaXNpw7NuOiBEaWFnbsOzc3RpY28gZGUgQ8OhbmNlciBkZSBNYW1hIiwNCiAgICB0eXBlID0gMiwgDQogICAgZXh0cmEgPSAxMDQsIA0KICAgIG5uID0gVFJVRSwgDQogICAgZmFsbGVuLmxlYXZlcyA9IFRSVUUsIA0KICAgIGJyYW5jaC5sdHkgPSAzLCANCiAgICBzaGFkb3cuY29sID0gImdyYXkiLCANCiAgICBib3gucGFsZXR0ZSA9ICJSZEduIikNCmBgYA0KDQojIFtDb25jbHVzaW9uZXMgXXtzdHlsZT0iY29sb3I6bGlnaHRwaW5rIn0gDQoNCkVuIGNvbmNsdXNpw7NuLCBsYXMgbWF5b3JlcyBwcm9iYWJpbGlkYWRlcyBkZSBkaWFnbsOzc3RpY28gKipiZW5pZ25vIChCKSoqIHNlZ8O6biBlbCDDoXJib2wgZGUgZGVjaXNpw7NuIHNvbg0KDQotICAgKio5MSUgYmVuaWdubzoqKiBTaSBgcmFkaXVzX3dvcnN0IDwgMTdgLg0KDQotICAgKio5OCUgYmVuaWdubzoqKiBTaSBgcmFkaXVzX3dvcnN0IDwgMTdgIHkgYGNvbmNhdmUucG9pbnRzX3dvcnN0IDwgMC4xNGAuDQoNCi0gICAqKjc5JSBiZW5pZ25vOioqIFNpIGByYWRpdXNfd29yc3QgPCAxN2AsIGBjb25jYXZlLnBvaW50c193b3JzdCDiiaUgMC4xNGAgeSBgdGV4dHVyZV93b3JzdCA8IDI2YC4NCg0KUG9yIGVsIGNvbnRyYXJpbywgbGFzIG1heW9yZXMgcHJvYmFiaWxpZGFkZXMgZGUgZGlhZ27Ds3N0aWNvICoqbWFsaWdubyAoTSkqKiBzb24NCg0KLSAgICoqOTQlIG1hbGlnbm86KiogU2kgYHJhZGl1c193b3JzdCDiiaUgMTdgLg0KDQotICAgKio4OSUgbWFsaWdubzoqKiBTaSBgcmFkaXVzX3dvcnN0IDwgMTdgLCBgY29uY2F2ZS5wb2ludHNfd29yc3Qg4omlIDAuMTRgIHkgYHRleHR1cmVfd29yc3Qg4omlIDI2YA0KDQoqKkludGVycHJldGFjacOzbiBnZW5lcmFsKioNCg0KLSAgIExhIHZhcmlhYmxlIG3DoXMgaW1wb3J0YW50ZSBlcyBgcmFkaXVzX3dvcnN0YCAocHJpbWVyIG5vZG8gZGUgZGVjaXNpw7NuKS4NCg0KLSAgIFZhbG9yZXMgYWx0b3MgZGUgYHJhZGl1c193b3JzdGAgc2UgYXNvY2lhbiBmdWVydGVtZW50ZSBjb24gbWFsaWduaWRhZC4NCg0KLSAgIEN1YW5kbyBgcmFkaXVzX3dvcnN0YCBlcyBiYWpvLCBlbCBkaWFnbsOzc3RpY28gZGVwZW5kZSBkZSBgY29uY2F2ZS5wb2ludHNfd29yc3RgIHkgYHRleHR1cmVfd29yc3RgLg0KDQotICAgQ29tYmluYWNpb25lcyBkZSB2YWxvcmVzIGJham9zIGVuIGVzdGFzIHZhcmlhYmxlcyBpbmNyZW1lbnRhbiBmdWVydGVtZW50ZSBsYSBwcm9iYWJpbGlkYWQgZGUgYmVuaWduaWRhZC4NCg==