Matriz de confusión

Para poder utilizar este método de evalución de un modelo de clasificación necesitamos separar nuestra muestra de datos en dos datasets.

  1. Train (80%)
  2. Test (20%)

Lo que haremos es entrenar el modelo utilizando las observaciones que estan en el dataset \(train\) y luego evaluaremos el modelo utilizando las observaciones del dataset \(test\).

Esto nos ayuda a medir como se comporta nuestro modelo cuando se lo aplicamos a data nueva. La matriz tiene la siguiente estructura

Matrz de confusión \(\textbf{Positivos}\) (predicción) \(\textbf{Negativos}\) (predicción)
\(\textbf{Positivos}\) (obs) Verdaderos Positivos (VP) Falsos Negativos (FN)
\(\textbf{Negativos}\) (obs) Falsos Positivos (FP) Verdaderos Negativos (VN)
LS0tCnRpdGxlOiAiTWF0cml6IGRlIGNvbmZ1c2nDs24geSBldmFsdWFjacOzbiBkZSBtb2RlbG9zIGRlIGNsYXNpZmljYWNpw7NuIgpvdXRwdXQ6CiAgaHRtbF9ub3RlYm9vazogZGVmYXVsdAogIHBkZl9kb2N1bWVudDogZGVmYXVsdAotLS0KCmBgYHtyIG1lc3NhZ2U9RkFMU0UsIHdhcm5pbmc9RkFMU0UsIGluY2x1ZGU9RkFMU0UsIHBhZ2VkLnByaW50PUZBTFNFfQojaW5zdGFsbC5wYWNrYWdlcygnSVNMUicpCiNpbnN0YWxsLnBhY2thZ2VzKCdNQVNTJykKI2luc3RhbGwucGFja2FnZXMoJ2NhcicpCiNpbnN0YWxsLnBhY2thZ2VzKCdxdWFudHJlZycpCiNpbnN0YWxsLnBhY2thZ2VzKCdzcGFyc2VNJykKCmxpYnJhcnkoU3BhcnNlTSkKbGlicmFyeShjYXIpCmxpYnJhcnkoTUFTUykKbGlicmFyeShJU0xSKQpsaWJyYXJ5KGxtdGVzdCkKbGlicmFyeShkcGx5cikKbGlicmFyeShnZ3Bsb3QyKQoKb3B0aW9ucyhzY2lwZW4gPSA5OTk5OSkgIyBjYW1iaW8gZm9ybWF0byBkZSBzaG93IGRlY2ltYWxzCnNldHdkKCcvaG9tZS9qZ29uemFsZXovZGV2L2RhdGFTY2llbmNlJykKYGBgCgojIyBNYXRyaXogZGUgY29uZnVzacOzbgoKUGFyYSBwb2RlciB1dGlsaXphciBlc3RlIG3DqXRvZG8gZGUgZXZhbHVjacOzbiBkZSB1biBtb2RlbG8gZGUgY2xhc2lmaWNhY2nDs24gbmVjZXNpdGFtb3Mgc2VwYXJhciBudWVzdHJhIG11ZXN0cmEgZGUgZGF0b3MgZW4gZG9zIGRhdGFzZXRzLgoKMS4gVHJhaW4gKDgwJSkKMi4gVGVzdCAoMjAlKQoKTG8gcXVlIGhhcmVtb3MgZXMgZW50cmVuYXIgZWwgbW9kZWxvIHV0aWxpemFuZG8gbGFzIG9ic2VydmFjaW9uZXMgcXVlIGVzdGFuIGVuIGVsIGRhdGFzZXQgJHRyYWluJCB5IGx1ZWdvIGV2YWx1YXJlbW9zIGVsIG1vZGVsbyB1dGlsaXphbmRvIGxhcyBvYnNlcnZhY2lvbmVzIGRlbCBkYXRhc2V0ICR0ZXN0JC4KCkVzdG8gbm9zIGF5dWRhIGEgbWVkaXIgY29tbyBzZSBjb21wb3J0YSBudWVzdHJvIG1vZGVsbyBjdWFuZG8gc2UgbG8gYXBsaWNhbW9zIGEgZGF0YSBudWV2YS4gTGEgbWF0cml6IHRpZW5lIGxhIHNpZ3VpZW50ZSBlc3RydWN0dXJhCgoKIHxNYXRyeiBkZSBjb25mdXNpw7NufCAkXHRleHRiZntQb3NpdGl2b3N9JCAocHJlZGljY2nDs24pIHwgJFx0ZXh0YmZ7TmVnYXRpdm9zfSQgKHByZWRpY2Npw7NuKSB8ICAKIHwtLS0tLS0tLS18LS0tLS0tLS0tLS18LS0tLS0tLS0tLS18CiB8JFx0ZXh0YmZ7UG9zaXRpdm9zfSQgKG9icyl8VmVyZGFkZXJvcyBQb3NpdGl2b3MgKFZQKXwgRmFsc29zIE5lZ2F0aXZvcyAoRk4pfAogfCRcdGV4dGJme05lZ2F0aXZvc30kIChvYnMpfEZhbHNvcyBQb3NpdGl2b3MgKEZQKXwgVmVyZGFkZXJvcyBOZWdhdGl2b3MgKFZOKXwKIAog