Matriz de confusión y evaluación de modelos de clasificación

Matriz de confusión

Para poder utilizar este método de evalución de un modelo de clasificación necesitamos separar nuestra muestra de datos en dos datasets.

Train (80%)
Test (20%)

Lo que haremos es entrenar el modelo utilizando las observaciones que estan en el dataset \(train\) y luego evaluaremos el modelo utilizando las observaciones del dataset \(test\).

Esto nos ayuda a medir como se comporta nuestro modelo cuando se lo aplicamos a data nueva. La matriz tiene la siguiente estructura

Matrz de confusión	\(\textbf{Positivos}\) (predicción)	\(\textbf{Negativos}\) (predicción)
\(\textbf{Positivos}\) (obs)	Verdaderos Positivos (VP)	Falsos Negativos (FN)
\(\textbf{Negativos}\) (obs)	Falsos Positivos (FP)	Verdaderos Negativos (VN)

LS0tCnRpdGxlOiAiTWF0cml6IGRlIGNvbmZ1c2nDs24geSBldmFsdWFjacOzbiBkZSBtb2RlbG9zIGRlIGNsYXNpZmljYWNpw7NuIgpvdXRwdXQ6CiAgaHRtbF9ub3RlYm9vazogZGVmYXVsdAogIHBkZl9kb2N1bWVudDogZGVmYXVsdAotLS0KCmBgYHtyIG1lc3NhZ2U9RkFMU0UsIHdhcm5pbmc9RkFMU0UsIGluY2x1ZGU9RkFMU0UsIHBhZ2VkLnByaW50PUZBTFNFfQojaW5zdGFsbC5wYWNrYWdlcygnSVNMUicpCiNpbnN0YWxsLnBhY2thZ2VzKCdNQVNTJykKI2luc3RhbGwucGFja2FnZXMoJ2NhcicpCiNpbnN0YWxsLnBhY2thZ2VzKCdxdWFudHJlZycpCiNpbnN0YWxsLnBhY2thZ2VzKCdzcGFyc2VNJykKCmxpYnJhcnkoU3BhcnNlTSkKbGlicmFyeShjYXIpCmxpYnJhcnkoTUFTUykKbGlicmFyeShJU0xSKQpsaWJyYXJ5KGxtdGVzdCkKbGlicmFyeShkcGx5cikKbGlicmFyeShnZ3Bsb3QyKQoKb3B0aW9ucyhzY2lwZW4gPSA5OTk5OSkgIyBjYW1iaW8gZm9ybWF0byBkZSBzaG93IGRlY2ltYWxzCnNldHdkKCcvaG9tZS9qZ29uemFsZXovZGV2L2RhdGFTY2llbmNlJykKYGBgCgojIyBNYXRyaXogZGUgY29uZnVzacOzbgoKUGFyYSBwb2RlciB1dGlsaXphciBlc3RlIG3DqXRvZG8gZGUgZXZhbHVjacOzbiBkZSB1biBtb2RlbG8gZGUgY2xhc2lmaWNhY2nDs24gbmVjZXNpdGFtb3Mgc2VwYXJhciBudWVzdHJhIG11ZXN0cmEgZGUgZGF0b3MgZW4gZG9zIGRhdGFzZXRzLgoKMS4gVHJhaW4gKDgwJSkKMi4gVGVzdCAoMjAlKQoKTG8gcXVlIGhhcmVtb3MgZXMgZW50cmVuYXIgZWwgbW9kZWxvIHV0aWxpemFuZG8gbGFzIG9ic2VydmFjaW9uZXMgcXVlIGVzdGFuIGVuIGVsIGRhdGFzZXQgJHRyYWluJCB5IGx1ZWdvIGV2YWx1YXJlbW9zIGVsIG1vZGVsbyB1dGlsaXphbmRvIGxhcyBvYnNlcnZhY2lvbmVzIGRlbCBkYXRhc2V0ICR0ZXN0JC4KCkVzdG8gbm9zIGF5dWRhIGEgbWVkaXIgY29tbyBzZSBjb21wb3J0YSBudWVzdHJvIG1vZGVsbyBjdWFuZG8gc2UgbG8gYXBsaWNhbW9zIGEgZGF0YSBudWV2YS4gTGEgbWF0cml6IHRpZW5lIGxhIHNpZ3VpZW50ZSBlc3RydWN0dXJhCgoKIHxNYXRyeiBkZSBjb25mdXNpw7NufCAkXHRleHRiZntQb3NpdGl2b3N9JCAocHJlZGljY2nDs24pIHwgJFx0ZXh0YmZ7TmVnYXRpdm9zfSQgKHByZWRpY2Npw7NuKSB8ICAKIHwtLS0tLS0tLS18LS0tLS0tLS0tLS18LS0tLS0tLS0tLS18CiB8JFx0ZXh0YmZ7UG9zaXRpdm9zfSQgKG9icyl8VmVyZGFkZXJvcyBQb3NpdGl2b3MgKFZQKXwgRmFsc29zIE5lZ2F0aXZvcyAoRk4pfAogfCRcdGV4dGJme05lZ2F0aXZvc30kIChvYnMpfEZhbHNvcyBQb3NpdGl2b3MgKEZQKXwgVmVyZGFkZXJvcyBOZWdhdGl2b3MgKFZOKXwKIAog