# Założenie: FN kosztuje 5x więcej niż FP
# Wiersze = klasa rzeczywista, kolumny = klasa przewidziana
# Kolejność etykiet: c("Dobry", "Zly")
macierz_kosztow <- matrix(c(0, 1, # rzeczywisty Dobry -> przew. Dobry/Zły
5, 0), # rzeczywisty Zły -> przew. Dobry/Zły
nrow = 2, byrow = TRUE,
dimnames = list(c("Dobry","Zly"),
c("Dobry","Zly")))
model_koszt <- rpart(
Klasa ~ Wiek + Dochod + Staz_pracy + Zadluzenie +
Liczba_kredytow + Status_mieszk,
data = train,
method = "class",
parms = list(loss = macierz_kosztow),
control = rpart.control(cp = 0.01, minsplit = 20, maxdepth = 5)
)
loss przekazujemy w parms. Drzewo zacznie agresywniej klasyfikować klientów jako “Zły”, bo FN jest 5× droższy.