SOMPO Teklif Onay Olasılığı Modellemesi ve Portföy Büyütme Stratejisi

R / h2o











Kadir Çelik

03-08-2025

Analiz Süreci

  1. Veri Bölümleme
  2. Sınıf Dengesizliği Giderme
  3. Model Eğitimi
    1. 3 Farklı Yaklaşım:
      • Ham Veri
      • Özellik Mühendisliği
      • h2o
  4. Model Değerlendirme
  5. Portföy Büyütme Stratejisi Simülasyonu

Veri Bölümleme - Sınıf Dengesizliği Giderme

  • Veri Bölümleme
h2o_sompo <- as.h2o(sompo_df)
train <- h2o.splitFrame(h2o_sompo, ratios = c(0.7, 0.15), seed = 888)[[1]]
valid <- h2o.splitFrame(h2o_sompo, ratios = c(0.7, 0.15), seed = 888)[[2]]
test  <- h2o.splitFrame(h2o_sompo, ratios = c(0.7, 0.15), seed = 888)[[3]]
  • Sınıf Dengesizliği Giderme
library(ROSE)
train_df <- as.data.frame(train)
set.seed(888)
train_up_sample<-ROSE(teklif_onay_durumu ~ ., data = train_df,seed = 888)$data

Modelleme

  • Test Edilen Modeller

    • GLM (Logistic)

    • Random Forest

    • Gradient Boosting

    • Naive Bayes

    • Decision Tree

    • XGBoost

    • KNN (K-Nearest Neighbors)

    • SVM (Support Vector Machine)

    • AutoML (h2o)

Model Performans Ölçümleri

GBM_grid_1_AutoML_1_20250802_213852_model_19

Confusion Matrix and Statistics

          Reference
Prediction    P    T
         P  172  270
         T  178 2196
                                          
               Accuracy : 0.8409          
                 95% CI : (0.8269, 0.8542)
    No Information Rate : 0.8757          
    P-Value [Acc > NIR] : 1               
                                          
                  Kappa : 0.3432          
                                          
 Mcnemar's Test P-Value : 1.713e-05       
                                          
            Sensitivity : 0.49143         
            Specificity : 0.89051         
         Pos Pred Value : 0.38914         
         Neg Pred Value : 0.92502         
             Prevalence : 0.12429         
         Detection Rate : 0.06108         
   Detection Prevalence : 0.15696         
      Balanced Accuracy : 0.69097         
                                          
       'Positive' Class : P               
                                          

Portföy Büyütme Stratejisi

Portföy Büyütme Stratejisi - Optimum Model

Onay arttırımı için optimum model - DRF_1_AutoML_1_20250802_213852

Confusion Matrix and Statistics

          Reference
Prediction    P    T
         P  187  477
         T  163 1989
                                          
               Accuracy : 0.7727          
                 95% CI : (0.7568, 0.7881)
    No Information Rate : 0.8757          
    P-Value [Acc > NIR] : 1               
                                          
                  Kappa : 0.2461          
                                          
 Mcnemar's Test P-Value : <2e-16          
                                          
            Sensitivity : 0.53429         
            Specificity : 0.80657         
         Pos Pred Value : 0.28163         
         Neg Pred Value : 0.92426         
             Prevalence : 0.12429         
         Detection Rate : 0.06641         
   Detection Prevalence : 0.23580         
      Balanced Accuracy : 0.67043         
                                          
       'Positive' Class : P