claimsData <- read.csv("C:/Users/joshu/Desktop/cdata.csv")
table(claimsData$CLAIM_SUSPICION_SCORE)
##
## 1 2 3 4 5
## 4 18 453 23 4
investigate <- vector(mode = "integer", length = 502)
investigate <- as.data.frame(investigate)
claimsData <- cbind.data.frame(claimsData, investigate)
claimsData$investigate <- ifelse(claimsData$CLAIM_SUSPICION_SCORE %in% c(1, 2, 3), 0, 1)
table(claimsData$investigate)
##
## 0 1
## 475 27
str(claimsData)
## 'data.frame': 502 obs. of 46 variables:
## $ Claim_Number : int 5001463 5004844 5005493 5007366 5011314 5016984 5021876 5023456 5024273 5029392 ...
## $ Policy_ID : int 364697 426960 426313 351603 423014 419258 415367 365027 346972 351192 ...
## $ CLAIM_AMOUNT : int 13463 1246 19883 16348 2477 37365 18926 12990 29493 5255 ...
## $ PAID_AMOUNT : int 13463 1246 19883 16348 2477 37365 18926 12990 29493 5255 ...
## $ CLAIM_SUSPICION_SCORE: int 3 3 3 3 2 3 3 3 3 2 ...
## $ IND_01 : int 1 1 1 1 5 1 1 2 2 2 ...
## $ IND_02 : int 1 2 1 1 5 2 1 1 1 2 ...
## $ IND_03 : int 1 1 4 2 3 1 1 3 4 3 ...
## $ IND_04 : int 4 4 1 2 1 1 5 5 1 1 ...
## $ IND_05 : int 5 1 1 1 1 5 1 4 2 1 ...
## $ IND_06 : int 3 1 1 2 1 2 2 5 4 1 ...
## $ IND_07 : int 3 5 1 2 5 5 2 1 2 2 ...
## $ IND_08 : int 1 1 2 3 1 2 2 2 1 1 ...
## $ IND_09 : int 2 2 3 1 3 1 1 5 1 1 ...
## $ IND_10 : int 2 1 5 2 2 1 1 3 1 1 ...
## $ IND_11 : int 1 1 4 1 1 2 4 3 1 1 ...
## $ IND_12 : int 3 5 5 1 1 1 2 3 1 3 ...
## $ IND_13 : int 5 1 1 1 2 1 4 2 2 1 ...
## $ IND_14 : int 2 2 1 1 1 1 1 2 2 2 ...
## $ IND_15 : int 1 2 4 5 1 1 3 1 1 1 ...
## $ IND_16 : int 2 1 1 4 1 1 1 2 1 3 ...
## $ IND_17 : int 4 1 1 2 1 5 1 1 1 2 ...
## $ IND_18 : int 1 5 1 1 1 1 1 1 2 1 ...
## $ IND_19 : int 2 1 3 2 1 1 1 4 3 2 ...
## $ IND_20 : int 3 2 1 1 1 2 1 1 2 1 ...
## $ RIDIT_01 : num -0.504 -0.504 -0.504 -0.504 0.92 ...
## $ RIDIT_02 : num -0.506 0.229 -0.506 -0.506 0.904 ...
## $ RIDIT_03 : num -0.47 -0.47 0.799 0.323 0.677 ...
## $ RIDIT_04 : num 0.789 0.789 -0.492 0.261 -0.492 ...
## $ RIDIT_05 : num 0.896 -0.498 -0.498 -0.498 -0.498 ...
## $ RIDIT_06 : num 0.651 -0.492 -0.492 0.279 -0.492 ...
## $ RIDIT_07 : num 0.592 0.914 -0.528 0.209 0.914 ...
## $ RIDIT_08 : num -0.504 -0.504 0.265 0.625 -0.504 ...
## $ RIDIT_09 : num 0.231 0.231 0.606 -0.514 0.606 ...
## $ RIDIT_10 : num 0.315 -0.456 0.916 0.315 0.315 ...
## $ RIDIT_11 : num -0.514 -0.514 0.743 -0.514 -0.514 ...
## $ RIDIT_12 : num 0.635 0.92 0.92 -0.486 -0.486 ...
## $ RIDIT_13 : num 0.93 -0.496 -0.496 -0.496 0.269 ...
## $ RIDIT_14 : num 0.237 0.237 -0.514 -0.514 -0.514 ...
## $ RIDIT_15 : num -0.492 0.257 0.797 0.93 -0.492 ...
## $ RIDIT_16 : num 0.263 -0.5 -0.5 0.805 -0.5 ...
## $ RIDIT_17 : num 0.755 -0.508 -0.508 0.241 -0.508 ...
## $ RIDIT_18 : num -0.498 0.898 -0.498 -0.498 -0.498 ...
## $ RIDIT_19 : num 0.301 -0.478 0.653 0.301 -0.478 ...
## $ RIDIT_20 : num 0.624 0.245 -0.508 -0.508 -0.508 ...
## $ investigate : num 0 0 0 0 0 0 0 0 0 0 ...
model <- princomp(~., claimsData[,6:45], na.action = na.omit)
summary(model)
## Importance of components:
## Comp.1 Comp.2 Comp.3 Comp.4
## Standard deviation 1.57214907 1.55907812 1.51018080 1.4897071
## Proportion of Variance 0.06702382 0.06591397 0.06184429 0.0601788
## Cumulative Proportion 0.06702382 0.13293778 0.19478207 0.2549609
## Comp.5 Comp.6 Comp.7 Comp.8
## Standard deviation 1.4566937 1.43133978 1.41026360 1.39846850
## Proportion of Variance 0.0575411 0.05555552 0.05393147 0.05303311
## Cumulative Proportion 0.3125020 0.36805749 0.42198896 0.47502207
## Comp.9 Comp.10 Comp.11 Comp.12
## Standard deviation 1.38795127 1.34273543 1.32000419 1.30155714
## Proportion of Variance 0.05223843 0.04889029 0.04724897 0.04593759
## Cumulative Proportion 0.52726051 0.57615079 0.62339976 0.66933735
## Comp.13 Comp.14 Comp.15 Comp.16
## Standard deviation 1.28329625 1.2682404 1.25013315 1.21728369
## Proportion of Variance 0.04465762 0.0436159 0.04237935 0.04018142
## Cumulative Proportion 0.71399497 0.7576109 0.79999022 0.84017164
## Comp.17 Comp.18 Comp.19 Comp.20
## Standard deviation 1.19165791 1.17027031 1.13087324 1.12292510
## Proportion of Variance 0.03850746 0.03713762 0.03467924 0.03419348
## Cumulative Proportion 0.87867910 0.91581672 0.95049596 0.98468944
## Comp.21 Comp.22 Comp.23 Comp.24
## Standard deviation 0.200732345 0.19461725 0.193138079 0.1856253605
## Proportion of Variance 0.001092638 0.00102708 0.001011527 0.0009343645
## Cumulative Proportion 0.985782079 0.98680916 0.987820686 0.9887550505
## Comp.25 Comp.26 Comp.27 Comp.28
## Standard deviation 0.1853804083 0.1828334112 0.1818002706 0.1728827177
## Proportion of Variance 0.0009319001 0.0009064687 0.0008962533 0.0008104848
## Cumulative Proportion 0.9896869506 0.9905934194 0.9914896726 0.9923001574
## Comp.29 Comp.30 Comp.31 Comp.32
## Standard deviation 0.1706602677 0.1643612509 0.1642485554 0.1617378372
## Proportion of Variance 0.0007897808 0.0007325556 0.0007315514 0.0007093572
## Cumulative Proportion 0.9930899382 0.9938224937 0.9945540451 0.9952634023
## Comp.33 Comp.34 Comp.35 Comp.36
## Standard deviation 0.1550962656 0.1549324899 0.1509276368 0.1496377436
## Proportion of Variance 0.0006522955 0.0006509186 0.0006177023 0.0006071892
## Cumulative Proportion 0.9959156978 0.9965666164 0.9971843188 0.9977915079
## Comp.37 Comp.38 Comp.39 Comp.40
## Standard deviation 0.1482482664 0.1436441976 0.1404797826 0.1381929737
## Proportion of Variance 0.0005959653 0.0005595229 0.0005351424 0.0005178615
## Cumulative Proportion 0.9983874732 0.9989469961 0.9994821385 1.0000000000
screeplot(model)

model$loadings
##
## Loadings:
## Comp.1 Comp.2 Comp.3 Comp.4 Comp.5 Comp.6 Comp.7 Comp.8 Comp.9
## IND_01 -0.355 -0.140 0.290 -0.164 0.225 0.150 -0.185
## IND_02 -0.528 0.201 0.415 0.306
## IND_03 0.140 -0.121 0.246 0.239 0.337 0.209 -0.308
## IND_04 0.176 0.364 0.169 0.201 -0.246
## IND_05 0.321 -0.206 -0.233 -0.481 0.158 -0.319
## IND_06 -0.188 -0.300 -0.137
## IND_07 -0.209 -0.244 0.114 0.339 -0.351 -0.144
## IND_08 0.139 -0.400 0.250 0.137 -0.128 0.152
## IND_09 0.135 0.571 -0.111 0.222 0.146
## IND_10 0.217 0.198 0.181 0.352 -0.138 0.210 0.234 0.119
## IND_11 0.222 0.485 0.311 -0.487 -0.140
## IND_12 0.208 -0.196 -0.290 -0.204 0.153 -0.198 0.201 -0.229
## IND_13 0.107 -0.183 -0.196 0.104 0.179
## IND_14 -0.182 0.103 -0.231 0.220 -0.201 0.169
## IND_15 0.318 0.230 0.313 -0.110 -0.137 0.316 0.202
## IND_16 0.200 -0.225 -0.229 0.290 -0.343
## IND_17 0.304 0.397 0.107 -0.270 -0.134 -0.200
## IND_18 -0.188 0.249 0.244 -0.314 -0.244 0.140 -0.472
## IND_19 0.206 -0.434 -0.154 0.115 0.258 0.109
## IND_20 0.344 -0.179 0.163 -0.245 0.254 0.105
## RIDIT_01 -0.149 0.122
## RIDIT_02 -0.204 0.177 0.123
## RIDIT_03 0.112 0.105 0.137 -0.120
## RIDIT_04 0.147 -0.103
## RIDIT_05 0.119 -0.191 -0.124
## RIDIT_06 -0.123
## RIDIT_07 -0.104 0.134 -0.142
## RIDIT_08 -0.165 0.101
## RIDIT_09 0.229
## RIDIT_10 0.148
## RIDIT_11 0.192 0.127 -0.191
## RIDIT_12 -0.115
## RIDIT_13
## RIDIT_14 -0.103
## RIDIT_15 0.130 0.102 0.127 0.138
## RIDIT_16 0.121 -0.142
## RIDIT_17 0.128 0.156 -0.102
## RIDIT_18 0.108 -0.128 -0.178
## RIDIT_19 -0.173 0.107
## RIDIT_20 0.135 -0.111 0.109
## Comp.10 Comp.11 Comp.12 Comp.13 Comp.14 Comp.15 Comp.16 Comp.17
## IND_01 0.135 -0.109 0.244 0.130 -0.257 -0.240
## IND_02 -0.289 -0.212 -0.101 0.125
## IND_03 0.173 -0.195 0.182 0.173 0.192 0.304
## IND_04 -0.312 0.156 0.244 0.180 0.226 -0.249 -0.435
## IND_05 -0.208 -0.274 -0.183 0.223 -0.108
## IND_06 0.605 -0.391 0.121 0.148 -0.112 -0.297 0.132
## IND_07 -0.399 0.232 0.206 -0.278 0.115 -0.102
## IND_08 -0.103 -0.351 -0.201 -0.127 0.438
## IND_09 -0.203 -0.166 0.219 -0.298 0.294
## IND_10 -0.116 0.195 0.135 -0.338 -0.269 0.188 -0.319
## IND_11 0.264 0.125 -0.271
## IND_12 -0.185 0.117 -0.148 0.411 0.134
## IND_13 0.215 0.190 0.427 -0.186 0.547 0.156 0.139 0.104
## IND_14 -0.188 -0.281 -0.352 0.285 -0.350
## IND_15 -0.148 -0.154 0.153
## IND_16 -0.269 0.105 -0.454 0.241
## IND_17 -0.258 -0.104 0.362 0.112 0.395 -0.147
## IND_18 -0.146 -0.187 -0.262 0.103 -0.272 0.187
## IND_19 0.185 -0.187 -0.307 -0.427
## IND_20 0.361 0.101 -0.239 0.242
## RIDIT_01 -0.112
## RIDIT_02 -0.113
## RIDIT_03 0.114
## RIDIT_04 -0.133 -0.118 -0.170
## RIDIT_05 -0.101
## RIDIT_06 0.263 -0.157 -0.112
## RIDIT_07 -0.157 0.103 -0.119
## RIDIT_08 -0.142 0.184
## RIDIT_09 -0.114 0.128
## RIDIT_10 -0.122 -0.105 -0.131
## RIDIT_11 0.109
## RIDIT_12 0.169
## RIDIT_13 0.100 0.182 0.229
## RIDIT_14 -0.122 -0.150 0.116 -0.156
## RIDIT_15
## RIDIT_16 -0.127 -0.197
## RIDIT_17 0.152 0.156
## RIDIT_18 -0.106 -0.115
## RIDIT_19 -0.126 -0.170
## RIDIT_20 0.158
## Comp.18 Comp.19 Comp.20 Comp.21 Comp.22 Comp.23 Comp.24 Comp.25
## IND_01 0.306 -0.306 -0.252 -0.201 0.145
## IND_02 0.194 0.145 -0.187 0.121
## IND_03 0.410 -0.191 -0.146 -0.143 0.163
## IND_04 -0.140 -0.110
## IND_05 0.251 -0.164 -0.127 -0.106
## IND_06 -0.139 0.132 -0.171
## IND_07 -0.237 0.210 0.125
## IND_08 0.326 -0.236 -0.186
## IND_09 -0.218 -0.170 -0.239 -0.111
## IND_10 0.112 0.203 -0.202 -0.109
## IND_11 0.204 0.112 0.119
## IND_12 -0.272 -0.179 -0.329
## IND_13 0.217 -0.122
## IND_14 -0.235 0.324
## IND_15 0.111 -0.510 0.217
## IND_16 -0.228 -0.297 -0.125 0.142
## IND_17 0.180 0.136
## IND_18 0.177 0.128 -0.142 0.130
## IND_19 0.222 0.295 0.111
## IND_20 -0.505 0.114
## RIDIT_01 0.130 -0.120 -0.108 0.482 -0.200 -0.121 -0.343
## RIDIT_02 -0.107 -0.162 0.233 -0.318
## RIDIT_03 0.154 0.495 0.366 0.331 -0.384
## RIDIT_04 0.278
## RIDIT_05 0.422 -0.119 0.309 0.224
## RIDIT_06 0.185 -0.331 0.398
## RIDIT_07 -0.104 -0.303
## RIDIT_08 0.124 -0.244 0.233 0.459
## RIDIT_09 0.298 0.217 0.139 0.208
## RIDIT_10 -0.170 0.271 -0.186 -0.113 -0.179
## RIDIT_11 -0.296 -0.204 -0.136 -0.301
## RIDIT_12 -0.115 -0.138 -0.234 0.238 -0.115 0.137
## RIDIT_13 0.289 -0.135 -0.156
## RIDIT_14 -0.104 0.128 0.140 -0.153
## RIDIT_15 -0.203
## RIDIT_16 -0.103 -0.109 0.299 -0.319 -0.111
## RIDIT_17 -0.142 0.156
## RIDIT_18 0.201 0.232 0.340 -0.299 0.177
## RIDIT_19 0.130 -0.194 0.224 -0.273 -0.136 0.140
## RIDIT_20 -0.217 -0.257
## Comp.26 Comp.27 Comp.28 Comp.29 Comp.30 Comp.31 Comp.32 Comp.33
## IND_01 -0.100 0.132
## IND_02 -0.100
## IND_03
## IND_04 0.139
## IND_05 0.102 -0.111
## IND_06 0.111 -0.130 0.120
## IND_07 0.116
## IND_08 -0.121 0.144
## IND_09 -0.118 -0.144 -0.128
## IND_10 0.121 0.153 -0.134
## IND_11 0.112
## IND_12 0.155 0.106 -0.110 0.137
## IND_13 0.140 -0.121 -0.118
## IND_14 -0.110 -0.139 0.262
## IND_15 -0.124
## IND_16 0.103 -0.183
## IND_17 -0.142 0.110 0.156 -0.114
## IND_18 -0.103 0.123
## IND_19 -0.221 0.103 -0.107 0.103
## IND_20 0.211
## RIDIT_01 0.242 -0.158 -0.134 -0.318
## RIDIT_02 -0.152 0.199 0.196 0.211 0.266
## RIDIT_03 -0.135 -0.158 -0.181 -0.232
## RIDIT_04 -0.199 0.194 0.235 -0.136 -0.183 -0.321
## RIDIT_05 -0.242 -0.274 -0.187 -0.114 -0.162 0.305 -0.183
## RIDIT_06 0.229 -0.254 0.318 0.243 -0.281
## RIDIT_07 -0.205 -0.296 -0.111 0.104
## RIDIT_08 0.124 -0.140 0.302 -0.349 -0.123 0.231 0.151
## RIDIT_09 0.322 0.344 0.331 0.226
## RIDIT_10 -0.316 -0.388 0.156 0.106 0.326
## RIDIT_11 0.138 -0.241 0.110 -0.287
## RIDIT_12 -0.138 -0.189 0.112 -0.363 -0.223 0.252 -0.313 -0.117
## RIDIT_13 -0.108 -0.319 0.151 0.293 0.164 0.263
## RIDIT_14 0.192 0.164 0.252 0.184 0.325 -0.601
## RIDIT_15 -0.144 0.198 0.112 -0.198 0.279 0.159 0.229 0.186
## RIDIT_16 -0.241 0.196 0.434 -0.138 -0.197
## RIDIT_17 -0.186 0.318 -0.290 -0.394 0.119 0.270 0.128
## RIDIT_18 -0.193 0.256 -0.352 0.121 -0.207 -0.105 0.159
## RIDIT_19 0.544 -0.160 -0.260 0.276 -0.202 0.221
## RIDIT_20 0.204 0.185 0.145 -0.493 -0.128 0.130
## Comp.34 Comp.35 Comp.36 Comp.37 Comp.38 Comp.39 Comp.40
## IND_01 -0.110 -0.111
## IND_02 -0.205
## IND_03
## IND_04 -0.186 0.118 -0.111 0.108
## IND_05 -0.105
## IND_06 0.149
## IND_07 0.141 0.118 -0.246
## IND_08 -0.100 -0.133
## IND_09 -0.139 0.139
## IND_10 -0.102 -0.124
## IND_11 0.227
## IND_12 -0.125 -0.121 -0.109
## IND_13 -0.110 0.147 0.153
## IND_14 -0.106
## IND_15 -0.126 -0.147 0.190
## IND_16 -0.136
## IND_17 0.106 -0.142
## IND_18 -0.132
## IND_19
## IND_20 -0.148 0.134 -0.138
## RIDIT_01 0.284 0.257 0.153 -0.145 -0.133 0.121
## RIDIT_02 0.172 -0.152 0.154 0.158 0.515 0.152 0.213
## RIDIT_03 -0.196 -0.128
## RIDIT_04 0.440 -0.307 0.271 0.143 -0.257 -0.176
## RIDIT_05 0.130 -0.147 -0.192 0.254 -0.204
## RIDIT_06 0.138 -0.350 0.141
## RIDIT_07 -0.321 -0.299 -0.168 0.592 0.118
## RIDIT_08 0.120 0.243 0.308
## RIDIT_09 0.357 -0.355
## RIDIT_10 0.251 0.217 -0.238 0.320
## RIDIT_11 0.162 -0.190 0.198 -0.568
## RIDIT_12 0.331 0.289 0.250 0.142
## RIDIT_13 0.267 -0.369 -0.352 -0.196
## RIDIT_14 -0.217 0.245 0.152 0.133
## RIDIT_15 0.231 0.305 -0.201 0.340 -0.132 -0.444
## RIDIT_16 -0.196 0.331 0.109 -0.250 -0.183
## RIDIT_17 0.159 -0.234 -0.134 -0.247 -0.161 0.365
## RIDIT_18 0.182 -0.114 0.108 0.341 0.168
## RIDIT_19 0.202 -0.143 -0.110
## RIDIT_20 0.171 0.354 -0.320 0.338 0.128
##
## Comp.1 Comp.2 Comp.3 Comp.4 Comp.5 Comp.6 Comp.7 Comp.8
## SS loadings 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000
## Proportion Var 0.025 0.025 0.025 0.025 0.025 0.025 0.025 0.025
## Cumulative Var 0.025 0.050 0.075 0.100 0.125 0.150 0.175 0.200
## Comp.9 Comp.10 Comp.11 Comp.12 Comp.13 Comp.14 Comp.15
## SS loadings 1.000 1.000 1.000 1.000 1.000 1.000 1.000
## Proportion Var 0.025 0.025 0.025 0.025 0.025 0.025 0.025
## Cumulative Var 0.225 0.250 0.275 0.300 0.325 0.350 0.375
## Comp.16 Comp.17 Comp.18 Comp.19 Comp.20 Comp.21 Comp.22
## SS loadings 1.000 1.000 1.000 1.000 1.000 1.000 1.000
## Proportion Var 0.025 0.025 0.025 0.025 0.025 0.025 0.025
## Cumulative Var 0.400 0.425 0.450 0.475 0.500 0.525 0.550
## Comp.23 Comp.24 Comp.25 Comp.26 Comp.27 Comp.28 Comp.29
## SS loadings 1.000 1.000 1.000 1.000 1.000 1.000 1.000
## Proportion Var 0.025 0.025 0.025 0.025 0.025 0.025 0.025
## Cumulative Var 0.575 0.600 0.625 0.650 0.675 0.700 0.725
## Comp.30 Comp.31 Comp.32 Comp.33 Comp.34 Comp.35 Comp.36
## SS loadings 1.000 1.000 1.000 1.000 1.000 1.000 1.000
## Proportion Var 0.025 0.025 0.025 0.025 0.025 0.025 0.025
## Cumulative Var 0.750 0.775 0.800 0.825 0.850 0.875 0.900
## Comp.37 Comp.38 Comp.39 Comp.40
## SS loadings 1.000 1.000 1.000 1.000
## Proportion Var 0.025 0.025 0.025 0.025
## Cumulative Var 0.925 0.950 0.975 1.000
write.csv(claimsData, file = "claimsDataClass.csv")