Giới thiệu về dữ liệu

Bộ dữ liệu CreditCard trên packages AER là bộ dữ liệu mô phỏng về các khách hàng thẻ tín dụng. Bộ dữ liệu bao gồm 1000 khách hàng, dữ liệu này có thể được sử dụng để phân tích hành vi của khách hàng thẻ tín dụng, từ đó đưa ra các chiến lược marketing phù hợp.

Dưới đây là một số ví dụ về cách sử dụng bộ dữ liệu CreditCard:

Phân tích mối quan hệ giữa thu nhập và chi tiêu bằng thẻ tín dụng. Phân tích mối quan hệ giữa mức độ sử dụng thẻ tín dụng và khả năng thanh toán. Phân tích xu hướng sử dụng thẻ tín dụng theo thời gian. Phân tích hành vi của khách hàng thẻ tín dụng theo nhóm. Bộ dữ liệu CreditCard là một nguồn dữ liệu hữu ích cho các nhà nghiên cứu và chuyên gia marketing.

Thiết lập mô hình hồi quy tuyến tính cho bộ dữ liệu

Mô hình hồi quy tuyến tính là một mô hình thống kê được sử dụng để mô tả mối quan hệ tuyến tính giữa một biến phụ thuộc và một hoặc nhiều biến độc lập. Trong trường hợp của bộ dữ liệu CreditCard, biến phụ thuộc là Balance, biểu thị số dư tín dụng của khách hàng. Các biến độc lập có thể bao gồm Income, Share, Expenditure, Owner, Selfemp, Dependents, Months, Majorcards, và Active Phân tích mối quan hệ giữa thu nhập và số dư tín dụng: Chúng ta có thể sử dụng mô hình để ước lượng hệ số hồi quy β1. Nếu hệ số hồi quy β1 dương, thì thu nhập càng cao thì số dư tín dụng càng cao. Phân tích mối quan hệ giữa hạn mức tín dụng và số dư tín dụng: Chúng ta có thể sử dụng mô hình để ước lượng hệ số hồi quy β2. Nếu hệ số hồi quy β2 âm, thì hạn mức tín dụng càng cao thì số dư tín dụng càng thấp. Phân tích mối quan hệ giữa mức độ sử dụng thẻ tín dụng và số dư tín dụng: Chúng ta có thể sử dụng mô hình để ước lượng hệ số hồi quy β3. Nếu hệ số hồi quy β3 dương, thì mức độ sử dụng thẻ tín dụng càng cao thì số dư tín dụng càng cao

Chuẩn bị dữ liệu

library(AER)
## Loading required package: car
## Loading required package: carData
## Loading required package: lmtest
## Loading required package: zoo
## 
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
## 
##     as.Date, as.Date.numeric
## Loading required package: sandwich
## Loading required package: survival
data("CreditCard")

Thiết lập mô hình hồi quy tuyến tính cho bộ dữ liệu

CreditCard <- CreditCard[order(CreditCard$income),]
    CreditCard <- subset(CreditCard, expenditure > 0)
    CC_ols <- lm(expenditure ~ age + owner + income + I(income^2), data = CreditCard)

Giải thích các biến

Expenditure: Chi phí Age: Tuổi Owner : Người sở hữu Income : Thu nhập

summary(CreditCard)
##   card         reports            age              income      
##  no :   0   Min.   :0.0000   Min.   : 0.1667   Min.   : 0.210  
##  yes:1002   1st Qu.:0.0000   1st Qu.:25.3542   1st Qu.: 2.350  
##             Median :0.0000   Median :31.1667   Median : 3.000  
##             Mean   :0.1307   Mean   :33.1617   Mean   : 3.465  
##             3rd Qu.:0.0000   3rd Qu.:39.6458   3rd Qu.: 4.000  
##             Max.   :4.0000   Max.   :83.5000   Max.   :13.500  
##      share            expenditure        owner     selfemp     dependents   
##  Min.   :0.0005086   Min.   :   0.3125   no :519   no :942   Min.   :0.000  
##  1st Qu.:0.0291284   1st Qu.:  70.5962   yes:483   yes: 60   1st Qu.:0.000  
##  Median :0.0617851   Median : 156.5779                       Median :0.000  
##  Mean   :0.0903255   Mean   : 243.6031                       Mean   :0.981  
##  3rd Qu.:0.1157885   3rd Qu.: 319.2000                       3rd Qu.:2.000  
##  Max.   :0.9063205   Max.   :3099.5050                       Max.   :6.000  
##      months         majorcards         active     
##  Min.   :  0.00   Min.   :0.0000   Min.   : 0.00  
##  1st Qu.: 12.00   1st Qu.:1.0000   1st Qu.: 2.00  
##  Median : 29.50   Median :1.0000   Median : 6.00  
##  Mean   : 55.34   Mean   :0.8393   Mean   : 7.28  
##  3rd Qu.: 72.00   3rd Qu.:1.0000   3rd Qu.:11.00  
##  Max.   :540.00   Max.   :1.0000   Max.   :31.00

Giải thích các số liệu trên bảng

Share: Tỷ lệ sử dụng thẻ tín dụng. Expenditure: Chi tiêu bằng thẻ tín dụng. Owner: Chủ thẻ tín dụng (yes/no). Selfemp: Người tự kinh doanh (yes/no). Dependents: Số lượng người phụ thuộc. Months: Số tháng sử dụng thẻ tín dụng. Majorcards: Số thẻ tín dụng chính. Active: Khách hàng đang hoạt động (yes/no). Ý nghĩa của các giá trị trong bảng số liệu như sau:

Min: Giá trị nhỏ nhất. 1st Qu.: Giá trị tứ phân vị thứ nhất (trung vị của 25% giá trị nhỏ nhất). Median: Giá trị trung vị (trung bình của hai giá trị trung bình). Mean: Giá trị trung bình cộng. 3rd Qu.: Giá trị tứ phân vị thứ ba (trung vị của 75% giá trị lớn nhất). Max: Giá trị lớn nhất. Nhìn chung, bảng số liệu cho thấy rằng:

Tỷ lệ sử dụng thẻ tín dụng của khách hàng khá cao, với giá trị trung bình là 0.0903255. Chi tiêu bằng thẻ tín dụng của khách hàng cũng khá cao, với giá trị trung bình là 243.6031 USD. Đa số khách hàng là chủ thẻ tín dụng (71.2%). Ít khách hàng là người tự kinh doanh (9.2%). Đa số khách hàng không có người phụ thuộc (98.1%). Thời gian sử dụng thẻ tín dụng của khách hàng trung bình là 55.34 tháng. Đa số khách hàng có một thẻ tín dụng chính (83.93%). Đa số khách hàng đang hoạt động (72.8%)

   CC_ols <- lm(expenditure ~ age + owner + income + I(income^2), data = CreditCard)
summary(CC_ols)
## 
## Call:
## lm(formula = expenditure ~ age + owner + income + I(income^2), 
##     data = CreditCard)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -790.68 -146.54  -66.64   80.17 2296.29 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 175.2398    44.1231   3.972 7.65e-05 ***
## age          -2.3110     0.9693  -2.384   0.0173 *  
## owneryes    -18.3324    19.3018  -0.950   0.3425    
## income       35.5303    18.2232   1.950   0.0515 .  
## I(income^2)   2.0570     1.6688   1.233   0.2180    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 274.7 on 997 degrees of freedom
## Multiple R-squared:  0.09791,    Adjusted R-squared:  0.09429 
## F-statistic: 27.05 on 4 and 997 DF,  p-value: < 2.2e-16

Ý nghĩa các hệ số trên

Giải thích các số liệu trong bảng kết quả:

Hệ số hồi quy của age (-2.3110) có ý nghĩa thống kê (p-value = 0.0173) và có mối quan hệ âm với chi tiêu bằng thẻ tín dụng. Điều này có nghĩa là khi tuổi càng cao thì chi tiêu bằng thẻ tín dụng càng thấp. Hệ số hồi quy của owneryes (-18.3324) không có ý nghĩa thống kê (p-value = 0.3425). Điều này có nghĩa là tình trạng sở hữu thẻ tín dụng không có mối quan hệ đáng kể với chi tiêu bằng thẻ tín dụng. Hệ số hồi quy của income (35.5303) có ý nghĩa thống kê (p-value = 0.0515) và có mối quan hệ dương với chi tiêu bằng thẻ tín dụng. Điều này có nghĩa là khi thu nhập càng cao thì chi tiêu bằng thẻ tín dụng càng cao. Hệ số hồi quy của I(income^2) (2.0570) có ý nghĩa thống kê (p-value = 0.2180) và có mối quan hệ dương với chi tiêu bằng thẻ tín dụng. Điều này có nghĩa là khi thu nhập bình phương càng cao thì chi tiêu bằng thẻ tín dụng càng cao. Hệ số xác định tổng quát (Multiple R-squared) là 0.09791. Điều này có nghĩa là mô hình giải thích được 9.79% biến thiên của chi tiêu bằng thẻ tín dụng. Hệ số xác định hiệu chỉnh (Adjusted R-squared) là 0.09429. Điều này có nghĩa là mô hình giải thích được 9.429% biến thiên của chi tiêu bằng thẻ tín dụng sau khi điều chỉnh cho số biến độc lập. Thống kê F (F-statistic) là 27.05 với p-value < 2.2e-16. Điều này cho thấy mô hình có ý nghĩa thống kê. Kết luận:

Mô hình hồi quy tuyến tính này có thể được sử dụng để dự đoán chi tiêu bằng thẻ tín dụng của khách hàng dựa trên các thông tin về tuổi, thu nhập, và thu nhập bình phương. Mô hình giải thích được 9.79% biến thiên của chi tiêu bằng thẻ tín dụng. Tình trạng sở hữu thẻ tín dụng không có mối quan hệ đáng kể với chi tiêu bằng thẻ tín dụng. Thu nhập và thu nhập bình phương có mối quan hệ dương với chi tiêu bằng thẻ tín dụng. Mô hình hồi quy tuyến tính này có thể được sử dụng để dự đoán chi tiêu bằng thẻ tín dụng của khách hàng dựa trên các thông tin về tuổi, thu nhập, và thu nhập bình phương. Mô hình giải thích được 9.79% biến thiên của chi tiêu bằng thẻ tín dụng. Tình trạng sở hữu thẻ tín dụng không có mối quan hệ đáng kể với chi tiêu bằng thẻ tín dụng. Thu nhập và thu nhập bình phương có mối quan hệ dương với chi tiêu bằng thẻ tín dụng. # Dự báo chi tiêu bằng thẻ tín dụng dựa trên một khách hàng cụ thể # Tạo dữ liệu dự báo

new_data <- data.frame(age = 26, income = 1705)

#Dự báo bằng thẻ tín dụng

predicted_expenditure <- predict(CC_ols, owner = new_data)

In kết quả dự báo

predicted_expenditure
##      1201       226        28        60       147       364       365       441 
##  49.29303 149.84489 181.74287 184.24648 175.19495  73.85796 107.40466 186.55751 
##       673      1111      1209        43      1196       583       398       238 
## 156.66993 162.86943 176.35046 164.44216 157.85751 166.39661 185.87603 187.45851 
##       199       440       500       561       803      1118      1166       785 
## 180.59321 177.12666 176.93406 186.17819 144.57961 164.37923 175.39339 184.88928 
##       139       245       448       585       687       747       750       794 
## 187.42165 189.97785 164.55650 130.27620 167.79371 187.85940 181.31148 157.39407 
##      1090      1147      1195       630       232       474       580        83 
## 163.20840 162.97907 235.62074 182.53973 181.69825  77.34085 180.37494 194.20707 
##       800      1216       125       249       135      1081       645        53 
## 106.96561 188.42949 178.41648 193.54152 190.27865 138.05109 183.40063 193.82449 
##       424       899      1139       937       813       128       188       288 
## 164.74401 182.26933 111.93870 150.05308 182.79789 196.87686 124.73523 194.60774 
##       452       635       840      1292      1175       513       104       305 
## 175.89014 110.79609 126.04711 192.87446 185.79111 193.04624 187.69781 149.52904 
##       390       439       489       586       786       826       864       898 
## 200.60109 193.86057 164.55075 200.98624 171.48385 196.94194 139.55131 169.17282 
##      1042      1056      1077      1095      1241      1243      1256      1257 
## 197.71230 175.17973 178.26110 165.70627 194.24575 187.69781 192.12729 167.66888 
##      1262       678       866       738       709        44       499       575 
## 192.70505 152.83535 194.14234 192.83944 195.10411 178.67973 170.16921 194.08662 
##       888       706       566       129       935       442      1155       368 
## 182.87988 194.32564 109.98072 191.89246 195.44118 191.54828 166.62028 187.14918 
##       578       254       349       582      1097        15       343       380 
## 128.60302 187.96760 139.01401 193.74518 205.87810 150.53092 101.17198 179.74707 
##       643      1068       189       272       485       610       918       137 
## 202.89415 142.90636 165.64493 197.65093 200.53972 201.69524 182.82182 210.56846 
##       825       342       614       875        23        47        52        72 
## 209.79812 171.43462 204.98132 183.98945 157.04286 172.29391 198.48560 191.16732 
##       117       201       207       237       259       392       418       421 
## 149.14683 194.24871 165.90181 129.31048 195.98199 201.75957 164.16854 188.04922 
##       436       461       471       544       558       562       571       579 
## 195.21163 176.14561 180.18992 171.10163 161.31650 145.29512 202.91508 207.72972 
##       589       670       775       795       871       953      1036      1047 
## 192.90059 155.88735 189.43405 202.72248 168.63476 160.31683 178.99767 199.25593 
##      1087      1126      1132      1307      1310      1117        31       805 
## 206.76679 141.25082 161.66493 207.15197 143.36925 181.45926 205.26234 172.10080 
##       569       723      1080      1149      1169       625       270       526 
## 200.62439 202.93542 173.43300 192.15060 183.83265 200.49010 207.58441 171.53407 
##       273       323       535       549       570       588       593       686 
## 199.60800 182.04595 175.69061 181.11975 202.30421 192.09715 201.53388 200.95612 
##       752       766       877       917       925       942      1018      1058 
## 192.09715 212.31868 192.06041 206.54110 181.85335 200.57094 172.60922 185.12732 
##      1164      1188       133      1224       118       290       300       422 
## 181.89011 178.23096 204.20891 170.57959 191.22940 208.17696 166.96356 197.96991 
##       869      1275       184       313       939      1116       695       948 
## 211.64350 199.31801 196.68060 193.17729 203.22851 196.87317 177.68209 184.48046 
##       789      1172        75       234       246       346       408       697 
## 219.00680 193.20027 201.92709 172.61727 199.23088 201.92709 195.95691 163.75830 
##       712       728       797       861       895       959       977       998 
## 160.86951 178.04641 201.73449 200.57897 203.27518 188.21674 206.54915 185.71311 
##      1053      1078      1182      1200       330       688      1141       889 
## 211.17122 214.63776 187.83156 191.29811 166.67747 202.44831 153.39538 204.42188 
##       444       347       391       400       647       905       936      1006 
## 219.46562 217.85311 209.93885 213.40540 171.99940 196.65042 216.48677 155.01508 
##       307       450        62      1179       163       194       204       244 
## 197.03035 191.37927 204.15860 174.65621 210.25745 212.18332 200.05040 207.56126 
##       327       477       492       541       664       854       856      1076 
## 153.40785 161.11128 213.14624 184.22160 184.22160 193.50246 212.76108 198.85813 
##      1174      1198       853       381       556       533       879       685 
## 138.19354 210.25745 211.40039 162.66360 175.91707 206.72865 215.00984 171.00287 
##        21        49       505       536       831       426         8      1001 
## 170.29913 209.81601 208.66050 181.31327 215.01583 189.24218 185.26268 173.70752 
##       858       476      1115        55        84        93       113       155 
## 210.94725 221.67086 166.29858 212.85139 204.57020 172.02315 207.26639 214.77724 
##       197       200       331       517       532       574       594       681 
## 203.37792 158.15695 171.21608 179.88245 213.81433 221.13258 207.65157 214.96984 
##       744       745       814       994      1050      1063      1125      1156 
## 151.22386 198.98520 212.46621 214.58466 189.54849 181.26727 216.12536 221.90294 
##      1206      1229      1255      1289       631         2       293       318 
## 148.68351 223.44361 209.77002 203.99244 199.66512 196.42754 172.12497 163.07342 
##       699      1273      1183        14       367       384       417       872 
## 189.73839 174.23487 162.80794 189.66862 204.53449 164.43985 133.81867 213.20086 
##       887       927      1069      1281        71       209        34       914 
## 205.69000 181.80932 215.89705 213.77862 185.62697 225.21232 208.51568 202.75129 
##       884       108         6       122       146       218       271       336 
## 179.49344 218.61530 223.18990 226.46387 188.48768 209.51629 125.31946 183.70978 
##       386       435       467       487       530       634       636       735 
## 200.84992 275.57330 209.90147 223.96024 172.11786 214.13835 202.96837 181.20614 
##       754       771       808       903       929       972       985      1046 
## 205.05007 201.04252 190.79872 190.45027 220.30111 234.16730 217.21974 187.71733 
##      1110      1130      1159      1161      1178      1180      1213      1225 
## 211.82732 192.14681 175.77701 139.18565 133.60067 180.59165 224.15284 192.91715 
##      1242      1278      1294      1309       503       967      1311       198 
## 189.25802 198.30957 185.44305 217.02714 221.52980 209.78206 206.79242 194.06361 
##       465      1002       860       223         4        80       187       758 
## 213.32220 169.76103 215.35824 208.19681 208.27081 203.33841 190.97616 213.93063 
##       822      1295       166       901       202       534        42      1017 
## 225.29322 206.22720 226.33139 186.28000 213.19465 155.57469 226.90646 164.12495 
##        45       124       176       251       262       490       529       563 
## 192.93391 168.82392 197.51922 224.90318 193.66751 171.71271 193.08976 225.48094 
##       608       624       675       714       751       768       784       915 
## 209.88147 218.74042 226.44388 207.57044 206.99268 217.77751 216.04423 217.58491 
##      1037      1049      1065      1181      1252      1239      1098       211 
## 201.94871 174.02374 237.42128 227.98455 192.54873 203.30335 181.11183 154.56174 
##        82       253       818      1234      1145       834       931       801 
## 138.89957 225.87155 219.70879 213.35345 201.27667 139.60941 207.62520 145.41320 
##       960       591       438       748       437       951        64       156 
## 156.24914 204.27174 222.43308 187.97882 234.93390 218.87315 235.32397 153.05300 
##       158       192       312       332       377       522       639       830 
## 224.92433 209.09553 222.03554 235.32397 232.24260 171.54125 238.40534 228.77606 
##       982      1168      1210      1303      1219      1041        74       981 
## 131.67595 238.59794 212.40623 216.64314 211.02878 193.33323 201.05539 198.83141 
##      1059       604       317       434       481       547       802      1073 
## 234.18096 179.09145 225.33551 203.34395 189.67036 209.89189 173.49313 195.25533 
##       222       823      1082       878        54        63       161       264 
## 225.22639 170.38652 234.49776 244.16010 235.96402 229.80126 234.23074 234.03816 
##       267       278       281       294       484       568       612       644 
## 222.67558 234.42332 203.57283 177.57372 225.75695 231.34195 218.20936 197.63941 
##       721       850       859       874       946      1024      1146      1170 
## 236.54178 231.91971 221.13489 231.72713 228.60901 221.09815 171.02578 133.27893 
##      1202      1230      1232      1233      1270       698       958      1092 
## 205.15026 196.06198 225.17919 200.68404 239.23799 101.42299 249.80908 187.80276 
##      1197       671       676       796       722       250        78       191 
## 185.14891 202.07871 221.33730 235.43876 225.31336  82.96931 236.27457 239.23320 
##       252       341       576       621       739       907      1138      1263 
## 199.24677 219.66088 221.58676 215.23142 232.60089 236.64520 199.05419 237.22296 
##       170       111       255       793      1114      1265       311       394 
## 239.79977 226.27596 127.28676 237.09752 195.11376 231.70510 193.35260 243.82925 
##      1023        35        41        56        61       119       123       130 
## 228.12971 245.26356 221.34614 224.27167 242.37477 251.23371 249.11526 185.13996 
##       141       174       219       236       240       287       383       387 
## 216.18305 220.76838 218.68669 210.75392 162.60740 249.69302 168.96274 190.33979 
##       415       425       473       488       508       521       546       551 
## 225.77563 235.44167 213.06495 214.64238 207.67253 190.33979 241.60441 170.31086 
##       560       573       596       605       611       652       653       684 
## 202.85788 192.07306 209.40580 236.01943 197.08030 246.99683 209.59840 213.25753 
##       719       746       767       772       792       817       849       882 
## 240.06373 217.14599 245.45613 216.14632 205.16892 219.64960 193.42118 231.58994 
##       897       921       943       997       999      1019      1020      1048 
## 245.45613 227.35306 185.71772 190.72496 181.09566 160.29637 213.06495 219.84220 
##      1157      1199      1205       525        79       413      1062       996 
## 222.11648 241.79701 234.47873 237.93760 301.58637 228.78886 177.33166 246.60258 
##       277        70       672       302       567       787       845      1022 
## 210.34818 246.89147 231.11236 253.34527 195.37689 195.72531 231.58307 217.10236 
##      1129      1154       824      1285       597       162       206       256 
## 222.10960 183.78499 195.23942 173.88845 194.13899 248.14902 256.23764 256.23764 
##       595       203       388       396       606       720       651        58 
## 197.26956 231.30616 245.55754 226.26219 218.36615 256.88270 255.78551 232.18493 
##       811       665        10        16        32       275       379       729 
## 246.05112 248.81929 244.32798 196.52991 242.01695 211.16646 230.23248 203.27043 
##       810       812       836       844       862       912      1030      1153 
## 251.64626 228.11402 256.84608 236.81713 235.08385 246.25386 237.58749 192.87078 
##      1173      1283      1290      1300      1007       497       168       324 
## 242.20955 220.98835 214.28457 202.11491 187.30012 195.73314 253.40476 293.23332 
##        73       216       357       453       995      1296       231       983 
## 236.07785 254.27872 256.58975 231.51684 192.80705 236.47227 233.02530 224.04228 
##      1057       838       892      1026       138       552       727       940 
## 250.14908 225.59931 251.10816 263.58084 264.04716 229.76686 259.81027 221.48564 
##       991      1013       904       518       883       677       143       430 
## 183.31688 206.81238 243.76074 244.45639 176.99003 233.92382 256.60129 229.13833 
##      1015       269       385       451       632       757       782       910 
## 241.15494 211.39512 273.40783 193.29204 262.81558 262.23782 224.83940 253.95663 
##       622       401       627      1305       169       420       821       414 
## 229.43004 242.86012 262.65124 212.27603 246.91706 199.54091 229.42848 174.11640 
##        39       152       167       186       220       261       308       369 
## 262.97326 233.08569 193.41296 274.52842 264.51396 246.98862 263.74360 216.33071 
##       389       397       458       468       482       509       510       531 
## 261.81775 217.33038 241.36688 247.37380 241.36688 240.21136 214.59743 203.42745 
##       617       620       646       655       724       873       924       928 
## 216.13813 252.76620 257.00310 222.10829 228.27105 199.19054 202.07933 229.07812 
##       944       969       970       986      1032      1084      1108      1211 
## 268.75084 278.76531 272.02481 237.13000 254.11431 265.09172 248.33673 205.35330 
##      1280      1304       891       934      1284        36       756      1259 
## 242.13724 227.69329 249.36902 267.82439 262.47010 209.53232 255.19158 245.59240 
##      1308       148        98       140       358       491       633       668 
## 228.23422 228.15220 271.06809 232.74349 254.31311 191.68593 201.89297 216.14435 
##       679      1113      1133      1249      1297      1223      1220       107 
## 230.97348 212.67780 252.96502 244.83967 277.03828 237.99160 220.24249 277.91289 
##       295       689       798      1031       164       661       333       360 
## 237.64918 240.04355 264.34612 238.50286 245.48478 225.57714 237.95393 233.33187 
##       402       428       587       659       781       839       843       863 
## 235.06514 204.82915 265.91565 333.70592 256.63477 221.23568 230.28723 259.75289 
##      1012      1060      1121      1318      1319       952        77      1010 
## 241.03530 188.65192 260.67907 258.98256 205.02172 223.68629 281.36164 249.54821 
##      1099         9       142       210       375       512       780       870 
## 260.91077 236.11658 244.04934 269.08552 217.62832 202.02885 232.84261 236.88691 
##       299       743      1102      1122      1112      1072        68       116 
## 247.54242 244.88085 226.40595 256.11362 215.18440 258.55298 247.83813 258.81553 
##       177       268       355       454       555       760       971      1028 
## 290.59222 225.46141 279.80740 240.90503 263.01568 284.04428 288.85895 261.28241 
##      1086       106       816        11         7      1177       584        17 
## 245.87552 292.58745 229.17490 258.85903 283.67961 206.80106 298.18577 239.30580 
##        24       149       193       283       301       314       419       456 
## 267.65268 229.09873 294.22955 251.09027 261.10476 289.80006 206.95135 237.37992 
##       460       506       550       565       623       649       656       730 
## 262.60870 283.60057 267.42334 269.77113 292.88145 261.06800 330.59156 281.09696 
##       806       938       962      1039      1043      1051      1066       446 
## 243.92786 290.76300 255.48302 230.06167 225.82476 248.74251 268.19370 283.57963 
##       718       339       603      1167       501       159       393       976 
## 263.04574 247.83706 254.90627 280.16072 262.28233 287.50836 274.56837 204.08190 
##       257       404      1260       105       282       704      1000      1034 
## 256.92798 256.63860 287.82234 270.19936 259.41454 239.38561 235.34130 252.09629 
##      1135       717       893       120       151       285       457       885 
## 244.39283 277.22652 296.57910 273.41910 232.16895 287.09269 221.76930 313.47699 
##       954      1227      1250       217       247       599       504       978 
## 245.26480 219.26569 276.65632 207.62024 313.38669 250.63190 286.62955 290.94155 
##       791      1021      1299       361      1107         3       126       371 
## 279.30268 247.33341 218.83069 289.06798 219.89238 280.64209 279.10141 249.63575 
##       374       427       615       637       650       694       922       966 
## 300.32262 242.89524 263.73126 277.56072 284.33797 273.13123 302.05589 276.79038 
##      1100      1267        26         1      1070       613       221      1315 
## 252.71712 263.50195 307.19486 272.47964 241.43700 302.60799 281.23261 284.41048 
##       304        40       832       880      1317       205       564       820 
## 313.90334 299.74055 289.95540 278.01508 270.08232 274.96536 257.69684 278.24450 
##       990      1277       242      1033        57       279       363       472 
## 272.08176 304.24361 251.01576 279.20638 313.83180 302.62507 340.21607 274.70010 
##       559       642       674      1079       520      1061      1091       495 
## 338.09764 280.67026 242.92341 294.72903 283.91945 294.40313 298.84614 275.04855 
##      1222       759      1186        99       112       127       190       235 
## 252.70856 271.92623 268.96053 325.31791 307.44414 346.34653 307.98516 321.65878 
##       241       344       449       548       716       926      1008      1038 
## 289.30433 306.44447 278.51951 313.76275 297.39294 310.14035 265.42365 244.62436 
##      1064      1109      1148      1187      1231      1279      1150      1246 
## 305.28895 280.25278 318.76999 305.86671 298.74104 292.80761 296.59559 294.81065 
##       399       416       514       703       851      1105      1131      1258 
## 316.88968 311.68986 303.21607 299.94210 314.03763 319.77847 301.29022 321.74106 
##      1160        25       356       761       973      1276       463      1221 
## 320.64948 295.27274 283.65898 329.91638 283.65898 299.83621 302.88958 342.91073 
##      1040       266       523      1162       629      1214       769      1003 
## 266.00531 301.86629 319.00645 330.17644 335.41393 347.90230 286.85531 328.26450 
##        30       100       350       395       429       431       511       734 
## 322.10535 308.23915 355.23013 318.25362 356.19307 268.56643 334.04569 383.19185 
##       790       828       847       867       900       955       731       572 
## 342.32688 350.83741 369.13308 335.62312 365.85911 326.34223 347.92107 343.73364 
##       705       964       183        38      1272       984       992      1055 
## 349.31864 331.60072 353.83410 341.71501 368.57880 326.64164 330.49337 328.37491 
##       265       180       956        67        97       175       763      1083 
## 350.89698 383.97241 353.05679 368.29710 368.64552 364.79381 381.00777 315.14336 
##      1165      1287      1291       692      1142       335       837      1052 
## 386.78535 331.66901 349.57950 311.32668 375.65330 376.53365 390.78502 357.66022 
##      1171       749      1228       298       519       773       963      1306 
## 417.20605 405.99753 365.32513 394.25939 385.01526 392.71869 401.77024 385.97817 
##       157       980       628       700       807       150       708      1067 
## 433.86114 412.63994 454.97902 359.80479 359.99739 388.60729 391.97797 386.74142 
##      1208      1071       542       433       641        50       212       352 
## 386.58557 418.79565 417.57454 434.32587 384.83128 442.27875 414.54637 464.65547 
##       406       407       483       732       778       852       941      1014 
## 426.10153 439.96772 397.40620 421.86464 430.56775 444.81912 419.36101 420.70913 
##      1274       516      1088       725        86      1218       229       835 
## 420.13137 396.54128 417.44825 365.22881 427.79244 398.90146 455.54795 463.54145 
##       230       764       774       957       160       145       181       233 
## 481.11955 457.04629 412.72721 443.48379 386.50518 459.62147 475.60609 478.61989 
##       737       459       478       524       770       515       762       765 
## 514.63347 500.89150 488.18083 495.61206 493.35341 532.06176 517.53425 558.78440 
##      1217         5        19       101       109       296       309       975 
## 578.92601 627.30710 626.61186 637.01150 623.33789 594.06483 624.68600 604.27187 
##       359       906       968       110      1189       412       833       658 
## 642.60417 642.79675 614.05334 620.00650 639.51329 655.45396 741.58064 774.11873 
##       447       114 
## 803.21514 906.10108

Vẽ biểu đồ của mô hình

library(ggplot2)
ggplot(data = CreditCard, aes(x = age, y = expenditure)) +
  geom_point() +
  geom_smooth(method = "lm", color = "red") +
  labs(x = "Tuổi", y = "Chi tiêu bằng thẻ tín dụng") +
  annotate("text", x = 30, y = 10000, label = "Đường hồi quy tuyến tính")
## `geom_smooth()` using formula = 'y ~ x'

Một vài kiểm định với mô hình trên

Mục đích của việc kiểm định với mô hình trên là để đánh giá mô hình có phù hợp với dữ liệu hay không. Các kiểm định này sẽ giúp bạn xác định xem các hệ số hồi quy của mô hình có ý nghĩa thống kê hay không, liệu mô hình có thể giải thích biến phụ thuộc hay không, và liệu có hiện tượng tự tương quan trong mô hình hay không.

library(car)

Kiểm định hiện tượng tự tương quan

results <- durbinWatsonTest(CC_ols)

Giá trị Durbin-Watson

results$`Durbin-Watson statistic`
## NULL

Trong trường hợp kiểm định giả thuyết về hệ số hồi quy, nếu kiểm định là null, thì không có bằng chứng thống kê để bác bỏ giả thuyết rằng hệ số hồi quy bằng 0. Điều này có nghĩa là biến độc lập đó có thể không có ảnh hưởng đáng kể đến biến phụ thuộc.

Trong trường hợp kiểm định giả thuyết về R-squared, nếu kiểm định là null, thì không có bằng chứng thống kê để bác bỏ giả thuyết rằng R-squared bằng 0. Điều này có nghĩa là mô hình không có khả năng giải thích biến phụ thuộc.