Bài tập tuần 2

TravelMode - Package:AER

Mô tả: Dữ liệu về lựa chọn phương thức di chuyển cho hành trình giữa Sydney, Melbourne và Úc. Một data frame chứa 840 quan sát trên 4 chế độ cho 210 mẫu, gồm có 9 biến

individual: Hệ số biểu thị cá nhân có cấp độ từ 1 đến 210

mode: Phương thức di chuyển với những lựa chọn là “ô tô”, “máy bay”, “tàu hỏa” hoặc “xe buýt”

choice: Yếu tố thể hiện sự lựa chọn với mức độ “không” và “có”.

wait: Thời gian chờ đợi trước khi phương tiện hành khách chọn xuất phát, số 0 thể hiện cho ô tô

vcost: Chi phí phương tiện

travel: Thời gian di chuyển trên xe.

gcost: Đo lường chi phí chung.

income: Thu nhập hộ gia đình.

size: Quy mô bữa tiệc (Biến định tính có các cấp độ từ 1 đến 6 biểu hiện sự biến động từ “nhỏ nhất, nhỏ, trung bình, vừa, lớn và rất lớn”)

library(AER) 
## Loading required package: car
## Loading required package: carData
## Loading required package: lmtest
## Loading required package: zoo
## 
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
## 
##     as.Date, as.Date.numeric
## Loading required package: sandwich
## Loading required package: survival
data("TravelMode") 

Các thao tác gán biến và thêm biến

d <-TravelMode
names(d) <- c('I','M','C','W','V','T','G','IN','S')
air <- d[d$M=='air',] 
Travl3000 <- d[d$T>300&d$W=='0',]
Từ biến d chọn ra những dòng có thời gian di chuyển trên xe lớn hơn 300 và thời gian chờ đợi trước khi phương tiện hành khách chọn xuất phát là 0 (tức là hành khách chọn phương tiện di chuyển là ô tô) và gán nó ứng với biến Travel3000
d$Traveltime <- cut(d$T, breaks = c(63,400,700,1000,1440),labels = c('ngắn','vừa','dài','siêu dài'))
Thêm một biến Traveltime vào biến d, biến Traveltime biểu hiện cho “các khoảng thời gian di chuyển trên trên phương tiện” và biến này có được bằng cách phân tổ biến “thời gian di chuyển trên phương tiện” thành 4 tổ, tổ thứ nhất có giá trị từ 63 đến 400, tổ thứ 2 có giá trị từ 400 đến 700, tổ thứ 3 có giá trị từ 700 đến 1000 và tổ thứ 4 có giá trị từ 1000 đến 1440, các tổ này được đặt tên theo thứ tự là ngắn, vừa, dài và siêu dài.
d$Cost <- cut(d$G, breaks = c(25,125,225,300),labels = c('tiết kiệm','vừa đủ','thoải mái'))
Thêm một biến Cost vào biến d, biến Cost biểu hiện cho “mức chi phí mà hộ gia đình đã chi ra cho chuyến đi” và biến này có được bằng cách phân tổ biến gcost(chi phí chung) thành 3 tổ, tổ thứ nhất có giá trị từ 25 đến 125, tổ thứ 2 có giá trị từ 125 đến 225, tổ thứ 3 có giá trị từ 225 đến 300 và các giá trị này được phân loại theo 3 mức “tiết kiệm, vừa đủ và thoải mái”

Tính những đặc trưng đo lường cơ bản

summary(d$IN) 
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    2.00   20.00   34.50   34.55   50.00   72.00
Trong này bao gồm giá trị lớn nhất của thu nhập hộ gia đình là 72, giá trị nhỏ nhất là 2, giá trị trung bình là 34.55, giá trị trung vị là 34.5, tứ phân vị thứ nhất là 20 và tứ phân vị thứ 3 là 50.
quantile(d$IN,0.35)
## 35% 
##  26
Kết quả trên cho ta thấy với số liệu của thu nhập hộ gia đình (income-IN), có bé hơn 35% hộ gia đình có thu nhập là 26 và có lớn hơn 65% hộ gia đình có thu nhập là 26
quantile(d$G,0.5)
##   50% 
## 101.5
Với kết quả trên, ta thấy được với số liệu của chi phí chung cho chuyến đi(gcost) thì có bé hơn 50% hộ gia đình có mức chi phí chi ra là 101.5 đơn vị và có lớn hơn 50% hộ gia đình có mức chi phí chi ra lớn hơn con số này.
aggregate(d$IN,list(d$M),FUN='mean')
##   Group.1        x
## 1     air 34.54762
## 2   train 34.54762
## 3     bus 34.54762
## 4     car 34.54762
Câu hỏi đặt ra ở đây là liệu thu nhập của khách hàng có ảnh hưởng tới sự lựa chọn phương tiện di chuyển của họ hay không? Ta tổng hợp kết quả của thu nhập trung bình theo sự lựa chọn phương thức di chuyển của họ. Từ kết quả trên cho ta thấy, thu nhập trung bình của khách hàng đối với các phương tiện di chuyển đều bằng 34.54762, vậy ta có thể kết luận thu nhập trung bình của các hộ gia đình không ảnh hưởng tới việc lựa chọn phương thức di chuyển của họ.
aggregate(d$IN,list(d$S),FUN='mean')
##   Group.1        x
## 1       1 31.82456
## 2       2 35.67241
## 3       3 40.45000
## 4       4 38.93333
## 5       5 60.00000
## 6       6 45.00000
Tương tự như trên, ta phân tích xem thu nhập của hộ gia đình có ảnh hưởng đên quy mô bữa tiệc mà họ tổ chức hay không. Kết quả trên cho ta thấy, với những hộ gia đình có xu hướng tổ chức bữa tiệc với quy mô nhỏ nhất thì trung bình thu nhập của họ chỉ xấp xỉ 31.82 đơn vị (nhỏ nhất so với trung bình thu nhập của các hộ gia đình còn lại). Với những hộ gia đình có xu hướng tổ chức bữa tiệc với quy mô lớn và rất lớn thì trung bình thu nhập của họ lên đến 45 đến 60 đơn vị - hơn rất nhiều so với thu nhập trung bình của các hộ gia đình tổ chức bữa tiệc với quy mô nhỏ. Vậy ta có thể kết luận rằng, thu nhập của hộ gia đình có ảnh hưởng đến quy mô tổ chức bữa tiệc của họ

Tính phương sai và độ lệch chuẩn cho biến thành phần chi phí phương tiện (vcost)

var(d$V)
## [1] 1047.882
sd(d$V)
## [1] 32.371
Giá trị Var = 1047.882 biểu hiện cho phương sai cho những giá trị của biến Vcost là 1047.882 và giá trị Sd biểu hiện cho độ lệch chuẩn cho những giá trị của biến Vcost là 32.371

Dùng lệnh %>% trong packages tidyverse để rút gọn thao tác

install.packages("tidyverse", repos = "https://cloud.r-project.org")
## Installing package into 'C:/Users/PHUONG UYEN/AppData/Local/R/win-library/4.3'
## (as 'lib' is unspecified)
## package 'tidyverse' successfully unpacked and MD5 sums checked
## 
## The downloaded binary packages are in
##  C:\Users\PHUONG UYEN\AppData\Local\Temp\Rtmp6FfEBB\downloaded_packages
library(tidyverse) 
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ dplyr     1.1.2     ✔ readr     2.1.4
## ✔ forcats   1.0.0     ✔ stringr   1.5.0
## ✔ ggplot2   3.4.2     ✔ tibble    3.2.1
## ✔ lubridate 1.9.2     ✔ tidyr     1.3.0
## ✔ purrr     1.0.1
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag()    masks stats::lag()
## ✖ dplyr::recode() masks car::recode()
## ✖ purrr::some()   masks car::some()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
TravelMode %>% group_by(mode) %>%  summarise(n=mean(travel))
## # A tibble: 4 × 2
##   mode      n
##   <fct> <dbl>
## 1 air    134.
## 2 train  608.
## 3 bus    629.
## 4 car    573.
Thao tác trên cho ra kết quả trung bình của thời gian di chuyển trên từng phương tiện,ta thấy thời gian trung bình khi sử dụng phương tiện di chuyển là máy bay=133 đơn vị - ngắn hơn nhiều so với khi sử dụng các phương tiện di chuyển khác. Thời gian trung bình khi di chuyển bằng tàu, xe bus và xe ô tô lần lượt là 608,629 và 573 đơn vị.
TravelMode %>% group_by(mode) %>%  summarise_at(c('wait','vcost'),list(n=mean))
## # A tibble: 4 × 3
##   mode  wait_n vcost_n
##   <fct>  <dbl>   <dbl>
## 1 air     61.0    85.3
## 2 train   35.7    51.3
## 3 bus     41.7    33.5
## 4 car      0      21.0
Ta dùng lệnh summarise_at để cho ra kết quả trung bình thời gian chờ đợi trước khi phương tiện xuất phát (wait) và trung bình thành phần chi phí phương tiện(vcost) của từng loại phương tiện di chuyển(máy bay, tàu, xe bus và xe ô tô). Đọc kết quả, ta có thể thấy được cả thời gian chờ đợi và chi phí của phương tiện máy bay là cao nhất, thời gian chờ đợi và chi phí của ô tô là thấp nhất
TravelMode %>% group_by(mode) %>%  summarise_if(is.numeric,list(n=mean))
## # A tibble: 4 × 7
##   mode  wait_n vcost_n travel_n gcost_n income_n size_n
##   <fct>  <dbl>   <dbl>    <dbl>   <dbl>    <dbl>  <dbl>
## 1 air     61.0    85.3     134.   103.      34.5   1.74
## 2 train   35.7    51.3     608.   130.      34.5   1.74
## 3 bus     41.7    33.5     629.   115.      34.5   1.74
## 4 car      0      21.0     573.    95.4     34.5   1.74
Ở câu lệnh trên, ta sử dụng lệnh summarise_if để lấy chỉ số trung bình cửa những biến số(numeric). Những biến số bao gồm thời gian chờ đợi trước khi phương tiện di chuyển (wait),thành phần chi phí phương tiện(vcost), thời gian di chuyển trên xe(travel),chi phí chung(gcost), thu nhập hộ gia đình(income), quy mô tổ chức bữa tiệc(size).
is.data.frame(TravelMode)
## [1] TRUE
Kiểu tra xem TravelMode có phải là một bộ dữ liệu hay không. Kết quả cho ra là đúng
is.vector(TravelMode)
## [1] FALSE
Kiểm tra xem TravelMode có phải là một vector hay không. Kết quả cho ra là sai
is.vector(TravelMode$mode)
## [1] FALSE
Kiểm tra xem biến mode(phương thức di chuyển) cố phải là một vector hay không. Vì đây là biến dữ liệu định tính nên kết quả cho ra là sai
is.vector(TravelMode$wait)
## [1] TRUE
Kiểm tra xem biến wait(thời gian chờ đợi trước khi phương tiện di chuyển) có phải là một vector hay không. Vì đây là một biến định lượng nên kết quả cho ra là đúng.

Nối các vector thành một bộ dữ liệu

A1 <- d$G 
is.vector(A1) 
## [1] TRUE
Kiểm tra A1 có phải là một vector hay không
A1 <- as.data.frame(A1) 
B1 <- seq(1,1,length=10) 
A1$B1 <- B1 
Trên đây là bộ dữ liệu A1, được lấy từ dữ liệu của cột chi phí chung của bộ dữ liệu TravelMode
A2 <- d$V 
is.vector(A2)
## [1] TRUE
Kiểm tra A2 có phải là một vector hay không
A2 <- as.data.frame(A2) 
B2 <- seq(1,1, length=10) 
A2$B2 <- B2 
Trên đây là bộ dữ liệu A2, được lấy từ cột chi phí phương tiện của bộ dữ liệu TravelMode

Tiếp theo ta tiến hành nối 2 bộ dữ liệu A1,A2 vào thành một bộ dữ liệu A

A <- left_join(A1,A2, by = c("B1"="B2"), relationship ='many-to-many')
Bộ dữ liệu A là kết quả sau khi đã được dùng lệnh left_join trong package-dplyr để nối 2 bộ dữ liệu A1 và A2 với biến chung là biến B1

Bài tập tuần 1

TravelMode - Package:AER

Mô tả: Dữ liệu về lựa chọn phương thức di chuyển cho hành trình giữa Sydney, Melbourne và Úc. Một data frame chứa 840 quan sát trên 4 chế độ cho 210 mẫu, gồm có 9 biến

individual: Hệ số biểu thị cá nhân có cấp độ từ 1 đến 210

mode: Phương thức di chuyển với những lựa chọn là “ô tô”, “máy bay”, “tàu hỏa” hoặc “xe buýt”

choice: Yếu tố thể hiện sự lựa chọn với mức độ “không” và “có”.

wait: Thời gian chờ đợi trước khi phương tiện hành khách chọn xuất phát, số 0 thể hiện cho ô tô

vcost: Chi phí phương tiện

travel: Thời gian di chuyển trên xe.

gcost: Đo lường chi phí chung.

income: Thu nhập hộ gia đình.

size: Quy mô bữa tiệc (Biến định tính có các cấp độ từ 1 đến 6 biểu hiện sự biến động từ “nhỏ nhất, nhỏ, trung bình, vừa, lớn và rất lớn”)

library(AER)
# Lấy dữ liệu của datashet TravelMode
data("TravelMode")
# Gán dữ liệu của TravelMode cho biến d
d <- TravelMode
# Mô tả chi tiết kiểu biến số của datashet TravelMode
str(d)
## 'data.frame':    840 obs. of  9 variables:
##  $ individual: Factor w/ 210 levels "1","2","3","4",..: 1 1 1 1 2 2 2 2 3 3 ...
##  $ mode      : Factor w/ 4 levels "air","train",..: 1 2 3 4 1 2 3 4 1 2 ...
##  $ choice    : Factor w/ 2 levels "no","yes": 1 1 1 2 1 1 1 2 1 1 ...
##  $ wait      : int  69 34 35 0 64 44 53 0 69 34 ...
##  $ vcost     : int  59 31 25 10 58 31 25 11 115 98 ...
##  $ travel    : int  100 372 417 180 68 354 399 255 125 892 ...
##  $ gcost     : int  70 71 70 30 68 84 85 50 129 195 ...
##  $ income    : int  35 35 35 35 30 30 30 30 40 40 ...
##  $ size      : int  1 1 1 1 2 2 2 2 1 1 ...
# Lấy dữ liệu của 6 dòng đầu của biến d
head(d)
##   individual  mode choice wait vcost travel gcost income size
## 1          1   air     no   69    59    100    70     35    1
## 2          1 train     no   34    31    372    71     35    1
## 3          1   bus     no   35    25    417    70     35    1
## 4          1   car    yes    0    10    180    30     35    1
## 5          2   air     no   64    58     68    68     30    2
## 6          2 train     no   44    31    354    84     30    2
# Gán tên viết tắt cho các biến để dễ thao tác
names(d) <- c('I','M','C','W','V','T','G','IN','S')
# Lấy dữ liệu của biến V
Vco <- d$V
# Chi phí phương tiện lớn hơn 50
Vco50 <- Vco[Vco>50]
# Chi phí phương tiện lớn hơn 30 và nhỏ hơn 100
Vco30100 <- Vco[Vco>30&Vco<100]
# Lấy dữ liệu của biến T
Tra <- d$T
# Lấy dữ liệu của biến G
Gco <- d$G
#Xem dữ liệu thứ 10 của biến G
Gco[10]
## [1] 195
# Tổng giá trị của V,T và G
tongTVG <- d$T+d$V+d$G
tongTVG
##   [1]  229  474  512  220  194  469  509  316  369 1185 1084  844  176  459  501
##  [16]  217  286  529  569  707  229  422  488  339  423 1269 1168  982  410 1090
##  [31] 1075  965  229  474  512  267  191  457  495  247  194  443  488  250  249
##  [46]  494  534  300  222  483  525  286  224  476  516  358  361 1232 1174 1416
##  [61]  260  399  532  416  204  359  483  375  229  375  481  397  282  374  533
##  [76]  505  223  408  449  382  203  380  468  374  395  626  751  670  400  803
##  [91]  718  706  362  801  716  706  242  431  474  346  331 1249 1148 1211  272
## [106]  848  763  722  331  842  828  720  354  454  440  388  229  338  488  341
## [121]  230  367  515  355  227  424  507  399  202  392  507  380  198  389  478
## [136]  374  267  395  466  367  250  406  521  374  336  463  590  514  177  367
## [151]  480  367  273  465  560  412  405  943  859  753  372  801  716  688  409
## [166]  811  726  699  432  870  785  755  321  857  772  699  342  787  772  689
## [181]  423  874  790  744  295  825  740  691  223  466  504  373  236  428  474
## [196]  371  348  943  859  755  307  929  844  764  308  877  829  692  256  453
## [211]  526  394  220  436  530  403  174  378  481  372  404 1032 1071 1080  496
## [226] 1031 1153 1174  389 1044 1101 1029  397  994 1077 1055  313 1049 1053 1017
## [241]  427 1078 1107 1137  623 1058 1129 1137  374 1080 1172 1060  359  931  996
## [256] 1010  421  967 1102 1045  349 1202  936 1083  483 1474 1372 1158  412 1190
## [271] 1020 1063  370 1058 1152 1054  423 1031 1102 1072  437  508 1187 1087  341
## [286]  903 1061 1030  481  966 1274 1166  430  972 1024 1108  432 1143 1136 1058
## [301]  373 1113 1113 1130  344 1047 1020 1031  413 1194 1178  881  321 1184 1134
## [316] 1678  396 1181  956 1044  468 1202 1240 1089  203  454  456  217  226  377
## [331]  483  402  245  494  519  387  291  825  740  697  194  390  500  383  254
## [346]  436  441  286  202  374  493  392  254  466  465  317  205  382  500  383
## [361]  195  395  437  372  253  437  523  432  292  826  741  445  393  457  497
## [376]  367  357 1251 1149 1059  367  928  843  746  284  487  395  414  537 1270
## [391] 1169 1071  454 1251 1343 1111  418 1261 1187  932  241  479  449  435  327
## [406] 1165 1115  855  225  437  481  359  396 1188 1087 1148  431 1253 1152 1698
## [421]  406 1262  937 1082  416 1177 1076  866  324 1172 1114 1024  286  529  569
## [436]  327  358 1207 1149  853  254  486  524  290  447 1268 1166  867  308  460
## [451]  500  377  220  647  687  479  265  520  558  323  248  474  512  399  189
## [466]  455  308  381  463 1168 1017 1067  407 1184 1083 1006  235  457  495  384
## [481]  265  431  477  348  508 1219 1118  995  404 1223 1122 1127  369 1161 1146
## [496] 1036  405 1278  824 1076  402 1199  957 1078  365 1269 1196 1028  376 1172
## [511]  970 1044  236  474  512  359  259  507  518  435  391 1191 1090  764  337
## [526] 1161 1088  792  433 1254 1106 1077  371 1079  859 1052  390 1315 1213  828
## [541]  413 1308 1292  867  380 1195 1094  903  387 1194 1072 1080  316 1139  957
## [556]  985  287 1148 1075  715  390  987 1089 1054  497 1070 1088 1056  416 1093
## [571] 1205 1081  376 1006 1125 1044  402  926 1061 1039  390  949 1013 1052  383
## [586]  903 1066 1033  395  923 1151 1072  477 1116 1172 1149  487 1197 1096 1065
## [601]  403 1096 1081 1078  481 1329 1189 1162  596 1266 1164 1146  449 1178 1077
## [616] 1046  258  476  516  400  229  468  509  371  537 1310 1168 1143  380 1334
## [631] 1233 1180  275  505  545  396  246  547  589  345  240  442  480  366  293
## [646]  473  511  376  321 1018  957  563  297  884  836  661  295  837  777  603
## [661]  316  916  831  731  308  821  772  634  286  839  801  551  267  816  731
## [676]  548  309  876  815  700  347 1023  938  590  203  454  304  376  267  502
## [691]  308  417  311  850  713  701  248  504  542  234  528 1347 1023 1201  215
## [706]  461  369  357  244  493  311  396  242  837  752  726  301  463  503  383
## [721]  209  496  534  357  252  490  528  327  205  525  510  389  376  565  473
## [736]  388  201  382  496  377  279  827  778  697  183  431  474  375  214  451
## [751]  493  370  229  474  512  259  197  421  420  302  328  541  546  285  280
## [766]  470  508  367  257  447  485  375  419  879  591  752  169  336  483  381
## [781]  223  423  424  376  222  461  498  319  338  803  718  694  220  461  501
## [796]  349  218  484  526  394  410 1102 1009  955  312  852  768  657  245  451
## [811]  438  405  193  458  351  366  374 1152  929 1036  299  809  724  858  402
## [826]  801  716  704  213  429  351  359  299  740  726  619  293  880  831  646
#Phân tổ dữ liệu cho biến thu nhập(income), phân tổ thành 4 tổ
Inc <- d$IN
cut(Inc,4)
##   [1] (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]  
##   [7] (19.5,37]   (19.5,37]   (37,54.5]   (37,54.5]   (37,54.5]   (37,54.5]  
##  [13] (54.5,72.1] (54.5,72.1] (54.5,72.1] (54.5,72.1] (37,54.5]   (37,54.5]  
##  [19] (37,54.5]   (37,54.5]   (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]  
##  [25] (37,54.5]   (37,54.5]   (37,54.5]   (37,54.5]   (1.93,19.5] (1.93,19.5]
##  [31] (1.93,19.5] (1.93,19.5] (37,54.5]   (37,54.5]   (37,54.5]   (37,54.5]  
##  [37] (54.5,72.1] (54.5,72.1] (54.5,72.1] (54.5,72.1] (1.93,19.5] (1.93,19.5]
##  [43] (1.93,19.5] (1.93,19.5] (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]  
##  [49] (37,54.5]   (37,54.5]   (37,54.5]   (37,54.5]   (37,54.5]   (37,54.5]  
##  [55] (37,54.5]   (37,54.5]   (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]  
##  [61] (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]  
##  [67] (19.5,37]   (19.5,37]   (1.93,19.5] (1.93,19.5] (1.93,19.5] (1.93,19.5]
##  [73] (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]   (54.5,72.1] (54.5,72.1]
##  [79] (54.5,72.1] (54.5,72.1] (1.93,19.5] (1.93,19.5] (1.93,19.5] (1.93,19.5]
##  [85] (1.93,19.5] (1.93,19.5] (1.93,19.5] (1.93,19.5] (37,54.5]   (37,54.5]  
##  [91] (37,54.5]   (37,54.5]   (37,54.5]   (37,54.5]   (37,54.5]   (37,54.5]  
##  [97] (1.93,19.5] (1.93,19.5] (1.93,19.5] (1.93,19.5] (54.5,72.1] (54.5,72.1]
## [103] (54.5,72.1] (54.5,72.1] (37,54.5]   (37,54.5]   (37,54.5]   (37,54.5]  
## [109] (1.93,19.5] (1.93,19.5] (1.93,19.5] (1.93,19.5] (1.93,19.5] (1.93,19.5]
## [115] (1.93,19.5] (1.93,19.5] (1.93,19.5] (1.93,19.5] (1.93,19.5] (1.93,19.5]
## [121] (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]   (37,54.5]   (37,54.5]  
## [127] (37,54.5]   (37,54.5]   (54.5,72.1] (54.5,72.1] (54.5,72.1] (54.5,72.1]
## [133] (1.93,19.5] (1.93,19.5] (1.93,19.5] (1.93,19.5] (37,54.5]   (37,54.5]  
## [139] (37,54.5]   (37,54.5]   (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]  
## [145] (37,54.5]   (37,54.5]   (37,54.5]   (37,54.5]   (1.93,19.5] (1.93,19.5]
## [151] (1.93,19.5] (1.93,19.5] (1.93,19.5] (1.93,19.5] (1.93,19.5] (1.93,19.5]
## [157] (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]  
## [163] (19.5,37]   (19.5,37]   (54.5,72.1] (54.5,72.1] (54.5,72.1] (54.5,72.1]
## [169] (54.5,72.1] (54.5,72.1] (54.5,72.1] (54.5,72.1] (37,54.5]   (37,54.5]  
## [175] (37,54.5]   (37,54.5]   (1.93,19.5] (1.93,19.5] (1.93,19.5] (1.93,19.5]
## [181] (54.5,72.1] (54.5,72.1] (54.5,72.1] (54.5,72.1] (19.5,37]   (19.5,37]  
## [187] (19.5,37]   (19.5,37]   (37,54.5]   (37,54.5]   (37,54.5]   (37,54.5]  
## [193] (1.93,19.5] (1.93,19.5] (1.93,19.5] (1.93,19.5] (19.5,37]   (19.5,37]  
## [199] (19.5,37]   (19.5,37]   (54.5,72.1] (54.5,72.1] (54.5,72.1] (54.5,72.1]
## [205] (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]  
## [211] (19.5,37]   (19.5,37]   (37,54.5]   (37,54.5]   (37,54.5]   (37,54.5]  
## [217] (1.93,19.5] (1.93,19.5] (1.93,19.5] (1.93,19.5] (19.5,37]   (19.5,37]  
## [223] (19.5,37]   (19.5,37]   (1.93,19.5] (1.93,19.5] (1.93,19.5] (1.93,19.5]
## [229] (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]  
## [235] (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]  
## [241] (1.93,19.5] (1.93,19.5] (1.93,19.5] (1.93,19.5] (1.93,19.5] (1.93,19.5]
## [247] (1.93,19.5] (1.93,19.5] (1.93,19.5] (1.93,19.5] (1.93,19.5] (1.93,19.5]
## [253] (1.93,19.5] (1.93,19.5] (1.93,19.5] (1.93,19.5] (1.93,19.5] (1.93,19.5]
## [259] (1.93,19.5] (1.93,19.5] (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]  
## [265] (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]  
## [271] (19.5,37]   (19.5,37]   (54.5,72.1] (54.5,72.1] (54.5,72.1] (54.5,72.1]
## [277] (54.5,72.1] (54.5,72.1] (54.5,72.1] (54.5,72.1] (1.93,19.5] (1.93,19.5]
## [283] (1.93,19.5] (1.93,19.5] (1.93,19.5] (1.93,19.5] (1.93,19.5] (1.93,19.5]
## [289] (1.93,19.5] (1.93,19.5] (1.93,19.5] (1.93,19.5] (1.93,19.5] (1.93,19.5]
## [295] (1.93,19.5] (1.93,19.5] (1.93,19.5] (1.93,19.5] (1.93,19.5] (1.93,19.5]
## [301] (1.93,19.5] (1.93,19.5] (1.93,19.5] (1.93,19.5] (19.5,37]   (19.5,37]  
## [307] (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]  
## [313] (54.5,72.1] (54.5,72.1] (54.5,72.1] (54.5,72.1] (19.5,37]   (19.5,37]  
## [319] (19.5,37]   (19.5,37]   (54.5,72.1] (54.5,72.1] (54.5,72.1] (54.5,72.1]
## [325] (54.5,72.1] (54.5,72.1] (54.5,72.1] (54.5,72.1] (1.93,19.5] (1.93,19.5]
## [331] (1.93,19.5] (1.93,19.5] (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]  
## [337] (54.5,72.1] (54.5,72.1] (54.5,72.1] (54.5,72.1] (54.5,72.1] (54.5,72.1]
## [343] (54.5,72.1] (54.5,72.1] (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]  
## [349] (1.93,19.5] (1.93,19.5] (1.93,19.5] (1.93,19.5] (19.5,37]   (19.5,37]  
## [355] (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]  
## [361] (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]   (1.93,19.5] (1.93,19.5]
## [367] (1.93,19.5] (1.93,19.5] (54.5,72.1] (54.5,72.1] (54.5,72.1] (54.5,72.1]
## [373] (37,54.5]   (37,54.5]   (37,54.5]   (37,54.5]   (37,54.5]   (37,54.5]  
## [379] (37,54.5]   (37,54.5]   (54.5,72.1] (54.5,72.1] (54.5,72.1] (54.5,72.1]
## [385] (1.93,19.5] (1.93,19.5] (1.93,19.5] (1.93,19.5] (19.5,37]   (19.5,37]  
## [391] (19.5,37]   (19.5,37]   (37,54.5]   (37,54.5]   (37,54.5]   (37,54.5]  
## [397] (54.5,72.1] (54.5,72.1] (54.5,72.1] (54.5,72.1] (19.5,37]   (19.5,37]  
## [403] (19.5,37]   (19.5,37]   (37,54.5]   (37,54.5]   (37,54.5]   (37,54.5]  
## [409] (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]  
## [415] (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]  
## [421] (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]  
## [427] (19.5,37]   (19.5,37]   (37,54.5]   (37,54.5]   (37,54.5]   (37,54.5]  
## [433] (54.5,72.1] (54.5,72.1] (54.5,72.1] (54.5,72.1] (37,54.5]   (37,54.5]  
## [439] (37,54.5]   (37,54.5]   (54.5,72.1] (54.5,72.1] (54.5,72.1] (54.5,72.1]
## [445] (54.5,72.1] (54.5,72.1] (54.5,72.1] (54.5,72.1] (19.5,37]   (19.5,37]  
## [451] (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]  
## [457] (54.5,72.1] (54.5,72.1] (54.5,72.1] (54.5,72.1] (37,54.5]   (37,54.5]  
## [463] (37,54.5]   (37,54.5]   (37,54.5]   (37,54.5]   (37,54.5]   (37,54.5]  
## [469] (1.93,19.5] (1.93,19.5] (1.93,19.5] (1.93,19.5] (19.5,37]   (19.5,37]  
## [475] (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]  
## [481] (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]  
## [487] (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]  
## [493] (1.93,19.5] (1.93,19.5] (1.93,19.5] (1.93,19.5] (19.5,37]   (19.5,37]  
## [499] (19.5,37]   (19.5,37]   (37,54.5]   (37,54.5]   (37,54.5]   (37,54.5]  
## [505] (37,54.5]   (37,54.5]   (37,54.5]   (37,54.5]   (19.5,37]   (19.5,37]  
## [511] (19.5,37]   (19.5,37]   (54.5,72.1] (54.5,72.1] (54.5,72.1] (54.5,72.1]
## [517] (1.93,19.5] (1.93,19.5] (1.93,19.5] (1.93,19.5] (37,54.5]   (37,54.5]  
## [523] (37,54.5]   (37,54.5]   (54.5,72.1] (54.5,72.1] (54.5,72.1] (54.5,72.1]
## [529] (54.5,72.1] (54.5,72.1] (54.5,72.1] (54.5,72.1] (1.93,19.5] (1.93,19.5]
## [535] (1.93,19.5] (1.93,19.5] (54.5,72.1] (54.5,72.1] (54.5,72.1] (54.5,72.1]
## [541] (1.93,19.5] (1.93,19.5] (1.93,19.5] (1.93,19.5] (37,54.5]   (37,54.5]  
## [547] (37,54.5]   (37,54.5]   (37,54.5]   (37,54.5]   (37,54.5]   (37,54.5]  
## [553] (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]  
## [559] (19.5,37]   (19.5,37]   (1.93,19.5] (1.93,19.5] (1.93,19.5] (1.93,19.5]
## [565] (1.93,19.5] (1.93,19.5] (1.93,19.5] (1.93,19.5] (1.93,19.5] (1.93,19.5]
## [571] (1.93,19.5] (1.93,19.5] (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]  
## [577] (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]   (1.93,19.5] (1.93,19.5]
## [583] (1.93,19.5] (1.93,19.5] (1.93,19.5] (1.93,19.5] (1.93,19.5] (1.93,19.5]
## [589] (37,54.5]   (37,54.5]   (37,54.5]   (37,54.5]   (37,54.5]   (37,54.5]  
## [595] (37,54.5]   (37,54.5]   (54.5,72.1] (54.5,72.1] (54.5,72.1] (54.5,72.1]
## [601] (1.93,19.5] (1.93,19.5] (1.93,19.5] (1.93,19.5] (37,54.5]   (37,54.5]  
## [607] (37,54.5]   (37,54.5]   (54.5,72.1] (54.5,72.1] (54.5,72.1] (54.5,72.1]
## [613] (54.5,72.1] (54.5,72.1] (54.5,72.1] (54.5,72.1] (37,54.5]   (37,54.5]  
## [619] (37,54.5]   (37,54.5]   (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]  
## [625] (54.5,72.1] (54.5,72.1] (54.5,72.1] (54.5,72.1] (54.5,72.1] (54.5,72.1]
## [631] (54.5,72.1] (54.5,72.1] (37,54.5]   (37,54.5]   (37,54.5]   (37,54.5]  
## [637] (37,54.5]   (37,54.5]   (37,54.5]   (37,54.5]   (54.5,72.1] (54.5,72.1]
## [643] (54.5,72.1] (54.5,72.1] (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]  
## [649] (37,54.5]   (37,54.5]   (37,54.5]   (37,54.5]   (54.5,72.1] (54.5,72.1]
## [655] (54.5,72.1] (54.5,72.1] (37,54.5]   (37,54.5]   (37,54.5]   (37,54.5]  
## [661] (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]   (37,54.5]   (37,54.5]  
## [667] (37,54.5]   (37,54.5]   (37,54.5]   (37,54.5]   (37,54.5]   (37,54.5]  
## [673] (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]   (37,54.5]   (37,54.5]  
## [679] (37,54.5]   (37,54.5]   (37,54.5]   (37,54.5]   (37,54.5]   (37,54.5]  
## [685] (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]  
## [691] (19.5,37]   (19.5,37]   (1.93,19.5] (1.93,19.5] (1.93,19.5] (1.93,19.5]
## [697] (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]  
## [703] (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]  
## [709] (37,54.5]   (37,54.5]   (37,54.5]   (37,54.5]   (37,54.5]   (37,54.5]  
## [715] (37,54.5]   (37,54.5]   (54.5,72.1] (54.5,72.1] (54.5,72.1] (54.5,72.1]
## [721] (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]  
## [727] (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]  
## [733] (1.93,19.5] (1.93,19.5] (1.93,19.5] (1.93,19.5] (19.5,37]   (19.5,37]  
## [739] (19.5,37]   (19.5,37]   (37,54.5]   (37,54.5]   (37,54.5]   (37,54.5]  
## [745] (1.93,19.5] (1.93,19.5] (1.93,19.5] (1.93,19.5] (19.5,37]   (19.5,37]  
## [751] (19.5,37]   (19.5,37]   (37,54.5]   (37,54.5]   (37,54.5]   (37,54.5]  
## [757] (54.5,72.1] (54.5,72.1] (54.5,72.1] (54.5,72.1] (1.93,19.5] (1.93,19.5]
## [763] (1.93,19.5] (1.93,19.5] (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]  
## [769] (54.5,72.1] (54.5,72.1] (54.5,72.1] (54.5,72.1] (1.93,19.5] (1.93,19.5]
## [775] (1.93,19.5] (1.93,19.5] (1.93,19.5] (1.93,19.5] (1.93,19.5] (1.93,19.5]
## [781] (1.93,19.5] (1.93,19.5] (1.93,19.5] (1.93,19.5] (19.5,37]   (19.5,37]  
## [787] (19.5,37]   (19.5,37]   (37,54.5]   (37,54.5]   (37,54.5]   (37,54.5]  
## [793] (54.5,72.1] (54.5,72.1] (54.5,72.1] (54.5,72.1] (37,54.5]   (37,54.5]  
## [799] (37,54.5]   (37,54.5]   (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]  
## [805] (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]   (1.93,19.5] (1.93,19.5]
## [811] (1.93,19.5] (1.93,19.5] (19.5,37]   (19.5,37]   (19.5,37]   (19.5,37]  
## [817] (37,54.5]   (37,54.5]   (37,54.5]   (37,54.5]   (37,54.5]   (37,54.5]  
## [823] (37,54.5]   (37,54.5]   (37,54.5]   (37,54.5]   (37,54.5]   (37,54.5]  
## [829] (1.93,19.5] (1.93,19.5] (1.93,19.5] (1.93,19.5] (19.5,37]   (19.5,37]  
## [835] (19.5,37]   (19.5,37]   (54.5,72.1] (54.5,72.1] (54.5,72.1] (54.5,72.1]
## Levels: (1.93,19.5] (19.5,37] (37,54.5] (54.5,72.1]
table(cut(Inc,4))
## 
## (1.93,19.5]   (19.5,37]   (37,54.5] (54.5,72.1] 
##         204         284         196         156
#Phân tổ dữ liệu cho biến Choice
Choi <- d$C
table(Choi)
## Choi
##  no yes 
## 630 210