Việc 4. Thông tin về dữ liệu bw này Có bao nhiêu biến số (variable) và quan sát (observation) Liệt kê 6 quan sát đầu tiên của dữ liệu
Liệt kê 6 quan sát đầu tiên của dữ liệu
head(bw)
## id low age lwt race smoke ptl ht ui ftv bwt
## 1 85 0 19 182 2 0 0 0 1 0 2523
## 2 86 0 33 155 3 0 0 0 0 3 2551
## 3 87 0 20 105 1 1 0 0 0 1 2557
## 4 88 0 21 108 1 1 0 0 1 2 2594
## 5 89 0 18 107 1 1 0 0 1 0 2600
## 6 91 0 21 124 3 0 0 0 0 0 2622
Cho biết lệnh R để đọc 10 dòng cuối của bw
tail(bw, 10)
## id low age lwt race smoke ptl ht ui ftv bwt
## 180 71 1 17 120 2 0 0 0 0 2 2438
## 181 75 1 26 154 3 0 1 1 0 1 2442
## 182 76 1 20 105 3 0 0 0 0 3 2450
## 183 77 1 26 190 1 1 0 0 0 0 2466
## 184 78 1 14 101 3 1 1 0 0 0 2466
## 185 79 1 28 95 1 1 0 0 0 2 2466
## 186 81 1 14 100 3 0 0 0 0 2 2495
## 187 82 1 23 94 3 1 0 0 0 0 2495
## 188 83 1 17 142 2 0 0 1 0 0 2495
## 189 84 1 21 130 1 1 0 1 0 3 2495
Việc 5. Biên tập dữ liệu, 5.1 Tạo biến số mới mwt; bw$mwtmình phải thêm $ để biết biến số mới ở tập tin nào
bw$mwt = bw$lwt*0.453592
5.2 Tạo biến số mới ethnicity là biến factor với điều kiện
bw$ethnicity[bw$race == 1] = "white"
bw$ethnicity[bw$race == 2] = "Black"
bw$ethnicity[bw$race == 3] = "Other"
table (bw$ethnicity,bw$race)
##
## 1 2 3
## Black 0 26 0
## Other 0 0 67
## white 96 0 0
5.3 Tạo 1 tập dữ liệu bw1 chỉ gồm 3 biến số id, low và bwt
bw1 = bw[, c("id", "low", "bwt")]
dim(bw)
## [1] 189 13
5.4 Tạo 1 tập dữ liệu bw3 chỉ gồm những thai phụ có cân nặng thấp (low = 1)
bw3 = subset(bw, low == 1)
dim(bw3)
## [1] 59 13
table (bw$low)
##
## 0 1
## 130 59
5.5 Tạo 1 tập dữ liệu bw4 chỉ gồm những thai phụ có cân nặng thấp (low = 1) và có hút thuốc trong lúc mang thai (smoke = 1)
bw4 = subset(bw, low == 1 & smoke == 1 & race == 1)
dim(bw4)
## [1] 19 13