#K hoá học sử dụng R- Ngày 1 ## Việc 3: đọc dữ liệu Yêu cầu đọc dữ liệu birthwt.crv vào R t= file.choose()

bw=read.csv("/Users/trinhvananh/Desktop/R/DỮ LIỆU THỰC HÀNH (TS Thạch gửi)/birthwt.csv")
##Việc 4: kiểm tra dữ liệu
###4.1. Tìm quan sát và biến số
dim(bw)
## [1] 189  11
head(bw)
##   id low age lwt race smoke ptl ht ui ftv  bwt
## 1 85   0  19 182    2     0   0  0  1   0 2523
## 2 86   0  33 155    3     0   0  0  0   3 2551
## 3 87   0  20 105    1     1   0  0  0   1 2557
## 4 88   0  21 108    1     1   0  0  1   2 2594
## 5 89   0  18 107    1     1   0  0  1   0 2600
## 6 91   0  21 124    3     0   0  0  0   0 2622
###4.3. Hỏi chatGPT đọc 10 dòng cuối
tail(bw, 10)
##     id low age lwt race smoke ptl ht ui ftv  bwt
## 180 71   1  17 120    2     0   0  0  0   2 2438
## 181 75   1  26 154    3     0   1  1  0   1 2442
## 182 76   1  20 105    3     0   0  0  0   3 2450
## 183 77   1  26 190    1     1   0  0  0   0 2466
## 184 78   1  14 101    3     1   1  0  0   0 2466
## 185 79   1  28  95    1     1   0  0  0   2 2466
## 186 81   1  14 100    3     0   0  0  0   2 2495
## 187 82   1  23  94    3     1   0  0  0   0 2495
## 188 83   1  17 142    2     0   0  1  0   0 2495
## 189 84   1  21 130    1     1   0  1  0   3 2495
## Việc 5: Biên tập dữ liệu
###5.1. Tạo biến số mới mwt là cân nặng của mẹ tính bằng kg
bw$mwt2= bw$lwt*0.45
head(bw)
##   id low age lwt race smoke ptl ht ui ftv  bwt  mwt2
## 1 85   0  19 182    2     0   0  0  1   0 2523 81.90
## 2 86   0  33 155    3     0   0  0  0   3 2551 69.75
## 3 87   0  20 105    1     1   0  0  0   1 2557 47.25
## 4 88   0  21 108    1     1   0  0  1   2 2594 48.60
## 5 89   0  18 107    1     1   0  0  1   0 2600 48.15
## 6 91   0  21 124    3     0   0  0  0   0 2622 55.80
###5.2. tạo biến ethnicity
### 5.3.tạo tập tin bw1
bw1=bw[,c("id", "low", "bwt")]
###5.4 Tạo 1 tập dữ liệu bw3 chỉ gồm những thai phụ có cân nặng thấp (low = 1)
bw3= subset(bw, low==1)
###5.5 Tạo 1 tập dữ liệu bw4 chỉ gồm những thai phụ có cân nặng thấp (low = 1) và có hút thuốc trong lúc mang thai (smoke = 1). 
bw4= subset(bw, low==1 & smoke==1)

head(bw4)
##     id low age lwt race smoke ptl ht ui ftv  bwt  mwt2
## 131  4   1  28 120    3     1   1  0  1   0  709 54.00
## 133 11   1  34 187    2     1   0  1  0   0 1135 84.15
## 140 20   1  21 165    1     1   0  1  0   1 1790 74.25
## 141 22   1  32 105    1     1   0  0  0   0 1818 47.25
## 142 23   1  19  91    1     1   2  0  1   0 1885 40.95
## 145 26   1  25  92    1     1   0  0  0   0 1928 41.40