Khóa học sử dụng R-Ngày 1

Việc 3: đọc dữ liệu

Đọc data birthwt vào R

Mở code–> insert chunk/ Ctrl + Alt + i

bw=read.csv("C:\\Users\\thuong.ntt\\Downloads\\R STUDIO 2025\\DỮ LIỆU THỰC HÀNH (TS Thạch gửi)\\birthwt.csv")

##Việc 4: ###bn dòng, bn cột

dim(bw)
## [1] 189  11

###tìm 6 dòng đầu tiên

head(bw, 6)
##   id low age lwt race smoke ptl ht ui ftv  bwt
## 1 85   0  19 182    2     0   0  0  1   0 2523
## 2 86   0  33 155    3     0   0  0  0   3 2551
## 3 87   0  20 105    1     1   0  0  0   1 2557
## 4 88   0  21 108    1     1   0  0  1   2 2594
## 5 89   0  18 107    1     1   0  0  1   0 2600
## 6 91   0  21 124    3     0   0  0  0   0 2622

###tìm 6 quan sát cuối cùng

tail(bw,6)
##     id low age lwt race smoke ptl ht ui ftv  bwt
## 184 78   1  14 101    3     1   1  0  0   0 2466
## 185 79   1  28  95    1     1   0  0  0   2 2466
## 186 81   1  14 100    3     0   0  0  0   2 2495
## 187 82   1  23  94    3     1   0  0  0   0 2495
## 188 83   1  17 142    2     0   0  1  0   0 2495
## 189 84   1  21 130    1     1   0  1  0   3 2495

##Việc 5:

bw$mwt=bw$lwt*0.453592

bw$race=factor(bw$race, levels = c("1","2","3", lables = c("white","black","others")))
#hoặc
library(dplyr)
## Warning: package 'dplyr' was built under R version 4.4.3
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
 bw$race1=recode(bw$race, '1'="white",'2'="black",'3'="others")
 
 #Hoặc
  bw$ethnicity <- ifelse(bw$race == 1, "black",
                     ifelse(bw$race == 2, "white", "others"))

###Việc 5.3 Tạo tập tin