BÀI TẬP VỀ NHÀ TUẦN 1 airquality mô tả: Đo chất lượng không khí hàng ngày ở New York, tháng 5 đến tháng 9 năm 1973 Một khung dữ liệu với 153 quan sát trên 6 biến. Ozone: số Ozone (ppb) Solar.R: số Solar R (lang) Wind: số Gió (mph) Temp: số Nhiệt độ (độ F) Month: số Tháng (1–12) Day: số Ngày trong tháng (1–31) Lấy dữ liệu của datashet airquality Dữ liệu được lấy từ Cục Bảo tồn Bang New York (dữ liệu ozone) và Dịch vụ Thời tiết Quốc gia (dữ liệu khí tượng).
# lấy dữ liệu của datashet airquality
data("airquality")
# gán dữ liệu của airquality cho d
d <- airquality
# mô tả chi tiết kiểu biến số của datashet airquality
str(d)
## 'data.frame': 153 obs. of 6 variables:
## $ Ozone : int 41 36 12 18 NA 28 23 19 8 NA ...
## $ Solar.R: int 190 118 149 313 NA NA 299 99 19 194 ...
## $ Wind : num 7.4 8 12.6 11.5 14.3 14.9 8.6 13.8 20.1 8.6 ...
## $ Temp : int 67 72 74 62 56 66 65 59 61 69 ...
## $ Month : int 5 5 5 5 5 5 5 5 5 5 ...
## $ Day : int 1 2 3 4 5 6 7 8 9 10 ...
hiện 6 dòng đầu tiên của dữ liệu
head(d)
## Ozone Solar.R Wind Temp Month Day
## 1 41 190 7.4 67 5 1
## 2 36 118 8.0 72 5 2
## 3 12 149 12.6 74 5 3
## 4 18 313 11.5 62 5 4
## 5 NA NA 14.3 56 5 5
## 6 28 NA 14.9 66 5 6
hiện 6 dòng cuối của dữ liệu
tail(d)
## Ozone Solar.R Wind Temp Month Day
## 148 14 20 16.6 63 9 25
## 149 30 193 6.9 70 9 26
## 150 NA 145 13.2 77 9 27
## 151 14 191 14.3 75 9 28
## 152 18 131 8.0 76 9 29
## 153 20 223 11.5 68 9 30
gán tên viết tắt cho các biến để dễ thao tác
names(d) <- c('O','S','W','T','M','D')
lấy dữ liệu của biến T
Temp <- d$T
#nhiệt độ lớn hơn 80 độ F
Temp <- Temp[Temp>80]
#Nhiệt độ lớn hơn 70 và nhỏ hơn 90 (độ F)
Temp7090 <- Temp[Temp>70&Temp<90]
Phân tổ Temp thành 4 tổ
table(cut(Temp,4))
##
## (81,85] (85,89] (89,93] (93,97]
## 34 17 13 4
lấy dữ liệu từ vị trí dòng 2 cột 5
d[2,5]
## [1] 5