BTVN Tuan 1 anscombe mô tả: Bốn tập dữ liệu xx-yy có cùng thuộc tính thống kê truyền thống (giá trị trung bình, phương sai, tương quan, đường hồi quy, v.v.), nhưng lại hoàn toàn khác nhau. #Lấy dữ liệu của data shet anscombe
data("anscombe")
#gán dữ liệu của anscombe cho t
t <- anscombe
#mô tả chi tiết dữ liệu của data shet anscombe
str(t)
## 'data.frame': 11 obs. of 8 variables:
## $ x1: num 10 8 13 9 11 14 6 4 12 7 ...
## $ x2: num 10 8 13 9 11 14 6 4 12 7 ...
## $ x3: num 10 8 13 9 11 14 6 4 12 7 ...
## $ x4: num 8 8 8 8 8 8 8 19 8 8 ...
## $ y1: num 8.04 6.95 7.58 8.81 8.33 ...
## $ y2: num 9.14 8.14 8.74 8.77 9.26 8.1 6.13 3.1 9.13 7.26 ...
## $ y3: num 7.46 6.77 12.74 7.11 7.81 ...
## $ y4: num 6.58 5.76 7.71 8.84 8.47 7.04 5.25 12.5 5.56 7.91 ...
#hiện 6 dòng đầu tiên của dữ liệu
head(t)
## x1 x2 x3 x4 y1 y2 y3 y4
## 1 10 10 10 8 8.04 9.14 7.46 6.58
## 2 8 8 8 8 6.95 8.14 6.77 5.76
## 3 13 13 13 8 7.58 8.74 12.74 7.71
## 4 9 9 9 8 8.81 8.77 7.11 8.84
## 5 11 11 11 8 8.33 9.26 7.81 8.47
## 6 14 14 14 8 9.96 8.10 8.84 7.04
#hiện 6 dòng cuối của dữ liệu
tail(t)
## x1 x2 x3 x4 y1 y2 y3 y4
## 6 14 14 14 8 9.96 8.10 8.84 7.04
## 7 6 6 6 8 7.24 6.13 6.08 5.25
## 8 4 4 4 19 4.26 3.10 5.39 12.50
## 9 12 12 12 8 10.84 9.13 8.15 5.56
## 10 7 7 7 8 4.82 7.26 6.42 7.91
## 11 5 5 5 8 5.68 4.74 5.73 6.89
#lấy dữ liệu của biến y1
Y1 <- t$y1
#lấy dữ liệu y1 > 8.5
Y1 <- Y1[Y1 > 8.5]
#lấy dữ liệu y1 lớn hơn 7 và nhỏ hơn 9
Y179 <- Y1[Y1>7&Y1<9]
#phân tổ Y1 thành 3 tổ
table(cut(Y1,3))
##
## (8.81,9.49] (9.49,10.2] (10.2,10.8]
## 1 1 1
#lấy dữ liệu từ hàng 3 cột 3
t[3,3]
## [1] 13