BTVN Tuan 1 anscombe mô tả: Bốn tập dữ liệu xx-yy có cùng thuộc tính thống kê truyền thống (giá trị trung bình, phương sai, tương quan, đường hồi quy, v.v.), nhưng lại hoàn toàn khác nhau. #Lấy dữ liệu của data shet anscombe

data("anscombe")

#gán dữ liệu của anscombe cho t

t <- anscombe

#mô tả chi tiết dữ liệu của data shet anscombe

str(t)
## 'data.frame':    11 obs. of  8 variables:
##  $ x1: num  10 8 13 9 11 14 6 4 12 7 ...
##  $ x2: num  10 8 13 9 11 14 6 4 12 7 ...
##  $ x3: num  10 8 13 9 11 14 6 4 12 7 ...
##  $ x4: num  8 8 8 8 8 8 8 19 8 8 ...
##  $ y1: num  8.04 6.95 7.58 8.81 8.33 ...
##  $ y2: num  9.14 8.14 8.74 8.77 9.26 8.1 6.13 3.1 9.13 7.26 ...
##  $ y3: num  7.46 6.77 12.74 7.11 7.81 ...
##  $ y4: num  6.58 5.76 7.71 8.84 8.47 7.04 5.25 12.5 5.56 7.91 ...

#hiện 6 dòng đầu tiên của dữ liệu

head(t)
##   x1 x2 x3 x4   y1   y2    y3   y4
## 1 10 10 10  8 8.04 9.14  7.46 6.58
## 2  8  8  8  8 6.95 8.14  6.77 5.76
## 3 13 13 13  8 7.58 8.74 12.74 7.71
## 4  9  9  9  8 8.81 8.77  7.11 8.84
## 5 11 11 11  8 8.33 9.26  7.81 8.47
## 6 14 14 14  8 9.96 8.10  8.84 7.04

#hiện 6 dòng cuối của dữ liệu

tail(t)
##    x1 x2 x3 x4    y1   y2   y3    y4
## 6  14 14 14  8  9.96 8.10 8.84  7.04
## 7   6  6  6  8  7.24 6.13 6.08  5.25
## 8   4  4  4 19  4.26 3.10 5.39 12.50
## 9  12 12 12  8 10.84 9.13 8.15  5.56
## 10  7  7  7  8  4.82 7.26 6.42  7.91
## 11  5  5  5  8  5.68 4.74 5.73  6.89

#lấy dữ liệu của biến y1

Y1 <- t$y1

#lấy dữ liệu y1 > 8.5

Y1 <- Y1[Y1 > 8.5]

#lấy dữ liệu y1 lớn hơn 7 và nhỏ hơn 9

Y179 <- Y1[Y1>7&Y1<9]

#phân tổ Y1 thành 3 tổ

table(cut(Y1,3))
## 
## (8.81,9.49] (9.49,10.2] (10.2,10.8] 
##           1           1           1

#lấy dữ liệu từ hàng 3 cột 3

t[3,3]
## [1] 13