Bài thực hành số 1

Bài tập 1

Hãy thực hiện các câu lệnh sau để có các véc tơ số xVec và yVec; hàm sample cho phép lấy ra một số ngẫu nhiên trong khoảng từ 0:999 và thực hiện lấy 250 số, tham số replce = T có nghĩa là có thể lấy lặp lại số đã có:

set.seed(50)
xVec <- sample(0:999, 250, replace=T) 
yVec <- sample(0:999, 250, replace=T)

Giả sử rằng $x=(x_{1},x_{2},...,x_{n})$ và $y=(y_{1},y_{2},...,y_{n})$ ký hiệu cho 2 véc tơ xVec và yVec:

Tạo ra véc tơ số có dạng sau: \[(x_{1}+2x_{2}-x_{3},x_{2}+2x_{3}-x{4},...,x_{n-2}+2x_{n-1}-x_{n})\]
Tính biểu thức sau: \[ \sum_{i=1}^{n-1} \frac{e^{-x_{i+1}}}{x_i+10} \]

# Ý a
# Chiều dài véc tơ xVec
n = length(xVec)
xVec[-c(n-1,n)] + 2*xVec[-c(1,n)] - xVec[-c(1,2)] -> kq1
print(length(kq1))

## [1] 248

# Ý b
sum(exp(-xVec[-1])/(xVec[-length(xVec)]+10))

## [1] 5.029496e-05

Bài 2:

Sử dụng các véc tơ xVec và yVec tạo ra từ bài tập số 1 và các hàm thống kê có sẵn trong R như mean, sqrt, sum and abs. Thực hiện các công việc sau:

Tìm và in ra tất cả các giá trị trong véc tơ yVec mà các giá trị đó > 600.
Tại các vị trí nào trong véc tơ yVec mà các giá trị lớn hơn 600.
Các giá trị nào trong véc tơ xVec có giá trị giống như trong yVec > 600 (các giá trị trong xVec và yVec cùng lớn hơn 600 tại cùng vị trí).
Có bao nhiêu giá trị trong véc tơ xVec chia hết cho 2 (số chẵn, sử dụng module 2 bằng phép tính %%)

# Ý a
print(yVec[yVec>600])

##  [1] 702 901 617 726 915 723 941 906 782 681 721 929 827 653 839 800 869 692 840
## [20] 845 769 866 696 685 788 642 902 797 601 656 842 970 680 792 662 868 875 795
## [39] 880 700 665 699 979 796 772 836 974 990 954 846 943 658 655 628 623 629 989
## [58] 738 992 758 870 910 933 641 872 904 647 988 753 624 996 621 714 965 920 755
## [77] 783 856 927 759 700 764 666 667 790 654 959 868 963 698 686

# Ý b
print(which(yVec>600))

##  [1]   3   9  10  18  20  22  25  26  27  29  37  41  42  43  45  48  49  51  65
## [20]  67  71  74  79  81  84  85  88  95  98  99 103 106 108 109 110 113 114 119
## [39] 120 129 130 131 138 139 143 147 148 152 154 159 161 166 167 168 172 173 174
## [58] 176 177 183 187 188 189 190 191 194 196 197 201 202 204 206 207 211 212 219
## [77] 223 224 225 227 229 230 233 235 238 239 240 243 246 248 249

# Ý c
xVec[yVec>600]

##  [1] 819 706 903 761 439 481 624 988 473 568 926 518 852 593  86 455 773 935 398
## [20] 755 335 500 810 755 233 125 332 440 811 385 591 345 610 221 646 261 640 206
## [39] 388 161 705 319 667 286 605  87 895 561 777 576 778 963 961 212 201 324 387
## [58] 770 258 232 438  25 376 218 665 708  78 762 227 873 390 113 839 757 397 601
## [77] 814 827  79 566 983   3 317 523 402 680 512 687 398 211 139

# Ý d
sum(xVec %% 2 == 0)

## [1] 117

# Ý e
yVec[c(TRUE, FALSE, FALSE)]

##  [1] 537  95 162 617 161  56 269 723 941  88 200  47 721 159 653  39 869 261  91
## [20] 528 397 273 845 559 453 263 696 566 642 902 253 158  71 519 842 970 792 284
## [39] 262  92 171 424 436 665 216 550 796 291 134 974 196 954 473  66 556 658 514
## [58] 623  86 208   0 386 870 641 242 647 496 624 116  48 965 189 360 328 783 214
## [77] 700 179 667 790 560  64 460 426

Bài số 3:

Hàm cumprod cho phép tính tích lũy của một dãy số. Sử dụng tính chất của hàm cumprod, hãy tính giá trị của biểu thức sau:

=1++( )+( )++( )

$$ Ví dụ hàm cumprod:

# Ví dụ về hàm cumprod
cumprod(1:4)

## [1]  1  2  6 24

1 + sum(cumprod(seq(2,38, by = 2)/seq(3,39, by = 2)))

## [1] 6.976346

Bài 4. Hãy đọc bài toán sau bằng tiếng Anh và giải quyết bài toán:

Assume that we have registered the height and weight for four people: Heights in cm are 180, 165, 160, 193; weights in kg are 87, 58, 65, 100. Make two vectors, height and weight, with the data. The bodymass index (BMI) is defined as:

\[ \frac{\text { weight in } \mathrm{kg}}{\text { (height in } \mathrm{m})^2} \]

Make a vector with the BMI values for the four people.
Make a vector with the weights for those people who have a BMI larger than 25.

# Create the vectors following the heights, weights
weight <- c(87, 58, 65,100)
height <- c(180,165,160,193)
data <- data.frame(weight, height)
bmi <- (data$weight)/(data$height/100)^2
print(data$weight[bmi>25])

## [1]  87  65 100

Bài 5:

Tập dữ liệu painters có trong thư viện MASS, để lấy tập dữ liệu này, thực hiện các lệnh sau:

#install.packages("MASS")
library(MASS)
data("painters")

Sau khi đã tải được dữ liệu, áp dụng phân tích dữ liệu thống kê cho biến định tính (biến school - trường phái hội họa cho từng họa sỹ), hãy thực hiện các nội dung sau:

Tính tần số xuất hiện các trường phái hội họa?
Tính tần suất xuất hiện các trường phái hội họa (làm tròn đến 2 chữ số sau phần thập phân)?
Trực quan biến định tính school bằng biểu đồ thanh (thể hiện qua các cột với màu khác nhau), giải thích kết quả nhận được bằng biểu đồ?

# Truy cập tính tần số xuất hiện của các trường phái
school <- painters$School
freq.school <- table(school)
cbind(freq.school)

##   freq.school
## A          10
## B           6
## C           6
## D          10
## E           7
## F           4
## G           7
## H           4

# Tính tần suất xuất hiện
prob.school <- freq.school/nrow(painters)
round(cbind(prob.school),2)

##   prob.school
## A        0.19
## B        0.11
## C        0.11
## D        0.19
## E        0.13
## F        0.07
## G        0.13
## H        0.07

# Vẽ biểu đồ cho tần số xuất hiện
colors <- c("#2eb135","#00773d","#ffb201","#ea7125","#dc291e",
            "violet","indianred","blue")
barplot(freq.school, col = colors)