Hãy thực hiện các câu lệnh sau để có các véc tơ số xVec và yVec; hàm sample cho phép lấy ra một số ngẫu nhiên trong khoảng từ 0:999 và thực hiện lấy 250 số, tham số replce = T có nghĩa là có thể lấy lặp lại số đã có:
set.seed(50)
xVec <- sample(0:999, 250, replace=T)
yVec <- sample(0:999, 250, replace=T)
Giả sử rằng \(x=(x_{1},x_{2},...,x_{n})\) và \(y=(y_{1},y_{2},...,y_{n})\) ký hiệu cho 2 véc tơ xVec và yVec:
Tạo ra véc tơ số có dạng sau: \[(x_{1}+2x_{2}-x_{3},x_{2}+2x_{3}-x{4},...,x_{n-2}+2x_{n-1}-x_{n})\]
Tính biểu thức sau: \[ \sum_{i=1}^{n-1} \frac{e^{-x_{i+1}}}{x_i+10} \]
# Ý a
# Chiều dài véc tơ xVec
n = length(xVec)
xVec[-c(n-1,n)] + 2*xVec[-c(1,n)] - xVec[-c(1,2)] -> kq1
print(length(kq1))
## [1] 248
# Ý b
sum(exp(-xVec[-1])/(xVec[-length(xVec)]+10))
## [1] 5.029496e-05
Sử dụng các véc tơ xVec và yVec tạo ra từ bài tập số 1 và các hàm thống kê có sẵn trong R như mean, sqrt, sum and abs. Thực hiện các công việc sau:
# Ý a
print(yVec[yVec>600])
## [1] 702 901 617 726 915 723 941 906 782 681 721 929 827 653 839 800 869 692 840
## [20] 845 769 866 696 685 788 642 902 797 601 656 842 970 680 792 662 868 875 795
## [39] 880 700 665 699 979 796 772 836 974 990 954 846 943 658 655 628 623 629 989
## [58] 738 992 758 870 910 933 641 872 904 647 988 753 624 996 621 714 965 920 755
## [77] 783 856 927 759 700 764 666 667 790 654 959 868 963 698 686
# Ý b
print(which(yVec>600))
## [1] 3 9 10 18 20 22 25 26 27 29 37 41 42 43 45 48 49 51 65
## [20] 67 71 74 79 81 84 85 88 95 98 99 103 106 108 109 110 113 114 119
## [39] 120 129 130 131 138 139 143 147 148 152 154 159 161 166 167 168 172 173 174
## [58] 176 177 183 187 188 189 190 191 194 196 197 201 202 204 206 207 211 212 219
## [77] 223 224 225 227 229 230 233 235 238 239 240 243 246 248 249
# Ý c
xVec[yVec>600]
## [1] 819 706 903 761 439 481 624 988 473 568 926 518 852 593 86 455 773 935 398
## [20] 755 335 500 810 755 233 125 332 440 811 385 591 345 610 221 646 261 640 206
## [39] 388 161 705 319 667 286 605 87 895 561 777 576 778 963 961 212 201 324 387
## [58] 770 258 232 438 25 376 218 665 708 78 762 227 873 390 113 839 757 397 601
## [77] 814 827 79 566 983 3 317 523 402 680 512 687 398 211 139
# Ý d
sum(xVec %% 2 == 0)
## [1] 117
# Ý e
yVec[c(TRUE, FALSE, FALSE)]
## [1] 537 95 162 617 161 56 269 723 941 88 200 47 721 159 653 39 869 261 91
## [20] 528 397 273 845 559 453 263 696 566 642 902 253 158 71 519 842 970 792 284
## [39] 262 92 171 424 436 665 216 550 796 291 134 974 196 954 473 66 556 658 514
## [58] 623 86 208 0 386 870 641 242 647 496 624 116 48 965 189 360 328 783 214
## [77] 700 179 667 790 560 64 460 426
Hàm cumprod cho phép tính tích lũy của một dãy số. Sử dụng tính chất của hàm cumprod, hãy tính giá trị của biểu thức sau:
$$
=1++( )+( )++( )
$$ Ví dụ hàm cumprod:
# Ví dụ về hàm cumprod
cumprod(1:4)
## [1] 1 2 6 24
1 + sum(cumprod(seq(2,38, by = 2)/seq(3,39, by = 2)))
## [1] 6.976346
Assume that we have registered the height and weight for four people: Heights in cm are 180, 165, 160, 193; weights in kg are 87, 58, 65, 100. Make two vectors, height and weight, with the data. The bodymass index (BMI) is defined as:
\[ \frac{\text { weight in } \mathrm{kg}}{\text { (height in } \mathrm{m})^2} \]
# Create the vectors following the heights, weights
weight <- c(87, 58, 65,100)
height <- c(180,165,160,193)
data <- data.frame(weight, height)
bmi <- (data$weight)/(data$height/100)^2
print(data$weight[bmi>25])
## [1] 87 65 100
Tập dữ liệu painters có trong thư viện MASS, để lấy tập dữ liệu này, thực hiện các lệnh sau:
#install.packages("MASS")
library(MASS)
data("painters")
Sau khi đã tải được dữ liệu, áp dụng phân tích dữ liệu thống kê cho biến định tính (biến school - trường phái hội họa cho từng họa sỹ), hãy thực hiện các nội dung sau:
# Truy cập tính tần số xuất hiện của các trường phái
school <- painters$School
freq.school <- table(school)
cbind(freq.school)
## freq.school
## A 10
## B 6
## C 6
## D 10
## E 7
## F 4
## G 7
## H 4
# Tính tần suất xuất hiện
prob.school <- freq.school/nrow(painters)
round(cbind(prob.school),2)
## prob.school
## A 0.19
## B 0.11
## C 0.11
## D 0.19
## E 0.13
## F 0.07
## G 0.13
## H 0.07
# Vẽ biểu đồ cho tần số xuất hiện
colors <- c("#2eb135","#00773d","#ffb201","#ea7125","#dc291e",
"violet","indianred","blue")
barplot(freq.school, col = colors)