Nomor 4

Simulasikan 100 data dari distribusi uniform antara 20 sampai 80. Berapa nilai range (max - min) yang paling mendekati hasil simulasi? Gunakan set.seed(123)

Tentukan Jawaban Anda

A. Sekitar 59

B. Sekitar 61

C. Sekitar 45

D. Sekitar 50

set.seed(123)
data_N4 <- runif(100, min = 20, max = 80)
range_N4 <- max(data_N4) - min(data_N4)
range_N4
## [1] 59.6187

Jawaban: A. Sekitar 59

Nomor 5

Buatlah simulasi data dengan 3 variabel prediktorx1 <- rnorm(100) x2 <- x1 + rnorm(100, 0, 0.01) x3 <- rnorm(100) y <- 3 + 2 * x1 - 1 * x3 + rnorm(100) Buat model lm(y ~ x1 + x2 + x3). Berdasarkan output model, manakah pernyataan berikut yang paling tepat? Gunakan set.seed(42)

Tentukan Jawaban Anda

A. x3 tidak berpengaruh karena nilainya random

B. Model menunjukkan overfitting karena nilai R² sangat rendah

C. x2 akan muncul tidak signifikan karena multikolinearitas tinggi

D. x1 dan x2 memiliki efek signifikan terhadap y

set.seed(42)
x1_N5 <- rnorm(100)
x2_N5 <- x1_N5 + rnorm(100, 0, 0.01)
x3_N5 <- rnorm(100)
y_N5 <- 3 + 2 * x1_N5 - 1 * x3_N5 + rnorm(100)

model_N5 <- lm(y_N5 ~ x1_N5 + x2_N5 + x3_N5)
summary(model_N5)
## 
## Call:
## lm(formula = y_N5 ~ x1_N5 + x2_N5 + x3_N5)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -1.7944 -0.5867 -0.1038  0.6188  2.3280 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  3.03150    0.08914  34.007   <2e-16 ***
## x1_N5        1.17483    9.89434   0.119    0.906    
## x2_N5        0.88292    9.89031   0.089    0.929    
## x3_N5       -1.03161    0.08882 -11.614   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.8867 on 96 degrees of freedom
## Multiple R-squared:  0.8927, Adjusted R-squared:  0.8893 
## F-statistic: 266.2 on 3 and 96 DF,  p-value: < 2.2e-16

Jawaban: C. x2 akan muncul tidak signifikan karena multikolinearitas tinggi

Nomor 6

Gunakan sample() untuk membuat 100 data kategorik (“A”, “B”, “C”) dengan probabilitas masing-masing 0.2, 0.3, 0.5. Berapa banyak kategori “B”? Gunakan set.seed(123)

Tentukan Jawaban Anda

A. Sekitar 60

B. Sekitar 50

C. Sekitar 20

D. Sekitar 30

set.seed(123)
data_N6 <- sample(c("A", "B", "C"), size = 100, replace = TRUE, prob = c(0.2, 0.3, 0.5))
table(data_N6)
## data_N6
##  A  B  C 
## 18 29 53

Jawaban: D. Sekitar 30

Nomor 7

Lakukan bootstrap 1000 kali terhadap sampel x <- c(5, 7, 8, 10, 12). Hitung rata-rata dari setiap bootstrap, lalu ambil rata-rata dari hasil tersebut. Nilai mendekati berapa? Gunakan set.seed(123)

Tentukan Jawaban Anda

A. 8.35

B. 7.90

C. 8.10

D. 8.50

set.seed(123)
x_N7 <- c(5, 7, 8, 10, 12)

boot_mean_N7 <- replicate(1000, mean(sample(x_N7, size = 5, replace = TRUE)))
mean(boot_mean_N7)
## [1] 8.3572

Jawaban: A. 8.35

Nomor 8

Buat 100 data acak dari distribusi normal dengan mean 50 dan sd 10. Hitung standar deviasi dari data tersebut. Gunakan set.seed(123)

Tentukan Jawaban Anda

A. Sekitar 9.1

B. Sekitar 7.5

C. Sekitar 11.2

D. Sekitar 12.5

set.seed(123)
data_N8 <- rnorm(100, mean = 50, sd = 10)
sd(data_N8)
## [1] 9.128159

Jawaban: A. Sekitar 9.1

Nomor 9

Dengan menggunakan fungsi rbinom, simulasikan 1000 percobaan dengan n = 10 dan p = 0.3. Berapa rata-rata jumlah sukses? Gunakan set.seed(123)

Tentukan Jawaban Anda A. 2.8

B. 2.7

C. 2.9

D. 3.1

set.seed(123)
data_N9 <- rbinom(1000, size = 10, prob = 0.3)
mean(data_N9)
## [1] 2.989

Jawaban: C. 2.9

Nomor 10

Simulasikan 50 data dari N(100,15) dan 50 data dari N(80,10), lalu gabungkan. Berapa rata-rata dari seluruh data gabungan? Gunakan set.seed(123)

Tentukan Jawaban Anda

A. 95

B. 85

C. 100

D. 90

set.seed(123)

data1_N10 <- rnorm(50, mean = 100, sd = 15)
data2_N10 <- rnorm(50, mean = 80, sd = 10)

gabungan_N10 <- c(data1_N10, data2_N10)
mean(gabungan_N10)
## [1] 90.99007

Jawaban: D. 90

Nomor 12

Buat 100 data dari distribusi normal N(0,1), lalu ambil hanya data yang lebih besar dari 1. Berapa banyak data yang tersisa? Gunakan set.seed(123)

Tentukan Jawaban Anda

A. Sekitar 50

B. Sekitar 16

C. Sekitar 68

D. Sekitar 34

set.seed(123)
data_N12 <- rnorm(100)
data_filter_N12 <- data_N12[data_N12 > 1]
length(data_filter_N12)
## [1] 17

Jawaban: B. Sekitar 16

Nomor 13

Buat data berikut: x <- c(5, 8, 12, 13, 15, 18, 21) Lakukan bootstrap sebanyak 10.000 kali untuk menghitung interval kepercayaan 95% dari median data. Manakah interval berikut yang paling mendekati hasil? Gunakan set.seed(123)

Tentukan Jawaban Anda

A. (8, 18)

B. (8, 14)

C. (9, 15)

D. (10, 13)

set.seed(123)
x_N13 <- c(5, 8, 12, 13, 15, 18, 21)

boot_med_N13 <- replicate(10000, median(sample(x_N13, replace = TRUE)))

quantile(boot_med_N13, probs = c(0.025, 0.975))
##  2.5% 97.5% 
##     8    18

Jawaban: A. (8, 18)

Nomor 14

Simulasikan 100 data dari distribusi Poisson dengan λ = 4. Berapa nilai modus dari data yang dihasilkan? Gunakan set.seed(123)

Tentukan Jawaban Anda

A. 5

B. 4

C. 3

D. 2

set.seed(123)
data_N14 <- rpois(100, lambda = 4)

table_data_N14 <- table(data_N14)

modus_N14 <- as.numeric(names(table_data_N14)[which.max(table_data_N14)])
modus_N14
## [1] 2

Jawaban: D. 2

Nomor 15

Simulasikan 100 data dari distribusi eksponensial dengan rate = 1. Berapakah nilai median dari data tersebut? Gunakan set.seed(123)

Tentukan Jawaban Anda A. 1

B. 1.5

C. 0.5

D. 0.84

set.seed(123)
data_N15 <- rexp(100, rate = 1)
median(data_N15)
## [1] 0.847754

Jawaban: D. 0.84

Nomor 16

Buatlah 100 data acak dari distribusi binomial dengan n = 10 dan p = 0.3. Hitung rata-ratanya. Berapakah nilai yang paling mendekati rata-rata tersebut? Gunakan set.seed(123)

Tentukan Jawaban Anda

A. 2.5

B. 3.0

C. 7.0

D. 5.0

set.seed(123)
data_N16 <- rbinom(100, size = 10, prob = 0.3)
mean(data_N16)
## [1] 3.02

Jawaban: B. 3.0

Nomor 17

Buatlah sebuah regresi linear sederhana dari data berikut: x <- 1:10 y <- 2 * x + rnorm(10, 0, 1) Berapa estimasi koefisien slope dari model lm(y ~ x)? Gunakan set.seed(123)

Tentukan Jawaban Anda

A. 2.20

B. 1.75

C. 1.89

D. 1.91

set.seed(123)
x_N17 <- 1:10
y_N17 <- 2 * x_N17 + rnorm(10, 0, 1)

model_N17 <- lm(y_N17 ~ x_N17)
coef(model_N17)
## (Intercept)       x_N17 
##   0.5254674   1.9180288

Jawaban: D. 1.91

Nomor 19

Dari data rnorm(100), berapa banyak data yang berada di luar ±2 SD? Gunakan set.seed(123)

Tentukan Jawaban Anda

A. Sekitar 2

B. Sekitar 25

C. Sekitar 10

D. Sekitar 5

set.seed(123)
data_N19 <- rnorm(100)

low_lim_N19 <- -2
up_lim_N19 <- 2

outliers_N19 <- sum(data_N19 < low_lim_N19 | data_N19 > up_lim_N19)
outliers_N19
## [1] 4

Jawaban: D. Sekitar 5

Nomor 20

Dari data rnorm(100, mean=70, sd=5), berapakah nilai maksimum dari data tersebut? Gunakan set.seed(123)

Tentukan Jawaban Anda

A. Sekitar 90

B. Sekitar 81

C. Sekitar 76

D. Sekitar 95

set.seed(123)
data_N20 <- rnorm(100, mean = 70, sd = 5)

max_value_N20 <- max(data_N20)
max_value_N20
## [1] 80.93666

Jawaban: B. Sekitar 81