Simulasikan 100 data dari distribusi uniform antara 20 sampai 80. Berapa nilai range (max - min) yang paling mendekati hasil simulasi? Gunakan set.seed(123)
Tentukan Jawaban Anda
A. Sekitar 59
B. Sekitar 61
C. Sekitar 45
D. Sekitar 50
set.seed(123)
data_N4 <- runif(100, min = 20, max = 80)
range_N4 <- max(data_N4) - min(data_N4)
range_N4
## [1] 59.6187
Jawaban: A. Sekitar 59
Buatlah simulasi data dengan 3 variabel prediktorx1 <- rnorm(100) x2 <- x1 + rnorm(100, 0, 0.01) x3 <- rnorm(100) y <- 3 + 2 * x1 - 1 * x3 + rnorm(100) Buat model lm(y ~ x1 + x2 + x3). Berdasarkan output model, manakah pernyataan berikut yang paling tepat? Gunakan set.seed(42)
Tentukan Jawaban Anda
A. x3 tidak berpengaruh karena nilainya random
B. Model menunjukkan overfitting karena nilai R² sangat rendah
C. x2 akan muncul tidak signifikan karena multikolinearitas tinggi
D. x1 dan x2 memiliki efek signifikan terhadap y
set.seed(42)
x1_N5 <- rnorm(100)
x2_N5 <- x1_N5 + rnorm(100, 0, 0.01)
x3_N5 <- rnorm(100)
y_N5 <- 3 + 2 * x1_N5 - 1 * x3_N5 + rnorm(100)
model_N5 <- lm(y_N5 ~ x1_N5 + x2_N5 + x3_N5)
summary(model_N5)
##
## Call:
## lm(formula = y_N5 ~ x1_N5 + x2_N5 + x3_N5)
##
## Residuals:
## Min 1Q Median 3Q Max
## -1.7944 -0.5867 -0.1038 0.6188 2.3280
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 3.03150 0.08914 34.007 <2e-16 ***
## x1_N5 1.17483 9.89434 0.119 0.906
## x2_N5 0.88292 9.89031 0.089 0.929
## x3_N5 -1.03161 0.08882 -11.614 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.8867 on 96 degrees of freedom
## Multiple R-squared: 0.8927, Adjusted R-squared: 0.8893
## F-statistic: 266.2 on 3 and 96 DF, p-value: < 2.2e-16
Jawaban: C. x2 akan muncul tidak signifikan karena multikolinearitas tinggi
Gunakan sample() untuk membuat 100 data kategorik (“A”, “B”, “C”) dengan probabilitas masing-masing 0.2, 0.3, 0.5. Berapa banyak kategori “B”? Gunakan set.seed(123)
Tentukan Jawaban Anda
A. Sekitar 60
B. Sekitar 50
C. Sekitar 20
D. Sekitar 30
set.seed(123)
data_N6 <- sample(c("A", "B", "C"), size = 100, replace = TRUE, prob = c(0.2, 0.3, 0.5))
table(data_N6)
## data_N6
## A B C
## 18 29 53
Jawaban: D. Sekitar 30
Lakukan bootstrap 1000 kali terhadap sampel x <- c(5, 7, 8, 10, 12). Hitung rata-rata dari setiap bootstrap, lalu ambil rata-rata dari hasil tersebut. Nilai mendekati berapa? Gunakan set.seed(123)
Tentukan Jawaban Anda
A. 8.35
B. 7.90
C. 8.10
D. 8.50
set.seed(123)
x_N7 <- c(5, 7, 8, 10, 12)
boot_mean_N7 <- replicate(1000, mean(sample(x_N7, size = 5, replace = TRUE)))
mean(boot_mean_N7)
## [1] 8.3572
Jawaban: A. 8.35
Buat 100 data acak dari distribusi normal dengan mean 50 dan sd 10. Hitung standar deviasi dari data tersebut. Gunakan set.seed(123)
Tentukan Jawaban Anda
A. Sekitar 9.1
B. Sekitar 7.5
C. Sekitar 11.2
D. Sekitar 12.5
set.seed(123)
data_N8 <- rnorm(100, mean = 50, sd = 10)
sd(data_N8)
## [1] 9.128159
Jawaban: A. Sekitar 9.1
Dengan menggunakan fungsi rbinom, simulasikan 1000 percobaan dengan n = 10 dan p = 0.3. Berapa rata-rata jumlah sukses? Gunakan set.seed(123)
Tentukan Jawaban Anda A. 2.8
B. 2.7
C. 2.9
D. 3.1
set.seed(123)
data_N9 <- rbinom(1000, size = 10, prob = 0.3)
mean(data_N9)
## [1] 2.989
Jawaban: C. 2.9
Simulasikan 50 data dari N(100,15) dan 50 data dari N(80,10), lalu gabungkan. Berapa rata-rata dari seluruh data gabungan? Gunakan set.seed(123)
Tentukan Jawaban Anda
A. 95
B. 85
C. 100
D. 90
set.seed(123)
data1_N10 <- rnorm(50, mean = 100, sd = 15)
data2_N10 <- rnorm(50, mean = 80, sd = 10)
gabungan_N10 <- c(data1_N10, data2_N10)
mean(gabungan_N10)
## [1] 90.99007
Jawaban: D. 90
Buat 100 data dari distribusi normal N(0,1), lalu ambil hanya data yang lebih besar dari 1. Berapa banyak data yang tersisa? Gunakan set.seed(123)
Tentukan Jawaban Anda
A. Sekitar 50
B. Sekitar 16
C. Sekitar 68
D. Sekitar 34
set.seed(123)
data_N12 <- rnorm(100)
data_filter_N12 <- data_N12[data_N12 > 1]
length(data_filter_N12)
## [1] 17
Jawaban: B. Sekitar 16
Buat data berikut: x <- c(5, 8, 12, 13, 15, 18, 21) Lakukan bootstrap sebanyak 10.000 kali untuk menghitung interval kepercayaan 95% dari median data. Manakah interval berikut yang paling mendekati hasil? Gunakan set.seed(123)
Tentukan Jawaban Anda
A. (8, 18)
B. (8, 14)
C. (9, 15)
D. (10, 13)
set.seed(123)
x_N13 <- c(5, 8, 12, 13, 15, 18, 21)
boot_med_N13 <- replicate(10000, median(sample(x_N13, replace = TRUE)))
quantile(boot_med_N13, probs = c(0.025, 0.975))
## 2.5% 97.5%
## 8 18
Jawaban: A. (8, 18)
Simulasikan 100 data dari distribusi Poisson dengan λ = 4. Berapa nilai modus dari data yang dihasilkan? Gunakan set.seed(123)
Tentukan Jawaban Anda
A. 5
B. 4
C. 3
D. 2
set.seed(123)
data_N14 <- rpois(100, lambda = 4)
table_data_N14 <- table(data_N14)
modus_N14 <- as.numeric(names(table_data_N14)[which.max(table_data_N14)])
modus_N14
## [1] 2
Jawaban: D. 2
Simulasikan 100 data dari distribusi eksponensial dengan rate = 1. Berapakah nilai median dari data tersebut? Gunakan set.seed(123)
Tentukan Jawaban Anda A. 1
B. 1.5
C. 0.5
D. 0.84
set.seed(123)
data_N15 <- rexp(100, rate = 1)
median(data_N15)
## [1] 0.847754
Jawaban: D. 0.84
Buatlah 100 data acak dari distribusi binomial dengan n = 10 dan p = 0.3. Hitung rata-ratanya. Berapakah nilai yang paling mendekati rata-rata tersebut? Gunakan set.seed(123)
Tentukan Jawaban Anda
A. 2.5
B. 3.0
C. 7.0
D. 5.0
set.seed(123)
data_N16 <- rbinom(100, size = 10, prob = 0.3)
mean(data_N16)
## [1] 3.02
Jawaban: B. 3.0
Buatlah sebuah regresi linear sederhana dari data berikut: x <- 1:10 y <- 2 * x + rnorm(10, 0, 1) Berapa estimasi koefisien slope dari model lm(y ~ x)? Gunakan set.seed(123)
Tentukan Jawaban Anda
A. 2.20
B. 1.75
C. 1.89
D. 1.91
set.seed(123)
x_N17 <- 1:10
y_N17 <- 2 * x_N17 + rnorm(10, 0, 1)
model_N17 <- lm(y_N17 ~ x_N17)
coef(model_N17)
## (Intercept) x_N17
## 0.5254674 1.9180288
Jawaban: D. 1.91
Dari data rnorm(100), berapa banyak data yang berada di luar ±2 SD? Gunakan set.seed(123)
Tentukan Jawaban Anda
A. Sekitar 2
B. Sekitar 25
C. Sekitar 10
D. Sekitar 5
set.seed(123)
data_N19 <- rnorm(100)
low_lim_N19 <- -2
up_lim_N19 <- 2
outliers_N19 <- sum(data_N19 < low_lim_N19 | data_N19 > up_lim_N19)
outliers_N19
## [1] 4
Jawaban: D. Sekitar 5
Dari data rnorm(100, mean=70, sd=5), berapakah nilai maksimum dari data tersebut? Gunakan set.seed(123)
Tentukan Jawaban Anda
A. Sekitar 90
B. Sekitar 81
C. Sekitar 76
D. Sekitar 95
set.seed(123)
data_N20 <- rnorm(100, mean = 70, sd = 5)
max_value_N20 <- max(data_N20)
max_value_N20
## [1] 80.93666
Jawaban: B. Sekitar 81