SOAL NO 3 (1)

Buatlah simulasi data dengan 3 variabel prediktorx1 <- rnorm(100) x2 <- x1 + rnorm(100, 0, 0.01) x3 <- rnorm(100) y <- 3 + 2x1 - 1x3 + rnorm(100) Buat model lm(y ~ x1 + x2 + x3). Berdasarkan output model, manakah pernyataan berikut yang paling tepat? Gunakan set.seed(42)

set.seed(42)  
x1 <- rnorm(100)  
x2 <- x1 + rnorm(100, 0, 0.01) 
x3 <- rnorm(100)  
y <- 3 + 2*x1 - 1*x3 + rnorm(100) 
model <- lm(y ~ x1 + x2 + x3)

summary(model)

## 
## Call:
## lm(formula = y ~ x1 + x2 + x3)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -1.7944 -0.5867 -0.1038  0.6188  2.3280 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  3.03150    0.08914  34.007   <2e-16 ***
## x1           1.17483    9.89434   0.119    0.906    
## x2           0.88292    9.89031   0.089    0.929    
## x3          -1.03161    0.08882 -11.614   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.8867 on 96 degrees of freedom
## Multiple R-squared:  0.8927, Adjusted R-squared:  0.8893 
## F-statistic: 266.2 on 3 and 96 DF,  p-value: < 2.2e-16

SOAL NO 4 (2)

Simulasikan 100 data dari distribusi eksponensial dengan rate = 1. Berapakah nilai median dari data tersebut? Gunakan set.seed(123)

set.seed(123)  
data <- rexp(100, rate = 1)
median_value <- median(data)
median_value

## [1] 0.847754

SOAL NO 5 (3)

Lakukan bootstrap 1000 kali terhadap sampel x <- c(5, 7, 8, 10, 12). Hitung rata-rata dari setiap bootstrap, lalu ambil rata-rata dari hasil tersebut. Nilai mendekati berapa? Gunakan set.seed(123)

set.seed(123) 
x <- c(5, 7, 8, 10, 12)

bootstrap_means <- replicate(1000, {
  sample_x <- sample(x, replace = TRUE) 
  mean(sample_x)})

mean_of_bootstrap_means <- mean(bootstrap_means)
mean_of_bootstrap_means

## [1] 8.3572

SOAL NO 6 (4)

Gunakan sample() untuk membuat 100 data kategorik (“A”, “B”, “C”) dengan probabilitas masing-masing 0.2, 0.3, 0.5. Berapa banyak kategori “B”? Gunakan set.seed(123)

set.seed(123)  
categories <- sample(c("A", "B", "C"), size = 100, replace = TRUE, prob = c(0.2, 0.3, 0.5))
count_B <- sum(categories == "B")
count_B

## [1] 29

SOAL 8 (5)

Buatlah 100 data acak dari distribusi binomial dengan n = 10 dan p = 0.3. Hitung rata-ratanya. Berapakah nilai yang paling mendekati rata-rata tersebut? Gunakan set.seed(123)

set.seed(123)
data <- rbinom(100, size = 10, prob = 0.3)
mean(data)

## [1] 3.02

SOAL 9 (6)

Dari data rnorm(100), berapa banyak data yang berada di luar ±2 SD? Gunakan set.seed(123)

set.seed(123)
data <- rnorm(100) 

mean_data <- mean(data)
sd_data <- sd(data)
jumlah_luar_2sd <- sum(data < (mean_data - 2*sd_data) | data > (mean_data + 2*sd_data))
jumlah_luar_2sd

## [1] 5

SOAL NO 10 (7)

Buatlah sebuah regresi linear sederhana dari data berikut: x <- 1:10 y <- 2 * x + rnorm(10, 0, 1) Berapa estimasi koefisien slope dari model lm(y ~ x)? Gunakan set.seed(123)

set.seed(123)
x <- 1:10
y <- 2 * x + rnorm(10, mean = 0, sd = 1)

model <- lm(y ~ x)
summary(model)

## 
## Call:
## lm(formula = y ~ x)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -1.1348 -0.5624 -0.1393  0.3854  1.6814 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)   0.5255     0.6673   0.787    0.454    
## x             1.9180     0.1075  17.835    1e-07 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.9768 on 8 degrees of freedom
## Multiple R-squared:  0.9755, Adjusted R-squared:  0.9724 
## F-statistic: 318.1 on 1 and 8 DF,  p-value: 1e-07

SOAL NO 11 (8)

Buat 100 data dari distribusi normal N(0,1), lalu ambil hanya data yang lebih besar dari 1. Berapa banyak data yang tersisa? Gunakan set.seed(123)

set.seed(123)
data <- rnorm(100)           
filtered_data <- data[data > 1] 
length(filtered_data)

## [1] 17

SOAL NO 12 (9)

Buat data berikut: x <- c(5, 8, 12, 13, 15, 18, 21) Lakukan bootstrap sebanyak 10.000 kali untuk menghitung interval kepercayaan 95% dari median data. Manakah interval berikut yang paling mendekati hasil? Gunakan set.seed(123)

set.seed(123)
x <- c(5, 8, 12, 13, 15, 18, 21)
n <- length(x)

boot_medians <- replicate(10000, median(sample(x, size = n, replace = TRUE)))

CI <- quantile(boot_medians, probs = c(0.025, 0.975))
CI

##  2.5% 97.5% 
##     8    18

SOAL N0 13 (10)

Dari data rnorm(100, mean=70, sd=5), berapakah nilai maksimum dari data tersebut? Gunakan set.seed(123)

set.seed(123)
data <- rnorm(100, mean = 70, sd = 5)
max(data)

## [1] 80.93666

SOAL 14 (11)

Simulasikan 100 data dari distribusi uniform antara 20 sampai 80. Berapa nilai range (max - min) yang paling mendekati hasil simulasi? Gunakan set.seed(123)

set.seed(123)
data <- runif(100, min = 20, max = 80)
range_value <- max(data) - min(data)
range_value

## [1] 59.6187

SOAL 15 (12)

Simulasikan 50 data dari N(100,15) dan 50 data dari N(80,10), lalu gabungkan. Berapa rata-rata dari seluruh data gabungan? Gunakan set.seed(123)

set.seed(123)

data1 <- rnorm(50, mean = 100, sd = 15)  
data2 <- rnorm(50, mean = 80, sd = 10)  
combined_data <- c(data1, data2)
mean_combined <- mean(combined_data)
mean_combined

## [1] 90.99007

SOAL 16 (13)

Simulasikan 100 data dari distribusi Poisson dengan λ = 4. Berapa nilai modus dari data yang dihasilkan? Gunakan set.seed(123)

set.seed(123)

data_poisson <- rpois(100, lambda = 4)
mode_value <- as.numeric(names(sort(table(data_poisson), decreasing = TRUE)[1]))
mode_value

## [1] 2

SOAL NO 17 (14)

Dengan menggunakan fungsi rbinom, simulasikan 1000 percobaan dengan n = 10 dan p = 0.3. Berapa rata-rata jumlah sukses? Gunakan set.seed(123)

set.seed(123)

data_binom <- rbinom(1000, size = 10, prob = 0.3)
mean_successes <- mean(data_binom)
mean_successes

## [1] 2.989

SOAL NO 19 (15)

Buat 100 data acak dari distribusi normal dengan mean 50 dan sd 10. Hitung standar deviasi dari data tersebut. Gunakan set.seed(123)

set.seed(123)

data_normal <- rnorm(100, mean = 50, sd = 10)
std_dev <- sd(data_normal)
std_dev

## [1] 9.128159

UTS PENGANTAR STATISTIKA SIMULASI

chandy

2025-04-16

SOAL NO 3 (1)

Buatlah simulasi data dengan 3 variabel prediktorx1 <- rnorm(100) x2 <- x1 + rnorm(100, 0, 0.01) x3 <- rnorm(100) y <- 3 + 2x1 - 1x3 + rnorm(100) Buat model lm(y ~ x1 + x2 + x3). Berdasarkan output model, manakah pernyataan berikut yang paling tepat? Gunakan set.seed(42)

SOAL NO 4 (2)

Simulasikan 100 data dari distribusi eksponensial dengan rate = 1. Berapakah nilai median dari data tersebut? Gunakan set.seed(123)

SOAL NO 5 (3)

Lakukan bootstrap 1000 kali terhadap sampel x <- c(5, 7, 8, 10, 12). Hitung rata-rata dari setiap bootstrap, lalu ambil rata-rata dari hasil tersebut. Nilai mendekati berapa? Gunakan set.seed(123)

SOAL NO 6 (4)

Gunakan sample() untuk membuat 100 data kategorik (“A”, “B”, “C”) dengan probabilitas masing-masing 0.2, 0.3, 0.5. Berapa banyak kategori “B”? Gunakan set.seed(123)

SOAL 8 (5)

Buatlah 100 data acak dari distribusi binomial dengan n = 10 dan p = 0.3. Hitung rata-ratanya. Berapakah nilai yang paling mendekati rata-rata tersebut? Gunakan set.seed(123)

SOAL 9 (6)

Dari data rnorm(100), berapa banyak data yang berada di luar ±2 SD? Gunakan set.seed(123)

SOAL NO 10 (7)

Buatlah sebuah regresi linear sederhana dari data berikut: x <- 1:10 y <- 2 * x + rnorm(10, 0, 1) Berapa estimasi koefisien slope dari model lm(y ~ x)? Gunakan set.seed(123)

SOAL NO 11 (8)

Buat 100 data dari distribusi normal N(0,1), lalu ambil hanya data yang lebih besar dari 1. Berapa banyak data yang tersisa? Gunakan set.seed(123)

SOAL NO 12 (9)

Buat data berikut: x <- c(5, 8, 12, 13, 15, 18, 21) Lakukan bootstrap sebanyak 10.000 kali untuk menghitung interval kepercayaan 95% dari median data. Manakah interval berikut yang paling mendekati hasil? Gunakan set.seed(123)

SOAL N0 13 (10)

Dari data rnorm(100, mean=70, sd=5), berapakah nilai maksimum dari data tersebut? Gunakan set.seed(123)

SOAL 14 (11)

Simulasikan 100 data dari distribusi uniform antara 20 sampai 80. Berapa nilai range (max - min) yang paling mendekati hasil simulasi? Gunakan set.seed(123)

SOAL 15 (12)

SOAL 16 (13)

Simulasikan 100 data dari distribusi Poisson dengan λ = 4. Berapa nilai modus dari data yang dihasilkan? Gunakan set.seed(123)

SOAL NO 17 (14)

Dengan menggunakan fungsi rbinom, simulasikan 1000 percobaan dengan n = 10 dan p = 0.3. Berapa rata-rata jumlah sukses? Gunakan set.seed(123)

SOAL NO 19 (15)

Buat 100 data acak dari distribusi normal dengan mean 50 dan sd 10. Hitung standar deviasi dari data tersebut. Gunakan set.seed(123)