==============================================================================

TEMPLATE JAWABAN KUIS

Komputasi Statistika, Kelas D

Prodi S1 Statistika FSAD ITS - Semester Genap 2025/2026

Kamis, 12 Maret 2026

==============================================================================

Nama : Joseph Theodore Nels Indra

NRP : 5003251073

Kelas : Komputasi Statistika, Kelas D

==============================================================================

==============================================================================

Soal 1 [TOTAL 50 poin] - Winsorized Mean

==============================================================================

Data

x <- c(12, 45, 52, 58, 61, 63, 67, 70, 72, 75, 78, 82, 88, 95, 310)

— [a] Buatlah fungsi winsorized_mean(x, alpha) —

winsorized_mean <- function(x, alpha) { n <- length(x) k <- n*alpha x <- sort(x) if(k > 0){ x[1:k] <- x[k+1] x[(n-k+1):n] <- x[n-k] } total <- 0 for(i in 1:n){ total <- total+x[i] } mean <- total / n return(mean) }

— [b] Hitung ordinary mean (alpha=0) dan Winsorized mean 20% (alpha=0.2) —

mean <- function(x) n <- length(x) total <- 0 for(i in 1:n){ total <- total+x[i] } mean <- total/n

mean(x)

winsorized_mean(x,0.2)

#VISUALISASI DATA SOAL 1 plot(x) hist(x)

#Analisis dan Interpretasi data: #Berdasarkan diagram plot dari plot(x) dapat dilihat bahwa data-data di dalam plot #Cukup konsisten berdasarkan nilainya, namun ada 1 data yang memiliki nilai paling berbeda (yang diatas 300). #Data tersebut dapat disebut sebagai data outlier atau data ekstrem karena nilainya jauh diatas (paling berbeda) #Dibandingkan data-data lainnya. Nilai outlier/ekstrem pun juga dapat terlihat di histogram. #Visualisasi data histogram pada set data tersebut kurang bagus karena ada banyak nilai kosong pada 100-300.

==============================================================================

Soal 2 [TOTAL 60 poin] - Weighted Multivariate Descriptive Statistics

==============================================================================

— Baca data CSV —

df <- read.csv(“D:/Users/Square/Downloads/Quiz1 Komstat Joseph/data_quiz1.csv”) a <- as.matrix(df[, c(“x1”, “x2”, “x3”)]) w <- df$w

df # — [a] Buatlah fungsi weighted_corr(X, w) — weighted_corr <- function(a,w) { n <- nrow(a) W_mat <- diag(w) n_w <- sum(w) satu <- matrix(1,n,1) x_bar_w <- (1/n_w)t(X) %% W_mat %% satu D <- a-satu %% t(x_bar_w) S_w <- (1/n_w)t(D) %% W_mat %% D s_w <- sqrt(diag(S_w)) V <- diag(s_w) R_w <- solve(V) %% S_w %*% solve(V) return(list( W = W_mat, x_bar_w = x_bar_w, S_w = S_w, s_w = s_w, R_w = R_w )) }

— [b] Aplikasikan fungsi pada data —

weighted_corr(a, w) hasil\(x_bar_w hasil\)S_w hasil\(s_w hasil\)R_w

#VISUALISASI DATA SOAL 2 boxplot(a)

#Analisis dan Interpretasi: #Berdasarkan visualisasi data boxplot di soal nomor 2, kita dapat melihat bahwa nilai dari #x1,x2, dan x3. Boxplot menggambarkan ketiga variabel tersebut dengan jelas dengan mengindikasikan #Adanya nilai median dan dapat dibandingkan dengan variabel lainnya. Dapat dilihat bahwa #variabel yang memiliki nilai yang paling berbeda adalah x3 dan nilai variabel x1 dan x2 mirip/mendekati