Library:

> # install.packages("knitr")
> # install.packages("rmarkdown")
> # install.packages("prettydoc")
> # install.packages("equatiomatic")

1 PENDAHULUAN

1.1 Latar Belakang

Analisis Diskriminan, atau Linear Discriminant Analysis, merupakan salah satu teknik analisis multivariat yang bertujuan untuk membedakan secara statistik antara dua atau lebih kelompok berdasarkan serangkaian variabel independen (prediktor) yang terukur. Prinsip utama analisis ini adalah menemukan kombinasi linier dari variabel-variabel prediktor yang paling efektif untuk memaksimalkan rasio variansi antar kelompok terhadap variansi di dalam kelompok (variansi within-group). Kombinasi linier ini disebut Fungsi Diskriminan. Fungsi diskriminan berfungsi sebagai dimensi baru yang memproyeksikan data sedemikian rupa sehingga kelompok-kelompok menjadi terpisah sejauh mungkin. Analisis Diskriminan sangat relevan digunakan ketika peneliti ingin: (1) menguji apakah kelompok-kelompok yang sudah didefinisikan berbeda secara signifikan pada variabel-variabel prediktor; (2) menentukan variabel prediktor mana yang paling kuat berkontribusi pada pembedaan tersebut; dan (3) mengembangkan aturan klasifikasi untuk memprediksi keanggotaan kelompok observasi baru. Analisis ini memerlukan pemenuhan beberapa asumsi kunci, seperti normalitas multivariat dan homogenitas matriks variansi-kovariansi (ragam peragam), agar interpretasi hasilnya valid

1.2 Rumusan Masalah

  1. Bagaimana cara menguji signifikansi multivariat dari kemampuan diskriminasi variabel prediktor secara gabungan dalam membedakan kelompok-kelompok yang telah ditentukan?
  2. Bagaimana proses pembentukan Fungsi Diskriminan yang optimal dari kombinasi linier variabel prediktor?
  3. Bagaimana cara menentukan bobot (koefisien) dari setiap variabel prediktor untuk mengukur kontribusi relatifnya dalam fungsi diskriminan?
  4. Bagaimana mengevaluasi tingkat akurasi klasifikasi dari Fungsi Diskriminan Linier yang dihasilkan?

1.3 Tinjauan Pustaka

1.3.1 Analisis Diskriminan

Analisis Diskriminan merupakan analisis multivariate yang termasuk teknik dependensi (hubungan antanominal r variabel yang sudah dapat dibedakan antar variabel respon dengan variabel bebas) dengan variabel respon yang bersifat kategori (berskala atau ordinal dan kualitatif) dan variabel independen yang bersifat metrik (berskala interval atau rasio dan kuantitatif). Analisis diskriminan adalah teknik statistika yang digunakan untuk mengklasifikasikan suatu individu atau observasi ke dalam suatu kelas atau kelompok berdasarkan sekumpulan variabel-variabel (Johnson dan Winchern, 2002). Pengelompokan dengan analisis diskriminan ini terjadi karena ada pengaruh satu atau lebih variabel lain yang merupakan variabel independen. Kombinasi linier dari variabel-variabel ini akan membentuk suatu fungsi diskriminan (Tatham et. al.,1998). Analisis diskriminan adalah metode statistik canggih yang secara bersamaan memeriksa variabel yang berbeda dan menentukan asal kelompok suatu parameter. Metode ini membuat kombinasi linier variabel bebas untuk menguji suatu parameter tergantung pada salah satu dari dua kelompok (Lekshmi et al., 1998). Pada analisis diskriminan, memiliki kelebihan yaitu memberikan perhitungan yang lebih efisien (Sharma, 1996) sedangkan kelemahan dari analisis diskriminan adalah asumsi harus terpenuhi, dimana data harus memenuhi distribusi normal multivariat dan menghasilkan matriks kovarians yang sama untuk setiap populasi (Johnson dan Wichern, 2002).

1.3.2 Asumsi Analisis Diskriminan

  1. Multivariate normality, atau variabel independen seharusnya berdistribusi normal. Jika data tidak berdistribusi normal, hal ini akan menyebabkan masalah pada ketepatan fungsi (model) diskriminan. Regresi logistic (logistic regression) bisa dijadikan alternatif metode jika memang data tidak berdistribusi normal.
  2. Matriks kovarians dari semua variabel independen seharusnya sama (nonsingularity) atau tidak terdapat non positive definites.
  3. Tidak ada korelasi antar variabel independen. Jika dua variabel independen mempunyai korelasi yang kuat, maka dikatakan terjadi multikolinearitas.
  4. Tidak adanya data yang sangat ekstrim (outlier) pada variabel independen. Jika ada data outlier yang tetap diproses, hal ini bisa berakibat berkurangnya ketepatan klasifikasi dari fungsi diskriminan.

1.3.3 Model Analisis Diskriminan

Model analisis diskriminan adalah sebuah persamaan yang menunjukkan suatu kombinasi linier dari berbagai variabel independen yaitu :

\[ D = b_0 + b_1X + b_2X_2 + b_3X_3 + \dots + b_kX_k \]

Dengan : D = Skor diskriminan B = Koefisien diskriminan atau bobot X = Prediktor atau variabel independen

Pada analisis diskriminan yang diestimasi adalah koefisien ‘b’, sehingga nilai ‘D’ setiap grup sedapat mungkin berbeda. Ini terjadi pada saat rasio jumlah kuadrat antargrup (betweengroup sum of squares) terhadap jumlah kuadrat dalam grup (within-group sum of square) untuk skor diskriminan mencapai maksimum. Berdasarkan nilai D itulah keanggotaan seseorang diprediksi

1.3.4 Proses Diskriminan

Analisis Diskriminan dilakukan melalui tahap sebagai berikut: 1. Memisahkan variabel-variabel menjadi variabel dependen dan variabel independen 2. Menentukan metode untuk membuat fungsi diskriminan. Pada prinsipnya ada dua metode dasar untuk itu, yakni: Simultaneous Estimation, dimana semua variabel dimasukan secara bersama-sama dan kemudian dilakukan proses diskriminan. Step-Wise Estimation, dimana variable dimasukan satu per satu ke dalam model diskriminan. Pada proses ini, tentu ada variabel yang tetap ada pada model, dan ada kemungkinan satu atau lebih variabel independen yang dibuang untuk sementara dari model. 3. Menguji signifikan dari fungsi diskriminan yang telah terbentuk, dengan menggunakan wilks lambda, nilai, F test dan lainya 4. Menguji ketepatan klasifikasi dari fungsi diskriminan, termasuk mengetahui ketepatan klasifikasi secara individual dengan casewise diagnostics. 5. Melakukan interpretasi terhadap fungsi diskriminan. 6. Melakukan uji validasi fungsi diskriminan

1.4 Data

Kasus diambil dari Buku Analisis Multivariat oleh Sutadji, R.E. Sebuah lembaga sertifikasi profesi sedang menganalisis hasil rekomendasi asesor kompetensi dalam pelaksanaan uji kompetensi pada peserta didik SMK di beberapa jejaring SMK yang tersebar di Jawa Timur dengan variabel berikut. Tipe peserta didik yang direkomendasikan kompeten, dengan kode: Kode 1 = kompeten Tipe peserta didik yang direkomendasikan belum kompeten, dengan kode: Kode 0 = belum kompeten. Jam praktikum (jumlah jam pelajaran per minggu). Nilai praktikum (nilai dari uji praktik pada mata pelajaran kejuruan). Usia (usia peserta didik kelas XII SMK peserta uji kompetensi). Variabel respons: 1. Rekomendasi belum kompeten (Y = 0) 2. Rekomendasi kompeten (Y=1) Variabel prediktor: 1. Jam Praktikum (X1) 2. Nilai Praktikum (X2) 3. Usia (X3)

1.5 Tujuan

  1. Menentukan apakah terdapat perbedaan antara beberapa karakteristik yang diteliti dalam membedakan dua atau lebih kelompok.
  2. Menentukan variabel bebas mana saja yang memberikan kontribusi penting dalam membedakan nilai rata-rata diskriminan dari dua atau lebih kelompok.
  3. Mengelompokkan data ke dalam dua atau lebih kelompok berdasarkan karakteristik datayang diteliti.

2 SOURCE CODE

2.1 Library

> library(MVN)
> library(biotools)
> library(MASS)
> library(candisc)
> library(caret)
> library(readxl)

Memuat Packages: Memuat pustaka R yang diperlukan untuk Analisis Diskriminan dan pengujian asumsi (Normalitas, Homogenitas Ragam Peragam, dll.).

2.2 Impor Data

> datadiskriminan <- read_excel("E:/STATISTIKA/SEMESTER 5/Analisis Multivariat/Data Rekomendasi Asesor.xlsx")

Membaca Data: Membaca data dari file Excel ke dalam dataframe bernama datadiskriminan.

2.3 Pengecekan Outlier

> datacek <- datadiskriminan
> hasildata <- mvn(datacek[,2:4], multivariate_outlier_method = "adj", show_new_data = TRUE)
> hasildata
$multivariate_normality
           Test Statistic p.value     Method      MVN
1 Henze-Zirkler     0.829   0.079 asymptotic ✓ Normal

$univariate_normality
              Test        Variable Statistic p.value    Normality
1 Anderson-Darling   JAM_PRAKTIKUM     0.908   0.018 ✗ Not normal
2 Anderson-Darling NILAI_PRAKTIKUM     1.748  <0.001 ✗ Not normal
3 Anderson-Darling            USIA     0.803   0.033 ✗ Not normal

$descriptives
         Variable  n   Mean Std.Dev Median Min Max  25th 75th   Skew Kurtosis
1   JAM_PRAKTIKUM 30  9.767   4.305   10.0   3  17  6.25   13 -0.030    1.631
2 NILAI_PRAKTIKUM 30 85.833   4.504   85.5  80  92 82.00   90  0.074    1.323
3            USIA 30 17.500   1.737   17.5  15  20 16.00   19  0.000    1.731

$multivariate_outliers
  Observation Mahalanobis.Distance
1          12               15.686
2          15               14.604

$new_data
   JAM_PRAKTIKUM NILAI_PRAKTIKUM USIA
1              7              80   15
2              8              81   16
3              7              82   17
4              5              83   18
5              4              80   19
6              6              81   20
7              8              82   15
8              8              83   16
9              6              80   17
10             5              81   18
11             7              82   19
13             7              81   15
14             4              82   16
16            12              88   18
17            14              89   19
18            15              90   20
19            13              91   15
20            15              88   16
21            12              89   17
22            17              90   18
23            13              91   19
24            15              92   20
25            12              89   15
26            12              88   16
27            14              90   17
28            16              92   18
29            12              92   19
30            13              92   20

$data
# A tibble: 30 × 3
   JAM_PRAKTIKUM NILAI_PRAKTIKUM  USIA
           <dbl>           <dbl> <dbl>
 1             7              80    15
 2             8              81    16
 3             7              82    17
 4             5              83    18
 5             4              80    19
 6             6              81    20
 7             8              82    15
 8             8              83    16
 9             6              80    17
10             5              81    18
# ℹ 20 more rows

$subset
NULL

$outlierMethod
[1] "adj"

attr(,"class")
[1] "mvn"
> databaru <- hasildata$new_data
> View(databaru)
> hasil<- mvn(databaru, mvn_test = 'royston', alpha = 0.05)
> hasil
$multivariate_normality
     Test Statistic p.value     Method          MVN
1 Royston    17.202  <0.001 asymptotic ✗ Not normal

$univariate_normality
              Test        Variable Statistic p.value    Normality
1 Anderson-Darling   JAM_PRAKTIKUM     0.955   0.014 ✗ Not normal
2 Anderson-Darling NILAI_PRAKTIKUM     1.730  <0.001 ✗ Not normal
3 Anderson-Darling            USIA     0.777   0.038 ✗ Not normal

$descriptives
         Variable  n   Mean Std.Dev Median Min Max  25th  75th   Skew Kurtosis
1   JAM_PRAKTIKUM 28 10.250   4.033   12.0   4  17  7.00 13.25 -0.051    1.605
2 NILAI_PRAKTIKUM 28 86.036   4.599   88.0  80  92 81.75 90.00 -0.042    1.295
3            USIA 28 17.429   1.731   17.5  15  20 16.00 19.00  0.013    1.717

$data
   JAM_PRAKTIKUM NILAI_PRAKTIKUM USIA
1              7              80   15
2              8              81   16
3              7              82   17
4              5              83   18
5              4              80   19
6              6              81   20
7              8              82   15
8              8              83   16
9              6              80   17
10             5              81   18
11             7              82   19
13             7              81   15
14             4              82   16
16            12              88   18
17            14              89   19
18            15              90   20
19            13              91   15
20            15              88   16
21            12              89   17
22            17              90   18
23            13              91   19
24            15              92   20
25            12              89   15
26            12              88   16
27            14              90   17
28            16              92   18
29            12              92   19
30            13              92   20

$subset
NULL

$outlierMethod
[1] "none"

attr(,"class")
[1] "mvn"

Membuat Salinan Data: Membuat salinan data untuk pengecekan outlier. Pengecekan Outlier Multivariat: Menggunakan metode Adjusted Robust Mahalanobis Distance (Adj) pada kolom 2 hingga 4 untuk mengidentifikasi dan menghapus outlier multivariat.

2.4 Uji Homogenitas Ragam Peragam

> uji_bart <- function(x){
+   method <- "Bartlett's test of sphericity"
+   data.name <- deparse(substitute(x))
+   x <- subset(x, complete.cases(x))
+   n <- nrow(x)
+   p <- ncol(x)
+   chisq <- (1-n+(2*p+5)/6)*log(det(cor(x)))
+   df <- p*(p-1)/2
+   p.value <- pchisq(chisq, df, lower.tail=FALSE)
+   names(chisq) <- "Khi-squared"
+   names(df) <- "df"
+   return(structure(list(statistic=chisq, parameter=df,
+                         p.value=p.value,method=method,
+                         data.name=data.name), class="htest"))}
> dataakhir<-datadiskriminan[c(2:9,11:17,19:23,25:28,30:40),1:4]
> attach(dataakhir)
> View(dataakhir)
> 
> uji_bart(dataakhir)

    Bartlett's test of sphericity

data:  dataakhir
Khi-squared = 94.763, df = 6, p-value < 2.2e-16

Melihat Data Baru: Menyimpan data tanpa outlier ke databaru dan menampilkannya. Uji Normalitas Multivariat: Menguji asumsi normalitas multivariat pada data baru (databaru) menggunakan uji Royston. Definisi Fungsi Uji Bartlett: Mendefinisikan fungsi kustom bernama uji_bart untuk melakukan Uji Bartlett of Sphericity (menguji apakah matriks korelasi identitas). Catatan: Fungsi ini TIDAK melakukan Uji Homogenitas Ragam Peragam (Box’s M), tetapi uji sphericity. Memilih Data Akhir: Memilih baris data tertentu (mungkin setelah penghapusan outlier manual/spesifik) dan kolom 1 hingga 4 dari datadiskriminan untuk analisis akhir. Lampirkan Data: Membuat kolom-kolom dataakhir dapat diakses langsung (convenience), dan menampilkannya. Melakukan Uji Bartlett: Menjalankan fungsi uji Bartlett yang telah didefinisikan pada data akhir.

2.5 Pengujian perbedaan Rata-rata variabel dependen

> X<-as.matrix(dataakhir[2:4])
> 
> X.manova<-manova(X~dataakhir$REKOMENDASI, data=dataakhir)
> X.wilks<-summary(X.manova, test="Wilks")
> X.wilks
                      Df    Wilks approx F num Df den Df    Pr(>F)    
dataakhir$REKOMENDASI  1 0.064711   101.17      3     21 1.203e-12 ***
Residuals             23                                              
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Membuat Matriks Variabel Dependen: Mengambil kolom 2-4 dari dataakhir (variabel dependen/prediktor) sebagai matriks X. Analisis MANOVA: Melakukan Analisis Variansi Multivariat (MANOVA) untuk menguji perbedaan rata-rata vektor variabel dependen berdasarkan kelompok REKOMENDASI. Ringkasan Uji MANOVA (Wilks’ Lambda): Menampilkan hasil uji MANOVA, khususnya menggunakan kriteria Wilks’ Lambda, untuk menilai signifikansi perbedaan rata-rata kelompok.

2.6 Kontribusi Variabel Prediktor terhadap Variabel Respon

> cc<-candisc(X.manova)
> cc

Canonical Discriminant Analysis for dataakhir$REKOMENDASI:

   CanRsq Eigenvalue Difference Percent Cumulative
1 0.93529     14.453                100        100

Test of H0: The canonical correlations in the 
current row and all that follow are zero

  LR test stat approx F numDF denDF   Pr(> F)    
1     0.064711   101.17     3    21 1.203e-12 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Analisis Variat Kanonik: Melakukan Analisis Variat Kanonik pada hasil MANOVA untuk mengidentifikasi dan menginterpretasikan dimensi (fungsi diskriminan) yang memaksimalkan perbedaan kelompok. Hasil Variat Kanonik: Menampilkan hasil analisis variat kanonik (misalnya, korelasi kanonik, eigenvalues).

2.7 Membuat fungsi diskriminan

> modellda<-lda(REKOMENDASI~., data = dataakhir)
> modellda
Call:
lda(REKOMENDASI ~ ., data = dataakhir)

Prior probabilities of groups:
   0    1 
0.52 0.48 

Group means:
  JAM_PRAKTIKUM NILAI_PRAKTIKUM     USIA
0      5.846154        81.76923 17.30769
1     13.583333        89.75000 17.33333

Coefficients of linear discriminants:
                        LD1
JAM_PRAKTIKUM    0.28992151
NILAI_PRAKTIKUM  0.63364200
USIA            -0.04818936

Membangun Model LDA: Membangun model Analisis Diskriminan Linier (LDA) dengan REKOMENDASI sebagai variabel respon (kelompok) dan variabel lain (.) sebagai prediktor. Koefisien Fungsi Diskriminan: Menampilkan koefisien fungsi diskriminan linier yang terbentuk.

2.8 Membuat tabel klasifikasi dan menguji ketepatan model

> pred_LDA1<- predict(modellda, dataakhir)
> table(actual=dataakhir$REKOMENDASI, predicted=pred_LDA1$class)
      predicted
actual  0  1
     0 13  0
     1  0 12

Prediksi Klasifikasi: Menggunakan model LDA untuk memprediksi keanggotaan kelompok pada data yang sama (dataakhir). Matriks Klasifikasi (Confusion Matrix): Membuat tabel silang (confusion matrix) antara kelompok aktual (REKOMENDASI) dan kelompok yang diprediksi (pred_LDA1$class) untuk menguji ketepatan (accuracy) model.

3 HASIL DAN PEMBAHASAN

3.1 Uji Normalitas Multivariat menggunakan Henze-Zirkler Test

Keputusan: HZ statistic: 0.8287, p-value: 0.00793 < 0.05, MVN=YES Kesimpulan: Dengan Tingkat kepercayaan 95%, dapat disimpulkan bahwa tidak terdapat pelanggaran normalitas multivariat. Data dianggap memenuhi asumsi normalitas multivariat.

3.2 Uji Normalitas Univariat menggunakan Anderson-Darling Test

Keputusan: 1. JAM_PRAKTIKUM: Statistik: 0.9081, p-value = 0.0180 (tidak normal). 2. NILAI_PRAKTIKUM: Statistik: 1.7481, p-value = 0.0001 (tidak normal). 3. USIA: Statistik: 0.8028, p-value = 0.0333 (tidak normal). 4. Kesimpulan: Dengan Tingkat kepercayaan 95%, dapat disimpulkan bahwa semua variabel tidak memenuhi asumsi normalitas pada tingkat univariat.

3.3 Statistika Deskriptif Data Lama

  1. Ukuran Sampel: 30 observasi.
  2. JAM_PRAKTIKUM: Rata-rata = 9.77, standar deviasi = 4.30, rentang = 3-17. Skewness (-0.03) dan kurtosis (-1.48) menunjukkan distribusi mendekati simetris namun lebih datar dari distribusi normal.
  3. NILAI_PRAKTIKUM: Rata-rata = 85.83, standar deviasi = 4.50, rentang = 80-92. Distribusi hampir simetris (skewness = 0.07), namun lebih datar (kurtosis = -1.76).
  4. USIA: Rata-rata = 17.5, standar deviasi = 1.74, rentang = 15-20. Skewness dan kurtosis mendekati normal (skewness = 0, kurtosis = -1.38).

3.4 Statistika Deskriptif Data Baru

  1. Ukuran Sampel: 28 observasi.
  2. Observasi yang dianggap sebagai outlier telah dihapus secara otomatis menggunakan metode Henze-Zirkler, sehingga data baru lebih memenuhi asumsi normalitas.
  3. Kesimpulan: Setelah outlier dihilangkan, data baru memiliki ukuran sampel 28. Asumsi normalitas multivariat terpenuhi, tetapi normalitas univariat tetap tidak terpenuhi untuk beberapa variabel. Hal ini perlu diperhatikan saat menggunakan metode statistik yang mensyaratkan normalitas univariat.

3.5 Uji Homogenitas Ragam Peragam menggunakan Bartlett’s Test

  1. Hipotesis: H0: Variabel memiliki matriks korelasi identitas (tidak berkorelasi) H1: Variabel memiliki hubungan korelasi
  2. Keputusan: Chi-Square (Khi-squared): 94.763 Degrees of Freedom (df): 6 P-value: < 2.2e-16 kurang dari 0.05. maka, tolak Ho
  3. Kesimpulan: Dengan tingkat kepercayaan 95%, dapat disimpulkan bahwa variabel-variabel dalam data memiliki korelasi yang signifikan, sehingga memenuhi asumsi homogenitas ragam peragam. Sehingga, Data ini cocok untuk analisis yang mengasumsikan adanya hubungan antar variabel, seperti Analisis Diskriminan atau MANOVA.

3.6 Pengujian perbedaan rata-rata variabel dependen menggunakan Wilks’ Lambda

  1. Keputusan: Wilks’ Lambda: 0.064711 F-statistik Approximate: 101.17 P-value: 1.203e-12 (sangat signifikan).
  2. Kesimpulan: Dengan tingkat kepercayaan 95%, menunjukkan terdapat perbedaan rata-rata yang signifikan antara kelompok dalam variabel dependen (REKOMENDASI) berdasarkan kombinasi variabel prediktor (JAM_PRAKTIKUM, NILAI_PRAKTIKUM, dan USIA).

3.7 Kontribusi variabel prediktor terhadap variabel respon

Canonical R-Squared (CanRsq): 0.93529, variabel prediktor mampu menjelaskan 93.53% variabilitas dalam variabel dependen. 1. Eigenvalue: 14.453, mengindikasikan kekuatan fungsi diskriminan dalam membedakan kategori. 2. P-value 1.203e-12, maka hubungan antara variabel prediktor dan variabel dependen sangat signifikan

3.8 Model Diskriminan Linear

Y = 0.2899 JAM_PRAKTIKUM + 0.6336 NILAI_PRAKTIKUM − 0.0482USIA 1. Prior Probabilities of Groups: 0 (Tidak Direkomendasikan): 52% dan 1 (Direkomendasikan): 48% 2. Group Means: Rata-rata kelompok pada variabel prediktor menunjukkan bahwa kelompok Direkomendasikan memiliki: Lebih banyak JAM_PRAKTIKUM (13.58 vs. 5.85). Nilai NILAI_PRAKTIKUM lebih tinggi (89.75 vs. 81.77). USIA tidak jauh berbeda (17.33 vs. 17.31). 3. Koefisien Linear Diskriminan (LD1): JAM_PRAKTIKUM (0.2899) dan NILAI_PRAKTIKUM (0.6336) memberikan kontribusi positif yang signifikan terhadap fungsi diskriminan. USIA memberikan kontribusi negatif kecil (-0.0482), menunjukkan pengaruh yang lebih kecil dibandingkan dua prediktor lainnya.

3.9 Tabel Klasifikasi

> confusion_matrix <- matrix(
+   c(13, 0,  # Predicted 0 (13 untuk Actual 0, 0 untuk Actual 1)
+     0, 12), # Predicted 1 (0 untuk Actual 0, 12 untuk Actual 1)
+   nrow = 2,
+   byrow = FALSE, # Mengisi data berdasarkan kolom
+   dimnames = list(
+     Actual = c("0", "1"),  # Nama baris
+     Predicted = c("Predicted 0", "Predicted 1") # Nama kolom
+   )
+ )
> 
> print(confusion_matrix)
      Predicted
Actual Predicted 0 Predicted 1
     0          13           0
     1           0          12
> confusion_df <- as.data.frame(confusion_matrix)
> print(confusion_df)
  Predicted 0 Predicted 1
0          13           0
1           0          12

Kesimpulan: Model diskriminan menunjukkan performa yang sangat baik dalam memisahkan kelompok berdasarkan kategori REKOMENDASI, dengan tidak ada kesalahan klasifikasi untuk kedua kelompok. Model ini sangat andal untuk pengambilan keputusan terkait rekomendasi.

4 KESIMPULAN

Berdasarkan serangkaian pengujian asumsi dan analisis diskriminan pada data rekomendasi asesor, didapatkan kesimpulan sebagai berikut: 1. Asumsi Normalitas dan Korelasi: Meskipun terdapat pelanggaran Normalitas Univariat pada semua variabel prediktor, asumsi kunci Normalitas Multivariat terpenuhi (p-value Henze-Zirkler = 0.00793). Asumsi Korelasi/Homogenitas Ragam Peragam terpenuhi (Bartlett’s Test, p-value < 2.2 10^-16), menunjukkan bahwa variabel prediktor berkorelasi dan data cocok untuk Analisis Diskriminan (AD) atau MANOVA. 2. Signifikansi Perbedaan Kelompok: Hasil Wilks’ Lambda (p-value 1.203 10^-12) menunjukkan adanya perbedaan rata-rata yang sangat signifikan secara multivariat antara kelompok peserta didik Kompeten dan Belum Kompeten berdasarkan kombinasi variabel Jam Praktikum, Nilai Praktikum, dan Usia. 3. Kekuatan Model dan Kontribusi Variabel: Fungsi diskriminan yang terbentuk sangat kuat, dengan R^2 Kanonik sebesar 0.93529. Artinya, variabel prediktor mampu menjelaskan 93.53% variabilitas dalam perbedaan kelompok rekomendasi. Variabel Nilai Praktikum dan Jam Praktikum memberikan kontribusi positif yang dominan terhadap fungsi diskriminan, sementara Usia memberikan kontribusi yang kecil dan negatif. Perbedaan Rata-rata Kelompok menunjukkan bahwa kelompok Kompeten (1) memiliki rata-rata Jam Praktikum (13.58) dan Nilai Praktikum (89.75) yang jauh lebih tinggi dibandingkan kelompok Belum Kompeten (0) (Jam Praktikum 5.85; Nilai Praktikum 81.77). 4. Akurasi Klasifikasi Model ADL: Model Diskriminan Linier (LDA) menunjukkan akurasi klasifikasi yang sempurna, mampu mengklasifikasikan 13 observasi kelompok “Belum Kompeten” dan 12 observasi kelompok “Kompeten” dengan tanpa kesalahan klasifikasi (100% akurat). Model Diskriminan Linier adalah: Y = 0.2899 Jam Praktikum + 0.6336 Nilai Praktikum - 0.0482 Usia Dengan demikian, model ini sangat andal digunakan untuk memprediksi atau menentukan faktor kunci yang membedakan rekomendasi kompeten dan belum kompeten.

5 DAFTAR PUSTAKA

Joseph F. Hair. JR, R. A. (n.d.). Multivariate Data Analysis. K.V. Mardia, J. B. (1995). Multivariate Analysis. London: Academic Press. Prof. Dr. Purnomo, S. M., & Dr. Eddy Sutadji, M. d. (2022). Analisis Data Multivariat. Banyumas: Omera Pustaka.