Pendahuluan

Analisis korelasi dan regresi merupakan metode statistik yang digunakan untuk menganalisis hubungan antarvariabel. Analisis korelasi berfokus pada pengukuran kekuatan dan arah hubungan, sedangkan analisis regresi digunakan untuk memodelkan hubungan dan melakukan prediksi.

Materi ini membahas konsep dasar analisis korelasi dan regresi sederhana sebagai fondasi dalam analisis data kuantitatif.

Analisis Korelasi

Analisis korelasi digunakan untuk mengukur kekuatan dan arah hubungan linier antara dua variabel numerik. Koefisien korelasi dilambangkan dengan \(r\) dan bernilai antara \(-1\) hingga \(1\).

Semakin mendekati nilai absolut 1, hubungan antarvariabel semakin kuat.

Koefisien Korelasi Pearson

Koefisien korelasi Pearson digunakan jika data berskala interval atau rasio dan memiliki hubungan linier.

Rumus korelasi Pearson:

\[ r = \frac{\sum (X_i - \bar{X})(Y_i - \bar{Y})} {\sqrt{\sum (X_i - \bar{X})^2 \sum (Y_i - \bar{Y})^2}} \]

Kesimpulan

Analisis korelasi memberikan informasi mengenai kekuatan dan arah hubungan antarvariabel, sedangkan analisis regresi digunakan untuk membentuk model dan melakukan prediksi. Pemilihan metode harus disesuaikan dengan tujuan analisis.

Besaran Nilai Koefisien Korelasi

Koefisien korelasi, yang umumnya dilambangkan dengan \(r\), digunakan untuk menunjukkan kekuatan dan arah hubungan linier antara dua variabel kuantitatif. Nilai \(r\) berada pada rentang \(-1\) hingga \(1\).

  • Nilai \(r > 0\) menunjukkan hubungan linier positif, artinya peningkatan nilai pada satu variabel cenderung diikuti oleh peningkatan pada variabel lainnya.
  • Nilai \(r < 0\) menunjukkan hubungan linier negatif, artinya peningkatan nilai pada satu variabel cenderung diikuti oleh penurunan pada variabel lainnya.
  • Nilai \(r = 0\) menunjukkan tidak adanya hubungan linier antara dua variabel.

Besarnya nilai absolut \(r\) menunjukkan tingkat kekuatan hubungan. Semakin mendekati 1, hubungan linier antarvariabel semakin kuat.

Secara umum, kekuatan hubungan berdasarkan nilai absolut koefisien korelasi dapat diklasifikasikan sebagai berikut:

Nilai \(|r|\) Interpretasi Kekuatan Hubungan
0.00 – 0.19 Sangat lemah
0.20 – 0.39 Lemah
0.40 – 0.59 Sedang
0.60 – 0.79 Kuat
0.80 – 1.00 Sangat kuat

Interpretasi koefisien korelasi harus dilakukan dengan hati-hati. Hubungan yang tidak linier dapat menghasilkan nilai korelasi yang rendah meskipun secara visual kedua variabel saling berkaitan. Oleh karena itu, analisis korelasi sebaiknya selalu didukung dengan visualisasi data seperti scatter plot.

Jenis-Jenis Analisis Korelasi

Dalam praktik analisis data, koefisien korelasi tidak hanya terbatas pada korelasi Pearson. Pemilihan jenis korelasi harus disesuaikan dengan karakteristik data dan asumsi yang dipenuhi.

Korelasi Pearson

Korelasi Pearson digunakan untuk mengukur hubungan linier antara dua variabel kuantitatif. Metode ini mensyaratkan bahwa data berada pada skala interval atau rasio, berdistribusi normal, dan memiliki hubungan linier.

Koefisien korelasi Pearson dilambangkan dengan \(r\) dan memiliki rentang nilai antara \(-1\) hingga \(1\).

Korelasi Spearman

Korelasi Spearman merupakan metode korelasi nonparametrik yang digunakan untuk mengukur hubungan monotonik antara dua variabel. Metode ini tidak memerlukan asumsi normalitas data dan cocok digunakan pada data berskala ordinal atau data yang mengandung pencilan (outlier).

Koefisien korelasi Spearman dilambangkan dengan \(\rho\) (rho) dan dihitung berdasarkan peringkat (ranking) data.

Contoh Analisis

Pada contoh ini digunakan dataset mtcars, yaitu dataset bawaan R yang berisi karakteristik mobil. Dua variabel yang dianalisis adalah:

mpg : Miles per gallon (efisiensi bahan bakar)

wt : Berat mobil (dalam ribuan pound)

data(mtcars)
head(mtcars)
##                    mpg cyl disp  hp drat    wt  qsec vs am gear carb
## Mazda RX4         21.0   6  160 110 3.90 2.620 16.46  0  1    4    4
## Mazda RX4 Wag     21.0   6  160 110 3.90 2.875 17.02  0  1    4    4
## Datsun 710        22.8   4  108  93 3.85 2.320 18.61  1  1    4    1
## Hornet 4 Drive    21.4   6  258 110 3.08 3.215 19.44  1  0    3    1
## Hornet Sportabout 18.7   8  360 175 3.15 3.440 17.02  0  0    3    2
## Valiant           18.1   6  225 105 2.76 3.460 20.22  1  0    3    1

Visualisasi Hubungan Antarvariabel

plot(mtcars$wt, mtcars$mpg,
     xlab = "Berat Mobil (wt)",
     ylab = "Efisiensi Bahan Bakar (mpg)",
     main = "Scatter Plot Berat Mobil vs MPG",
     pch = 19)

cor(mtcars$wt, mtcars$mpg)
## [1] -0.8676594

##Interpretasi Nilai koefisien korelasi sebesar −0.868 menunjukkan bahwa:

Hubungan antara berat mobil dan efisiensi bahan bakar bersifat negatif

Kekuatan hubungan tergolong sangat kuat

Semakin berat mobil, efisiensi bahan bakar cenderung semakin rendah

##Uji Signifikansi Korelasi

cor.test(mtcars$wt, mtcars$mpg)
## 
##  Pearson's product-moment correlation
## 
## data:  mtcars$wt and mtcars$mpg
## t = -9.559, df = 30, p-value = 1.294e-10
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  -0.9338264 -0.7440872
## sample estimates:
##        cor 
## -0.8676594

Hasil uji korelasi Pearson menunjukkan nilai koefisien korelasi sebesar \(r = -0.868\) dengan nilai \(p\) kurang dari 0.05. Hal ini mengindikasikan bahwa terdapat hubungan linier negatif yang sangat kuat dan signifikan secara statistik antara berat mobil dan efisiensi bahan bakar. Meskipun nilai korelasi tinggi dan signifikan, hasil ini tidak dapat diinterpretasikan sebagai hubungan sebab-akibat. Analisis korelasi hanya menunjukkan keterkaitan linier antarvariabel.