Analisis Regresi Linear dan Asumsi

Rasnoorshiddieq Rashalhaque Razia Rasyid

30-6-2024

1 PENDAHULUAN

1.1 Latar Belakang

Analisis regresi linier adalah suatu cara yang dapat digunakan untuk mengetahui hubungan antara sebuah variabel tak bebas (regressand) dengan sebuah atau lebih variabel bebas (regressor). Regresi linier sederhana digunakan ketika hanya melibatkan satu variabel bebas, sedangkan regresi linier berganda digunakan ketika melibatkan dua atau lebih variabel bebas. Analisis regresi linier berganda mempunyai lebih dari satu variabel bebas, sering menimbulkan masalah karena terjadinya hubungan kuat antara dua variabel bebasnya yang mengakibatkan terjadinya kolenieritas ganda (multikolinieritas). Dalam analisis regresi linier, metode kuadrat terkecil (Ordinary Least Squares, OLS) biasanya digunakan untuk mengestimasi parameter regresi. Namun, jika terjadi multikolinieritas, maka metode ini tidak memberikan pendugaan yang stabil dan variansi koefisien regresi menjadi sangat besar. Oleh karena itu, diperlukan suatu metode pendugaan alternatif yang memberikan pendugaan yang lebih baik, seperti metode regresi gulud (Ridge Regression) yang dapat mengurangi dampak multikolinieritas dengan menentukan pendugaan yang bias tetapi mempunyai varians yang lebih kecil dari varians penduga regresi linier berganda

1.2 Tinjauan Pustaka

1.2.1 Analisis Regresi

Analisis regresi merupakan suatu proses statistik untuk mengestimasi hubungan antara variabel-variabel, yakni berupa teknik-teknik memodelkan dan melakukan analisis beberapa variabel atas dasar bentuk hubungan antara satu variabel tak bebas dan satu atau lebih variabel bebas (prediktor) (Amstrong, 2012:689). Analisis regresi digunakan hampir pada semua bidang kehidupan, baik dalam bidang pertanian, ekonomi dan keuangan, industri dan ketenagakerjaan, sejarah, pemerintahan, ilmu lingkungan, dan sebagainya. Kegunaan analisis regresi di antaranya untuk mengetahui variabel-variabel kunci yang memiliki pengaruh terhadap suatu variabel bergantung, pemodelan, serta pendugaan (estimation) atau peramalan (forecasting) (Nawari, 2010:2).

Persamaan regresi dapat terdiri dari satu atau lebih variabel bebas dan satu variabel terikat. Persamaan yang terdiri dari satu variabel bebas dan satu variabel terikat disebut persamaan regresi sederhana, sedangkan yang terdiri dari satu variabel terikat dan beberapa variabel bebas disebut persamaan regresi berganda. Regresi dapat dipisahkan menjadi regresi linear dan regresi non linear (Retnawati, 2017:5)

1.2.2 Regresi Sederhana

Regresi linear sederhana adalah persamaan regresi yang menggambarkan hubungan antara satu variabel bebas (X) dan satu variabel tak bebas (Y), dimana hubungan keduanya dapat digambarkan sebagai suatu garis lurus. Hubungan kedua variabel tersebut dapat dituliskan dalam bentuk persamaan: \[ Y = \beta_0 + \beta_1 X_i + \epsilon_i \] Y merupakan variabel tak bebas, X merupakan variabel bebas, \(\beta_0\) merupakan intersep/perpotongan dengan sumbu tegak, \(\beta_1\) merupakan kemiringan/gradien, \(\epsilon_i\) merupakan error yang saling bebas dan menyebar normal. Namun dalam kenyataan, seringkali kita tidak dapat mengamati seluruh anggota populasi sehingga hanya mengambil sampel. Persamaan yang diperoleh adalah dugaan dari persamaan dan dapat dituliskan sebagai: \[ Y = b_0 + b_1 X_i \] dimana b0 adalah penduga untuk \(\beta_0\) dan b1 adalah penduga untuk \(\beta_1\). Penggunaan metode analisis regresi linear sederhana memerlukan uji asumsi klasik yang secara statistik harus dipenuhi

1.2.3 Uji Asumsi Klasik

  1. Asumsi Normalitas

Uji normalitas berfungsi untuk menguji apakah dalam sebuah model regresi, variabel pengganggu memiliki distribusi normal (Ghozali, 2011:160). Model regresi yang baik adalah yang memiliki nilai residual yang terdistribusi secara normal. Cara untuk mendeteksinya adalah dengan melihat penyebaran data pada sumber diagonal pada grafik Normal PP Plot of regression standardized sebagai dasar pengambilan keputusannya. Jika menyebar sekitar garis dan mengikuti garis diagonal maka model regresi tersebut telah normal dan layak dipakai untuk memprediksi variabel bebas dan sebaliknya (Ghozali, 2016).

  1. Asumsi Linearitas

Asumsi linearitas adalah salah satu persyaratan statistik yang harus dipenuhi dalam analisis regresi linier. Asumsi ini berfungsi untuk mengetahui apakah hubungan antara variabel independen dan dependen bersifat linear atau tidak. Dalam analisis regresi linier, asumsi linearitas digunakan untuk memastikan bahwa model yang dibangun memiliki hubungan yang linear antara variabel independen dan dependen

  1. Asumsi Heteroskedastisitas

Menurut Ghozali (2011:139) uji heteroskedastisitas digunakan untuk menguji apakah dalam sebuah regresi terjadi ketidaksamaan varian dari residual dari suatu pengamatan ke pengamatan lain. Prasyarat yang harus terpenuhi dalam model regresi adalah tidak adanya gejala heteroskedastisitas.

  1. Asumsi Autokorelasi

Menurut Ghozali (2011: 110), uji autokolerasi bertujuan menguji apakah dalam model regresi linear ada kolerasi antara kesalahan pengganggu pada periode t dengan kesalahan pengganggu pada periode t-1 (sebelumnya). Jika terjadi autokolerasi maka dinamakan ada problem autokolerasi. Uji autokorelasi dapat dilakukan dengan pengujian Durbin Watson (DW).

1.2.4 Uji Hipotesis

Hipotesis berfungsi untuk memberi suatu pernyataan berupa dugaan tentang hubungan tentatif antara fenomena - fenomena dalam penelitian. Metode pengujian terhadap hipotesis yang diajukan dilakukan pengujian secara parsial.

  1. Uji F

Menurut Ghozali (2016), Uji F (Uji Simultan) digunakan untuk mengetahui ada atau tidaknya pengaruh secara bersama – sama atau simultan antara variabel independen terhadap variabel dependen. Pengujian statistik ANOVA merupakan bentuk pengujian hipotesis dimana dapat menarik kesimpulan berdasarkan data atau kelompok statistik yang disimpulkan. Pengambilan keputusan dilihat dari pengujian ini dilakukan dengan melihat nilai F yang terdapat di dalam tabel ANOVA, tingkat signifikansi yang digunakan yaitu sebesar 0,05. Adapun ketentuan dari uji F yang pertama adalah jika nilai signifikan F < 0,05 maka \(H_0\) ditolak dan \(H_1\) diterima, berarti semua variabel independen/bebas memiliki pengaruh secara signifikan terhadap variabel dependen/terikat. Ketentuan yang kedua adalah jika nilai signifikan F > 0,05 maka \(H_0\) diterima dan \(H_1\), berarti semua variabel independen/bebas tidak memiliki pengaruh secara signifikan terhadap variabel dependen/terikat.

1.3 Data

Data yang digunakan adalah data Nilai dan kualitas pelayanan keperawatan dan nilai rata-rata jumlah pasien yang diambil dari Scribd.com

1.4 Tujuan

Mengetahui Pengaruh Kualitas Pelayanan Terhadap Jumlah Pasien: Analisis regresi juga digunakan untuk mengetahui apakah kualitas pelayanan keperawatan memiliki pengaruh signifikan terhadap jumlah pasien yang datang ke rumah sakit. Dengan demikian, rumah sakit dapat meningkatkan kualitas pelayanan untuk meningkatkan jumlah pasien yang datang.

2 SOURCE CODE

2.1 Library

> # Library
> library("lmtest") #untuk pemeriksaan asumsi
> library("car") #untuk pemeriksaan asumsi
> library("tseries") #untuk pemeriksaan asumsi normalitas

2.2 Impor Data

> y <- c(149,158,156,147,149,150,153,156,158,160) #Jumlah pasien
> x <- c(50,54,53,48,50,52,50,53,54,55) #Kualitas pelayanan keperawatan
> data1 <- data.frame(y,x)
> data1
     y  x
1  149 50
2  158 54
3  156 53
4  147 48
5  149 50
6  150 52
7  153 50
8  156 53
9  158 54
10 160 55

2.3 Plot

> plot(data1$x, data1$y, 
+      xlab = "kualitas pelayanan keperawatan", 
+      ylab = "jumlah pasien")

Berdasarkan plot yang terbentuk, dapat dilihat bahwa pada Plot nilai - nilai pengamatan cenderung membentuk garis linier sehingga terdapat hubungan linier antar kedua variabel.

2.4 Asumsi

> model1 <- lm(y~x, data=data1)
> model1

Call:
lm(formula = y ~ x, data = data1)

Coefficients:
(Intercept)            x  
     56.661        1.868  
> #uji asumsi
> #uji linieritas
> plot(data1$x, data1$y, 
+      xlab = "kualitas pelayanan keperawatan", 
+      ylab = "jumlah pasien")

> 
> #asumsi normalitas
> qqPlot(model1$residuals)

[1] 6 7
> shapiro.test(model1$residuals)

    Shapiro-Wilk normality test

data:  model1$residuals
W = 0.86494, p-value = 0.08723
> jarque.bera.test(model1$residuals)

    Jarque Bera Test

data:  model1$residuals
X-squared = 1.1739, df = 2, p-value = 0.556
> #asumsi homoskedastisitas
> plot(model1)

> bptest(model1)

    studentized Breusch-Pagan test

data:  model1
BP = 0.35246, df = 1, p-value = 0.5527
> 
> #asumsi nonautokorelasi
> dwtest(model1)

    Durbin-Watson test

data:  model1
DW = 2.4326, p-value = 0.7229
alternative hypothesis: true autocorrelation is greater than 0
> 
> #uji F
> summary(model1)

Call:
lm(formula = y ~ x, data = data1)

Residuals:
    Min      1Q  Median      3Q     Max 
-3.7868 -0.7020  0.4115  0.5768  2.9488 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)  56.6610    13.8778   4.083 0.003520 ** 
x             1.8678     0.2672   6.991 0.000114 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 1.83 on 8 degrees of freedom
Multiple R-squared:  0.8593,    Adjusted R-squared:  0.8418 
F-statistic: 48.88 on 1 and 8 DF,  p-value: 0.0001136

3 HASIL DAN PEMBAHASAN

3.1 Statistika Deskriptif

3.1.1 Model Regresi

Berdasarkan perhitungan didapatkan model regresi sebagai berikut

\[ Y=56.661+1.868x \] artinya ketika \(x=0\) (kualitas pelayanan keperawatan) maka jumlah pasien sebanyak 56.661, dan setiap \(x\) bertambah 1 maka jumlah pasien bertambah sebanyak 1.868

3.1.2 Uji Linearitas

> plot(data1$x, data1$y, 
+      xlab = "kualitas pelayanan keperawatan", 
+      ylab = "jumlah pasien")

Setelah dilakukan plot, dapat terlihat bahwa data memiliki pola linier naik, sehingga asumsi linearitas dapat dipenuhi.

3.1.3 Uji Normalitas

> qqPlot(model1$residuals)

[1] 6 7

Setelah dilakukan Plot, hasil yang didapatkan masih kurang jelas untuk diambil kesimpulan.

> shapiro.test(model1$residuals)

    Shapiro-Wilk normality test

data:  model1$residuals
W = 0.86494, p-value = 0.08723
> jarque.bera.test(model1$residuals)

    Jarque Bera Test

data:  model1$residuals
X-squared = 1.1739, df = 2, p-value = 0.556
  • Berdasarkan Shapiro-wilk didapatkan bahwa \(p-value >0.05\), maka gagal tolak \(H_0\) artinya Data residu berdistribusi normal dan asumsi normalitas terpenuhi
  • Berdasarkan Jarque Bera didapatkan bahwa \(p-value >0.05\), maka gagal tolak \(H_0\) artinya Data residu berdistribusi normal dan asumsi normalitas terpenuhi

3.1.4 Uji homoskedastisitas

> bptest(model1)

    studentized Breusch-Pagan test

data:  model1
BP = 0.35246, df = 1, p-value = 0.5527

Berdasarkan uji Breusch pagan didapatkan bahwa \(p-value >0.05\), maka gagal menolak \(H_0\), sehingga tidak terjadi Heteroskedastisitas dan asumsi Homoskedastisitas terpenuhi

3.1.5 Uji non autokorelasi

> dwtest(model1)

    Durbin-Watson test

data:  model1
DW = 2.4326, p-value = 0.7229
alternative hypothesis: true autocorrelation is greater than 0

Berdasarkan uji durbin Watson didapatkan \(p-value >0.05\), maka gagal tolak \(H_0\), sehingga tidak terjadi autokorelasi, maka asumsi non-autokorelasi terpenuhi

3.2 Hipotesis

\(h_0:\) tidak terdapat pengaruh yang signifikan antara kualitas pelayanan keperawatan terhadap jumlah pasien \(h_1:\) terdapat pengaruh yang signifikan antara kualitas pelayanan keperawatan terhadap jumlah pasien

3.3 Statistik Uji

> summary(model1)

Call:
lm(formula = y ~ x, data = data1)

Residuals:
    Min      1Q  Median      3Q     Max 
-3.7868 -0.7020  0.4115  0.5768  2.9488 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)  56.6610    13.8778   4.083 0.003520 ** 
x             1.8678     0.2672   6.991 0.000114 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 1.83 on 8 degrees of freedom
Multiple R-squared:  0.8593,    Adjusted R-squared:  0.8418 
F-statistic: 48.88 on 1 and 8 DF,  p-value: 0.0001136

Didapatkan \(p-value<0.05\), maka tolak \(H0\) yang artinya terdapat pengaruh yang signifikan antara kualitas pelayanan keperawatan terhadap jumlah pasien

4 KESIMPULAN

Dari hasil perhitungan analisis regresi dan uji asumsi bisa disimpulkan bahwa variabel prediktor (kualitas pelayanan keperawatan) berpengaruh terhadap variabel respons (jumlah pasien) yang berarti bahwa setiap perawat harus melayani dengan kualitas yang tinggi agar jumlah pasien bertambah

5 DAFTAR PUSTAKA

Achmad Efendi, Ni Wayan Surya Wardhani, Rahma Fitriani, Eni Sumarminingsih. (2020). Analisis Regresi : Teori dan Aplikasi dalam R. Malang: Universitas Brawijaya Press.