Virus Ebola adalah salah satu penyebab penyakit yang paling mematikan dan menular di dunia. Dalam beberapa tahun terakhir, virus ini telah menyebar ke berbagai negara di Afrika dan telah menyebabkan wabah yang signifikan. Salah satu aspek yang penting dalam memahami virus Ebola adalah masa inkubasi, yaitu waktu antara saat seseorang terinfeksi dengan saat ia menunjukkan gejala klinis pertama. Masa inkubasi ini sangat penting dalam menentukan strategi pengobatan dan pencegahan yang efektif.
Banyak faktor yang dapat mempengaruhi masa inkubasi virus Ebola, termasuk jenis kelamin, vaksinasi, dan massa jenis darah. Jenis kelamin telah ditemukan memiliki pengaruh pada masa inkubasi virus Ebola, dengan laki-laki cenderung memiliki masa inkubasi yang lebih pendek dibandingkan perempuan. Vaksinasi juga telah ditemukan memiliki efek pada masa inkubasi, dengan individu yang divaksinasi memiliki masa inkubasi yang lebih pendek dibandingkan dengan yang tidak divaksinasi. Massa jenis darah, yang dapat dipengaruhi oleh faktor genetik dan lingkungan, juga telah ditemukan memiliki pengaruh pada masa inkubasi virus Ebola.
Dalam risalah ini, kita akan menggunakan model regresi linear untuk menganalisis pengaruh jenis kelamin, vaksinasi, dan massa jenis darah terhadap masa inkubasi virus Ebola. Kita akan menggunakan data dari beberapa studi yang telah dilakukan sebelumnya untuk menganalisis hubungan antara variabel-variabel tersebut dengan masa inkubasi virus Ebola.
Statistika deskriptif adalah metode dalam statistika yang berkaitan dengan pengumpulan dan penyajian suatu data sehingga memberikan informasi yang berguna dan mempermudah dalam pemahamannya. Hasil ringkasan dari statistika deskriptif dapat digambarkan atau disajikan dalam bentuk table atau grafik-grafik, seperti histogram, grafik, dan sebagainya.
Histogram adalah penyajian distribusi frekuensi menggunakan gambar yang berbentuk diagaram batang tegak. Pada histogram, antara dua batang yang berdampingan tidak terdapat jarak sehingga tiap-tiap batang berhimpit satu sama lain. Grafik histogram terdiri dari sumbu X yang menampilkan interval, sumbu Y menampilkan nilai, dan batang akan menampilkan nilai sesuai dengan intervalnya.
Sebelum dilakukan analisis lebih lanjut, pengujian asumsi adalah salah satu bagian penting dalam analisis regresi linear maupun nonlinear. Terdapat asumsi yang harus dipenuhi dalam regresi linear, yaitu asumsi linearitas, normalitas, multikolinearitas, homoskedastisitas, dan autokorelasi.
Asumsi linearitas bertujuan untuk mengetahui apakah dua variabel mempunyai hubungan yang linear atau tidak secara signifikan. Jika tidak signifikan, artinya hubungan tidak linear, residu tidak normal, secara tak langsung juga melanggar asumsi normalitas (Haqqoni, 2018). Asumsi Linearitas merupakan pemeriksaan dengan sebuah plot antara variabel standarisasi residual dengan nilai y duga. Apabila plot tidak membentuk pola, maka asumsi linearitas terpenuhi, begitupun sebaliknya.
Uji normalitas bertujuan untuk mengetahui distribusi data dalam variabel yang akan digunakan dalam penelitian dan sebaliknya digunakan sebelum data diolah berdasarkan model-model penelitian. Pada uji normalitas ini digunakan untuk galat sehingga galat harus menyebar secara normal. Hal ini dikarenakan jika galat sudah menyebar normal, maka dapat dikatakan bahwa variabel respons sudah menyebar normal. Uji normalitas dapat dilakukan dengan uji Saphiro-Wilk, Kolmogorov-Smirnov, atau Jarque-Bera. Selain melakukan uji Kolmogorov-smirnov pada galat, dapat juga melakukan pemeriksaan normalitas dengan QQ Plot. Apabila hasil keputusan uji Kolmogorov-smirnov menghasilkan terima \(H_0\), maka asumsi terpenuhi. Berikut adalah hipotesis pada asumsi uji normalitas.
\(H_0: \text{Galat menyebar normal}\)
\(H_1: \text{Galat tidak menyebar normal}\)
Menurut Imam Ghozali (2013) asumsi multikolinearitas bertujuan untuk memeriksa apakah model regresi ditemukan adanya korelasi antar variabel bebas (independen). Model regresi yang baik seharusnya tidak terjadi korelasi diantara variabel independen. Jika variabel independen saling berkorelasi, maka matriks variabel prediktor tidak ortogonal. Variabel ortogonal adalah variabel independen yang nilai korelasi antar sesama variabel independen sama dengan nol. Terdapat dua cara untuk mendeteksi ada tidaknya multikolinearitas pada variabel prediktor, yaitu dengan nilai VIF (Variance Infaltion Factor) dan nilai Tolerance. Apabila nilai VIF kurang dari 10 \(\text{(VIF < 10)}\) atau Tolerance lebih dari 0.1 \(\text{(TOL > 0.1)}\), maka variabel prediktor bersifat independen.
Homoskedasitas merujuk pada saat di suatu model regresi, residualnya menunjukkan adanya kesamaan ragam. Ragam residual yang konstan dapat menunjukkan tidak adanya pola yang tidak terduga dalam sebaran data, sehingga mempengaruhi efisiensi dan validitas hasil analisis regresi(Patricia & Rusmanto, 2022). Dalam pengujian asumsi homoskedastisitas dapat dilakukan dengan penggambaran scatterplot residual atau dapat juga dengan uji Koefisien Rank-Spearman. Selain itu, dapat juga dengan uji Breuss-Pagan. Apabila hasil keputusan terima \(H_0\), maka asumsi homoskedastisitas terpenuhi. Berikut adalah hipotesis dari pengujian Breuss-Pagan.
\(H_0: \text{Ragam galat sudah bersifat kostan}\)
\(H_1: \text{Ragam galat tidak bersifat konstan}\)
Asumsi autokorelasi merupakan asumsi yang menguji apakah terdapat korelasi antara residual satu dengan residual yang lain. Asumsi autokorelasi dapat menggunakan uji Durbin-Watson. Apabila hasil keputusan uji Durbin-Watson menghasilkan terima \(H_0\), maka asumsi Autokorelasi terpenuhi. Berikut adalah hipotesis dari uji Durbin-Watson.
\(H_0: \text{Tidak terjadi autokorelasi}\)
\(H_1: \text{Terjadi autokorelasi}\)
Model Regresi Linear merupakan sebuah pemodelan yang umum digunakan pada variabel respons yang bersifat kontinu dan dipengaruhi oleh variabel prediktor. Skala data variabel prediktor dapat berupa kontinu atau kategorik (dikatakan variabel Dummy jika bersifat kategorik). Pada model regresi linear, variabel respons dan galat menyebar secara normal, sedangkan variabel prediktor tidak memiliki ketentuan dalam sebarannya. Berikut adalah pemodelan regresi linear.
\(\overline{y}=\beta_0+\beta_1 x_1+...+\beta_ix_i\) \(i=1,2,...\)
Estimasi parameter pada model regresi linear dapat dihitung menggunakan matriks. Misalkan sebuah variabel prediktor terhimpun pada sebuah matriks \(X\) dan variabel matriks respons terhimpun pada sebuah matriks \(Y\) maka matriks beta (\(\beta\)) dapat dihitung dengan rumus berikut.
\[ X=\begin{bmatrix} 1 & x_{11} & x_{21} & \cdots & x_{i1}\\ 1 & x_{12} & x_{22} & \cdots & x_{i2}\\ 1 & \vdots & \vdots & \ddots & \vdots \\ 1 & x_{1j} & x_{1j} & \cdots & x_{ij} \end{bmatrix} \] \[ Y=\begin{bmatrix} y_{11} & y_{21} & \cdots & y_{i1}\\ y_{12} & y_{22} & \cdots & y_{i2}\\ \vdots & \vdots & \ddots & \vdots \\ y_{1j} & y_{1j} & \cdots & y_{ij} \end{bmatrix} \] \[ \beta= \begin{bmatrix} \beta_{0} \\ \beta_{1} \\ \vdots \\ \beta_{i} \end{bmatrix} \] \[ \beta=[X^TX]^{-1}[X^TY] \]
Terdapat 2 pengujian parameter pada model regresi linear, yaitu uji parsial dan uji simultan.
Uji parsial merupakan uji masing-masing paramater model regresi. Dengan kata lain, uji parsial menguji apakah variabel prediktor tersebut memiliki pengaruh terhadap variabel respons secara parsial. Berikut hipotesis dari uji parsial.
\(H_0 : \beta_i = 0\)
\(H_1 : \beta_i \neq 0\)
\(i=0,1,2,...\)
Berbeda dengan uji parsial, uji simultan merupakan uji seluruh parameter model regresi secara bersamaan sehingga nantinya akan diketahui apakah variabel prediktor dapat memengaruhi variabel respons secara simultan. Berikut hipotesis dari uji simultan.
\(H_0 : \beta_0 =...=\beta_i = 0\)
\(H_1 : \text{Minimal ada 1 pasang }\beta_i \neq 0\)
Koefisien determinasi \((R^2)\) merupakan ukuran ketepatan sebuah model regresi yang bernilai di antara 0 sampai 1. Semakin mendekati 1, maka akan semakin tinggi kemampuan variabel prediktor menggambarkan variabel respons, begitu juga sebaliknya. Secara umum, koefisien determinasi akan naik seiring dengan kenaikan keragaman variabel prediktor, begitupun sebaliknya dengan asumsi model sudah benar. Yang perlu diingat, koefisien determinasi tidak menjamin slope sudah baik. Koefisien determinasi dapat dicari dengan rumus berikut.
\(R^2 =\frac{SS_{Regression}}{SS_{Total}}=1-\frac{SS_{Error}}{SS_{Total}}\)
> Virus_Ebola <- read_excel("C:/Users/Asus/Downloads/Virus Ebola.xlsx")
> View(Virus_Ebola)
> paged_table(Virus_Ebola)
Error in paged_table(Virus_Ebola): could not find function "paged_table"Keterangan :
Y = Massa inkubasi Virus Ebola (hari)
X1 = Jenis kelamin (0 = Perempuan, 1 = Laki-Laki)
X2 = Vaksinasi (0 = Belum pernah vaksin, 1 = Vaksin pertama, 2 = Vaksin kedua, 3 = Vaksin ketiga)
X3 = Massa jenis darah (gr/ml)
Berdasarkan data yang terlampir, dapat dikatakan bahwa variabel X1 dan X2 merupakan variabel kategorik karena bersifat diskrit, sedangkan variabel X3 merupakan kontinu. Pertama, melakukan statistika deskriptif terhadap variabel yang bersifat kontinu, yaitu variabel X3 dan Y.
Dari boxplot di atas dapat disimpulkan bahwa tidak ada pencilan pada
variabel respons. Selanjutnya boxplot pada variabel X3.
Dari boxplot variabel X3 ditemukan terdapat 3 pencilan bawah. Cara untuk
mengatasi pencilan adalah menghapus nilai yang pencilan, atau dapat juga
dengan transformasi. Namun, data virus ebola sudah sangat sedikit. Jika
terdapat nilai yang dihapus maka hasil analisis model akan kurang cukup
akurat.
Selain boxplot, statistika deskriptif juga diterapkan pada variabel X1 dan X2, yaitu dengan diagram batang.
Virus_Ebola$X1 :
Frequency Percent Cum. percent
0 9 25.7 25.7
1 26 74.3 100.0
Total 35 100.0 100.0
Diagram di atas menunjukkan bahwa terdapat 26 pasien laki-laki dan 9 pasien perempuan. Selanjutnya variabel X2.
Virus_Ebola$X2 :
Frequency Percent Cum. percent
0 3 8.6 8.6
1 5 14.3 22.9
2 13 37.1 60.0
3 14 40.0 100.0
Total 35 100.0 100.0
Dari atas diagram batang menunjukkan bahwa terdapat 3 pasien yang belum vaksin, 5 pasien telah vaksin pertama, 13 pasien telah vaksin kedua, dan 14 pasien telah vaksin ketiga.
Plot di atas menunjukkan residual menyebar secara acak tanpa membuat
pola seiring dengan garis merah sehingga dapat disimpulkan bahwa
asumsi linearitas terpenuhi pada kasus ini.
Hipotesis :
\(H_0: \text{Galat menyebar normal}\)
\(H_1: \text{Galat tidak menyebar normal}\)
Taraf Nyata :
\(\alpha=0.05\)
Statistik Uji :
> library(tseries)
> model <- lm(Y ~ X1 + X2 + X3, data = Virus_Ebola)
> jarque.bera.test(resid(model))
Jarque Bera Test
data: resid(model)
X-squared = 3.1752, df = 2, p-value = 0.2044Keputusan :
Karena \(p-value (0.2044)> \alpha (0.05)\), maka terima \(H_0\)
Kesimpulan :
Dengan taraf nyata 5% dapat disimpulkan bahwa galat sudah menyebar normal sehingga variabel respons juga dapat dikatakan menyebar secara normal atau dengan kata lain asumsi normalitas terpenuhi.
> library(car)
> model <- lm(Y ~ X1 + X2 + X3, data = Virus_Ebola)
> vif(model)
X1 X2 X3
1.015920 1.016090 1.001125 Asumsi multikolinearitas hanya sebuah pemeriksaan. Disini asumsi multkolinearitas menggunakan nilai VIF. Pada hasil output VIF di atas dapat dilihat bahwa VIF seluruh variabel bernilai sekitar 1 atau kurang dari 10 yang artinya asumsi multikolinearitas terpenuhi.
Plot di atas menunjukkan residu tersebar di sepanjang rentang prediktor
sehingga dapat disimpulkan bahwa variansi dari galat sudah bersifat
homogen.
Hipotesis :
\(H_0: \text{Ragam galat bersifat konstan}\)
\(H_1: \text{Ragam galat tidak bersifat konstan}\)
Taraf Nyata :
\(\alpha=0.05\)
Statistik Uji :
> library(car)
> model <- lm(Y ~ X1 + X2 + X3, data = Virus_Ebola)
> bptest(model)
studentized Breusch-Pagan test
data: model
BP = 4.5245, df = 3, p-value = 0.2101Keputusan :
Karena \(p-value (0.2201)> \alpha (0.05)\), maka terima \(H_0\)
Kesimpulan :
Dengan taraf nyata 5%, dapat disimpulkan bahwa antar ragam galat pada setiap pengamatan bersifat konstan yang artinya asumsi homoskedastisitas terpenuhi.
Hipotesis :
\(H_0: \text{Tidak terjadi autokorelasi}\)
\(H_1: \text{Terjadi autokorelasi}\)
Taraf Nyata :
\(\alpha=0.05\)
Statistik Uji :
> library(car)
> model <- lm(Y ~ X1 + X2 + X3, data = Virus_Ebola)
> durbinWatsonTest(model)
lag Autocorrelation D-W Statistic p-value
1 -0.2192528 2.394799 0.226
Alternative hypothesis: rho != 0Keputusan :
Karena \(p-value (0.228)> \alpha (0.05)\), maka terima \(H_0\)
Kesimpulan :
Dengan taraf nyata 5%, dapat disimpulkan bahwa tidak ada korelasi antara residual satu dengan residual yang lain sehingga asumsi autokorelasi terpenuhi.
> model <- lm(Y ~ X1 + X2 + X3, data = Virus_Ebola)
> summary(model)$coefficient[,1]
(Intercept) X1 X2 X3
17.3849361 0.4940020 -0.5123635 -3.3355299 Dari output di atas dapat dilakukan pemodelan regresi seperti sebagai berikut.
\(\hat{Y}=17.3849361 + 0.4940020X_1 - 0.5123635X_2 - 3.3355299X_3\)
Berikut adalah interpretasi dari masing masing penduga parameter.
Konstanta sebesar 17.385 menyatakan bahwa jika variabel jenis kelamin, vaksinasi, dan massa jenis darah (gr/ml) dianggap tetap maka nilai massa inkubasi Virus Ebola terjadi selama 17.385 per hari.
Koefisien regresi X1 sebesar 0.494 menyatakan bahwa setiap jenis kelamin maka akan meningkatkan massa inkubasi Virus Ebola selama 0.494 hari.
Koefisien regresi X2 sebesar - 0.512 menyatakan bahwa setiap terdapat peningkatan 1 kategorik vaksinasi, maka akan menurunkan hasil massa inkubasi Virus Ebola selama 0.512 hari.
Koefisien regresi X3 sebesar - 3.335 menyatakan bahwa setiap peningkatan 1 gr/ml massa jenis darah akan menurunkan massa inkubasi Virus Ebola selama - 3.335 hari.
> model <- lm(Y ~ X1 + X2 + X3, data = Virus_Ebola)
> summary(model)$coefficient
Estimate Std. Error t value Pr(>|t|)
(Intercept) 17.3849361 3.6069381 4.819860 3.597206e-05
X1 0.4940020 0.9193181 0.537357 5.948576e-01
X2 -0.5123635 0.4287499 -1.195017 2.411430e-01
X3 -3.3355299 3.2203391 -1.035770 3.083221e-01Dari output di atas dapat dituliskan pengujian dari hipotesis hingga kesimpulan pada masing-masing variabel.
Hipotesis :
\(H_0: \beta_0=0\)
\(H_1: \beta_0 \neq 0\)
Taraf Nyata :
\(\alpha=0.05\)
Statistik Uji :
\(t-value=4.819860\)
\(p-value=3.597206e-05\)
Keputusan :
Karena \(p-value (0.000) < \alpha (0.05)\), maka tolak \(H_0\)
Kesimpulan :
Pada taraf nyata 5%, dapat disimpulkan bahwa keragaman dalam konstanta (jenis kelamin, vaksinasi, dan massa jenis darah) memengaruhi keragaman dalam Y (masa inkubasi virus ebola).
\(H_0: \beta_1=0\)
\(H_1: \beta_1 \neq 0\)
Taraf Nyata :
\(\alpha=0.05\)
Statistik Uji :
\(t-value=0.537357\)
\(p-value=5.948576e-01\)
Keputusan :
Karena \(p-value (0.595) > \alpha (0.05)\), maka terima \(H_0\)
Kesimpulan :
Pada taraf nyata 5% dapat disimpulkan bahwa jenis kelamin tidak memengaruhi masa inkubasi virus ebola.
\(H_0: \beta_2=0\)
\(H_1: \beta_2 \neq 0\)
Taraf Nyata :
\(\alpha=0.05\)
Statistik Uji :
$t-value=-1.195017 $
\(p-value=2.411430e-01\)
Keputusan :
Karena \(p-value (0.241) > \alpha (0.05)\), maka terima \(H_0\)
Kesimpulan :
Pada taraf nyata 5% dapat disimpulkan bahwa kategori vaksinisasi tidak memengaruhi masa inkubasi virus ebola.
\(H_0: \beta_3=0\)
\(H_1: \beta_3 \neq 0\)
Taraf Nyata :
\(\alpha=0.05\)
Statistik Uji :
\(t-value=-1.035770\)
\(p-value=3.083221e-01\)
Keputusan :
Karena \(p-value (0.308) > \alpha (0.05)\), maka terima \(H_0\)
Kesimpulan :
Pada taraf nyata 5% dapat disimpulkan bahwa massa jenis darah tidak memengaruhi masa inkubasi virus ebola.
> model <- lm(Y ~ X1 + X2 + X3, data = Virus_Ebola)
> summary(model)
Call:
lm(formula = Y ~ X1 + X2 + X3, data = Virus_Ebola)
Residuals:
Min 1Q Median 3Q Max
-4.1972 -1.9080 0.4877 1.8315 3.2151
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 17.3849 3.6069 4.820 3.6e-05 ***
X1 0.4940 0.9193 0.537 0.595
X2 -0.5124 0.4287 -1.195 0.241
X3 -3.3355 3.2203 -1.036 0.308
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 2.358 on 31 degrees of freedom
Multiple R-squared: 0.07784, Adjusted R-squared: -0.0114
F-statistic: 0.8722 on 3 and 31 DF, p-value: 0.466Hipotesis :
\(H_0 : \beta_0 =...=\beta_i = 0\)
\(H_1 : \text{Minimal ada 1 pasang }\beta_i \neq 0\)
Taraf Nyata :
\(\alpha=0.05\)
Statistik Uji :
\(F-Statistic=0.8722\)
\(p-value=0.466\)
Keputusan :
Karena \(p-value (0.466) > \alpha (0.05)\), maka terima \(H_0\)
Kesimpulan :
Pada taraf nyata 5% dapat disimpulkan bahwa jenis kelamin, vaksinasi, dan massa jenis darah tidak memengaruhi masa inkubasi virus ebola secara simultan.
Dari ketiga variabel (jenis kelamin, vaksinisasi, dan massa jenis darah) yang diduga memengaruhi masa inkubasi virus ebola, ternyata pada kasus ini dijelaskan secara statistik bahwa jenis kelamin, vaksinisasi, dan massa jenis darah tidak memengaruhi masa inkubasi virus ebola.
Patricia, M., & Rusmanto, T. (2022). Pengaruh konservatisme akuntansi, struktur modal dan arus kas bebas terhadap nilai perusahaan sebelum dan selama pandemi covid-19 pada perusahaan …. Fair Value: Jurnal Ilmiah Akuntansi Dan …, 4(5), 2055–2075.
Haqqoni, M. G. A. (2018). Asumsi Regressi. Diakses pada 28 Mei 2024, dari https://rpubs.com/mghozyah/linear-regression-simulation