1 PENDAHULUAN
1.1 Latar Belakang
Tinggi badan dan berat badan sering digunakan sebagai indikator dalam menentukan komposisi tubuh seseorang terkategori ideal atau tidak. Berat badan adalah parameter yang memberikan gambaran massa tubuh seseorang. Sedangkan tinggi badan adalah jarak dari alas kaki sampai titik tertinggi pada kepala. Pada keadaan normal, tinggi badan akan bertambah seiring dengan pertambahan usia. Namun hal ini tidak terjadi pada berat badan, bisa saja usia tua memiliki berat badan yang lebih ringan dari usia muda atau sebaliknya. Di sisi lain terdapat sumber yang mengatakan tinggi badan dapat mempengaruhi berat badan seseorang. Untuk membuktikan hal tersebut, perlu dilakukan penelitian tentang apakah benar tinggi badan dapat mempengaruhi berat badan seseorang. Digunakan data rata-rata tinggi badan dan berat badan wanita Amerika dengan 15 observasi.
1.2 Statistika Deskriptif
Statistika deskriptif merupakan metode yang digunakan dalam pengumpulan, peringkasan, dan penyajian data dalam bentuk visual maupun lainnya. Hal ini bertujuan agar data lebih bermakna, dan mudah dipahami oleh pengguna data. Statistika deskriptif hanya sebatas memberikan deskripsi atau gambaran umum tentang karakteristik objek yang diteliti meliputi ukuran-ukuran statistik seperti frekuensi, pemusatan data, dan penyebaran data, tanpa maksud untuk melakukan generalisasi sampel terhadap populasi.
1.3 Analisis Regresi
Analisis regresi merupakan suatu metode yang dapat digunakan untuk mengetahui hubungan sebuah variabel tak bebas dengan satu atau lebih variabel bebas. Variabel bebas sering disebut dengan variabel prediktor, dimana variabel ini mempengaruhi variabel tak bebas (respon). Berdasarkan jumlah variabel bebas, analisis regresi terbagi menjadi dua macam yaitu regresi linier sederhana dan regresi linier berganda. Analisis regresi akan menghasilkan model, dan model tersebut dapat diinterpretasikan jika telah memenuhi uji kenormalan, uji homoskedastisitas, uji non autokorelasi, uji multikolinieritas, uji simultan (F) dan uji parsial (t).
1.3.1 Regresi Linier Sederhana
Analisis regresi linier sederhana dilakukan jika hanya ada satu variabel prediktor yang mempengaruhi variabel respon. Regresi linier sederhana memiliki bentuk persamaan sebagai berikut. \[ Y = \alpha + \beta X + \epsilon \] dimana \(\alpha\) dan \(\beta\) merupakan koefisien regresi dan \(\epsilon\) merupakan sisaan. Bentuk persamaan regresi di atas dapat diduga dengan \(Y=\beta0 + \beta1X + e\). Pada analisis regresi linier sederhana hanya diperlukan uji kenormalan, uji homoskedastisitas, uji non autokorelasi, uji simultan (F) dan uji parsial (t), tanpa uji multikolinieritas.
1.3.2 Uji Normalitas
Uji normalitas dilakukan pada galat (sisaan), yang mana galat harus menyebar normal. Dapat dilakukan dengan uji Jarque Berra, Saphiro Wilk, Kolmogorov Smirnov, dan lain-lain. Pelanggaran pada asumsi ini membuat hasil uji hipotesis tidak sah. Untuk menangani hal tersebut dapat dilakukan penambahan data observasi, menghilangkan data yang menyebabkan tidak normal, atau tranformasi data.
1.3.3 Uji Homoskedastisitas
Uji homoskedastisitas juga disebut dengan uji kesamaan ragam. Dapat dilakukan dengan uji Breusch Pagan dengan hipotesis sebagai berikut.
H0: \(var(\mu|X)=E(\mu^2|X)=\sigma^2\)
Jika terjadi pelanggaran asumsi, maka terdapat hubungan antara \(\mu^2\) dan variabel prediktor. Untuk menangani hal tersebut dapat digunakan metode Weighted Least Square atau White Method.
1.3.4 Uji Non Autokorelasi
Uji non autokorelasi adalah asumsi kebebasan antar galat, dapat dilakukan dengan uji Durbin Watson. Pelanggaran asumsi ini sering terjadi pada data deret waktu karena urutan observasinya memiliki makna, dan jarang terjadi pada data cross section. Untuk menangani hal tersebut dapat digunakan metode Cochrane-Orcutt Iterative Procedure.
1.3.5 Uji Simultan
Uji simultan atau biasa disebut dengan uji F digunakan untuk mengetahui apakah semua variabel bebas (prediktor) secara bersama-sama berpengaruh signifikan terhadap variabel tak bebas (respon). Hipotesis yang digunakan adalah sebagai berikut.
H0: Semua variabel prediktor tidak memberikan pengaruh terhadap variabel respon.
H1: Paling tidak terdapat satu variabel prediktor yang memberikan pengaruh terhadap variabel respon.
Dengan kriteria pengujian, jika \(p-value<\alpha\) maka H0 akan ditolak. Bisa juga dengan membandingkan nilai Fstatistic dan Ftabel.
1.3.6 Uji Parsial
Uji parsial atau biasa disebut dengan uji t digunakan untuk mengetahui apakah variabel bebas (prediktor) secara individu berpengaruh signifikan terhadap variabel tak bebas (respon). Hipotesis yang digunakan adalah sebagai berikut.
H0: Variabel prediktor tidak memberikan pengaruh terhadap variabel respon.
H1: Variabel prediktor memberikan pengaruh terhadap variabel respon.
Dengan kriteria pengujian, jika \(p-value<\alpha\) maka H0 akan ditolak. Bisa juga dengan membandingkan nilai thitung dan ttabel.
2 SOURCE CODE
2.1 Library
> library(lmtest)Library lmtest digunakan untuk melakukan uji
homoskedastisitas dan uji autokorelasi.
2.2 Data
> height <- c(58, 62, 59, 71, 70, 60, 69, 61, 68, 72, 67, 63, 65, 64, 66)
> weight <- c(115, 126, 117, 159, 154, 120, 150, 123, 146, 164, 142, 129, 135, 132, 139)
> women <- data.frame(height, weight)
> women
height weight
1 58 115
2 62 126
3 59 117
4 71 159
5 70 154
6 60 120
7 69 150
8 61 123
9 68 146
10 72 164
11 67 142
12 63 129
13 65 135
14 64 132
15 66 139Data yang digunakan adalah data women, dimana merupakan data bawaan dari RStudio. Data ini berisi tentang data rata-rata tinggi badan (in) dan berat badan (lbs) wanita Amerika yang berusia antara 30-39 tahun.
2.3 Statistika Deskriptif
- summary(women)
- par(mfrow = c(1, 2))
- boxplot(height, ylab=“Height”, main=“Women Height”, col=“darkgrey”)
- boxplot(weight, ylab=“Weight”, main=“Women Weight”, col=“darkgrey”)
Perintah summary digunakan untuk menampilkan statistika
deskriptif dari data women, yang meliputi nilai maksimum, kuartil 1,
median, mean, kuartil 3, dan nilai maksimum. Boxplot digunakan untuk
melihat persebaran data.
2.4 Analisis Regresi
- regresi <- lm(weight~height, data=women)
- summary(regresi)
Function lm digunakan untuk analisis regresi data women
dengan weight sebagai fungsi dari height, dan disimpan sebagai regresi.
Serta perintah summary digunakan untuk menampilkan hasil
dari analisis regresi.
2.5 Uji Normalitas
- plot(regresi, 2)
- sisa <- residuals(regresi)
- shapiro.test(sisa)
Untuk melakukan uji normalitas digunakan perintah
shapiro.test() dengan argument sisa yang merupakan residual
dari analisis regresi.
2.6 Uji Homoskedastisitas
- bptest(regresi)
Untuk melakukan uji homoskedastisitas digunakan perintah
bptest() dengan argument objek lm yaitu regresi.
2.7 Uji Non Autokorelasi
- dwtest(regresi)
Untuk melakukan uji non autokorelasi digunakan perintah
dwtest() dengan argument objek lm yaitu regresi.
3 HASIL DAN PEMBAHASAN
3.1 Statistika Deskriptif
> summary(women)
height weight
Min. :58.0 Min. :115.0
1st Qu.:61.5 1st Qu.:124.5
Median :65.0 Median :135.0
Mean :65.0 Mean :136.7
3rd Qu.:68.5 3rd Qu.:148.0
Max. :72.0 Max. :164.0
> par(mfrow = c(1, 2))
> boxplot(height, ylab="Height", main="Women Height", col="darkgrey")
> boxplot(weight, ylab="Weight", main="Women Weight", col="darkgrey")- Didapatkan statistika deskriptif untuk data women pada variabel height dan weight. Untuk variabel height (tinggi badan) memiliki nilai minimum 58 in dan nilai maksimum 72 in dengan rata-rata 65 in. Untuk variabel weight memiliki nilai minimum 115 lbs dan nilai maksimum 164 lbs dengan rata-rata 136.7 lbs.
- Boxplot
Women Heightterlihat simetris (berdistribusi normal), dibuktikan dengan garis median berada di tengah serta panjang garis whisker bagian atas dan bawah sama. - Boxplot
Women Weightterlihat tidak simetris (menceng kanan), dibuktikan dengan garis median tidak berada di tengah serta garis whisker bagian atas lebih panjang.
3.2 Analisis Regresi
> regresi <- lm(weight~height, data=women)
> summary(regresi)
Call:
lm(formula = weight ~ height, data = women)
Residuals:
Min 1Q Median 3Q Max
-1.7333 -1.1333 -0.3833 0.7417 3.1167
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -87.51667 5.93694 -14.74 1.71e-09 ***
height 3.45000 0.09114 37.85 1.09e-14 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 1.525 on 13 degrees of freedom
Multiple R-squared: 0.991, Adjusted R-squared: 0.9903
F-statistic: 1433 on 1 and 13 DF, p-value: 1.091e-14- Didapatkan p-value sebesar 1.09e-14 < \(\alpha=0.05\), maka tolak H0. Jadi, dapat disimpulkan bahwa secara simultan (uji F) maupun parsial (uji t) variabel height (tinggi badan) berpengaruh signifikan terhadap variabel weight (berat badan).
- Didapatkan nilai R-Square sebesar 0.9903 yang berarti bahwa variabel height (tinggi badan) dapat menjelaskan variabel weight (berat badan) sebesar 99.03%, sisanya dipengaruhi oleh faktor lain di luar penelitian.
3.3 Uji Normalitas
H0: Residual berdistribusi normal
H1: Residual tidak berdistribusi normal
> plot(regresi, 2)> sisa <- residuals(regresi)
> shapiro.test(sisa)
Shapiro-Wilk normality test
data: sisa
W = 0.91909, p-value = 0.1866Didapatkan p-value sebesar 0.1866 > \(\alpha=0.05\), maka terima H0. Jadi, dapat disimpulkan bahwa tidak terbukti adanya pelanggaran asumsi normalitas galat pada model. Plot di atas juga menunjukkan galat menyebar normal, dibuktikan dengan titik-titik terletak tidak jauh dari garis.
3.4 Uji Homoskedastisitas
H0: Ragam bersifat homogen
H1: Ragam bersifat heterogen
> bptest(regresi)
studentized Breusch-Pagan test
data: regresi
BP = 1.0088, df = 1, p-value = 0.3152Didapatkan p-value sebesar 0.3152 > \(\alpha=0.05\), maka terima H0. Jadi, dapat disimpulkan bahwa tidak terbukti adanya pelanggaran asumsi homogenitas ragam galat pada model.
3.5 Uji Non Autokorelasi
H0: Tidak terdapat autokorelasi dalam model
H1: Terdapat autokorelasi dalam model
> dwtest(regresi)
Durbin-Watson test
data: regresi
DW = 1.8961, p-value = 0.4096
alternative hypothesis: true autocorrelation is greater than 0Didapatkan p-value sebesar 0.4096 > \(\alpha=0.05\), maka terima H0. Jadi, dapat disimpulkan bahwa tidak terbukti adanya autokorelasi pada model.
4 KESIMPULAN
Setelah dipastikan tidak ada masalah pelanggaran asumsi, maka hasil analisis regresi dapat diinterpretasikan. Didapatkan model sebagai berikut \[weight=-87.51667+3.45height\] dapat diartikan bahwa setiap kenaikan height (tinggi badan) sebesar satu satuan (in), maka weight (berat badan) akan bertambah sebesar 3.45 lbs.
5 DAFTAR PUSTAKA
Fajaryani, Atik. 2015. Analisis Faktor-Faktor yang Mempengaruhi Integritas Laporan Keuangan (Studi Empiris pada Perusahaan Pertambangan yang Terdaftar di Bursa Efek Indonesia Periode 2008-2013). Jurnal Nominal, 4(1).
Kurniawan, R., dan Yuniarto, B. 2016. Analisis Regresi: Dasar dan Penerapannya Dengan R. Jakarta: Kencana.
Padilah, T. N., dan Adam, R. I. 2019. Analisis Regresi Linier Berganda Dalam Estimasi Produktivitas Tanaman Padi di Kabupaten Karawang. Jurnal Pendidikan Matematika dan Matematika, 5(2).
Rudiyanto. 2012. Hubungan Berat Badan Tinggi Badan dan Panjang Tungkai Dengan Kelincahan. Journal of Sport Sciences and Fitness, 1(2).
rumusstatistik.com/2017/02/statistik-deskriptif.html
Sungkawa, Iwa. 2013. Penerapan Analisis Regresi dan Korelasi Dalam Menentukan Arah Hubungan Antara Dua Faktor Kualitatif Pada Tabel Kontingensi. Jurnal Mat Stat, 13(1).