KOMLAN_TGS_1.knit

ANALISIS REGRESI LINEAR BERGANDA MENGUNGKAP
PERLUASAN LUBANG OZON AKIBAT DARI PENGIRIMAN BENDA
KE LUAR ANGKASA DAN PERUBAHAN SUHU BUMI

Dosen Pengampu:

Dr. Hasbi Yasin, S.Si., M.Si.

Disusun oleh:

Nama	: Karina Cahya Asih
NIM	: 24050123120037
Kelas	: Komputasi Statistika Lanjut – A

PROGRAM STUDI STATISTIKA
FAKULTAS SAINS DAN MATEMATIKA
UNIVERSITAS DIPONEGORO
2026

BAB I

PENDAHULUAN

1.1 Latar Belakang

Fenomena lingkungan global, seperti semakin luasnya lubang ozon dan perubahan suhu permukaan bumi, menjadi perhatian penting bagi masyarakat dunia. Lapisan ozon berfungsi sebagai pelindung alami bumi dari radiasi ultraviolet yang berbahaya. Namun, dalam beberapa dekade terakhir, lapisan ozon mengalami penipisan yang ditandai dengan meningkatnya luas lubang ozon, khususnya di wilayah Antartika. Kondisi ini dapat berdampak pada keseimbangan ekosistem serta kesehatan makhluk hidup di bumi.

Di sisi lain, perkembangan teknologi telah mendorong manusia untuk melakukan eksplorasi luar angkasa melalui peluncuran berbagai benda seperti satelit dan roket. Aktivitas peluncuran tersebut terus meningkat dari tahun ke tahun sebagai bagian dari upaya pengembangan ilmu pengetahuan dan teknologi. Namun, aktivitas ini juga berpotensi memberikan dampak terhadap kondisi atmosfer bumi.

Selain itu, perubahan suhu permukaan bumi juga menjadi salah satu indikator penting dalam dinamika iklim global. Peningkatan suhu permukaan bumi dapat mempengaruhi berbagai proses di atmosfer, termasuk kondisi lapisan ozon. Oleh karena itu, diperlukan analisis untuk memahami hubungan antara luas lubang ozon, jumlah benda yang diluncurkan ke angkasa, dan suhu permukaan bumi.

Salah satu metode statistik yang dapat digunakan untuk menganalisis hubungan tersebut adalah analisis regresi linear berganda. Metode ini memungkinkan pengkajian pengaruh beberapa variabel independen terhadap satu variabel dependen secara bersamaan. Dalam penelitian ini digunakan data tahunan dari tahun 1970 hingga 2023 untuk menganalisis hubungan antara luas lubang ozon, jumlah benda yang diluncurkan ke angkasa, dan suhu permukaan bumi.

1.2 Rumusan Masalah

Berdasarkan latar belakang yang telah diuraikan, maka rumusan masalah dalam penelitian ini adalah sebagai berikut:

Bagaimana hubungan antara jumlah benda yang diluncurkan ke angkasa dan suhu permukaan bumi terhadap luas lubang ozon?
Apakah jumlah benda yang diluncurkan ke angkasa dan suhu permukaan bumi berpengaruh secara signifikan terhadap luas lubang ozon?
Bagaimana model regresi linear berganda yang dapat menggambarkan hubungan antara luas lubang ozon, jumlah benda yang diluncurkan ke angkasa, dan suhu permukaan bumi?

1.3 Tujuan Penelitian

Berdasarkan rumusan masalah yang telah diuraikan, maka tujuan dari penelitian ini adalah sebagai berikut:

Menganalisis hubungan antara jumlah benda yang diluncurkan ke angkasa dan suhu permukaan bumi terhadap luas lubang ozon.
Mengetahui pengaruh jumlah benda yang diluncurkan ke angkasa dan suhu permukaan bumi terhadap luas lubang ozon secara signifikan.
Menentukan model regresi linear berganda yang dapat menggambarkan hubungan antara luas lubang ozon, jumlah benda yang diluncurkan ke angkasa, dan suhu permukaan bumi.

1.4 Manfaat Penelitian

Penelitian ini diharapkan dapat memberikan manfaat sebagai berikut:

Manfaat akademis, yaitu memberikan pemahaman mengenai penerapan metode analisis regresi linear berganda dalam menganalisis hubungan antara luas lubang ozon, jumlah benda yang diluncurkan ke angkasa, dan suhu permukaan bumi.
Manfaat praktis, yaitu memberikan gambaran mengenai hubungan antara aktivitas peluncuran benda ke luar angkasa serta perubahan suhu permukaan bumi terhadap luas lubang ozon.

1.5 Sistematika Penulisan

Sistematika penulisan dalam laporan ini disusun sebagai berikut:

BAB I PENDAHULUAN
Bab ini berisi latar belakang penelitian, rumusan masalah, tujuan penelitian, manfaat penelitian, serta sistematika penulisan laporan.

BAB II TINJAUAN PUSTAKA
Bab ini membahas teori-teori yang berkaitan dengan penelitian, khususnya mengenai analisis regresi linear berganda, model regresi, serta konsep-konsep statistik yang digunakan dalam analisis.

BAB III METODOLOGI PENELITIAN
Bab ini menjelaskan mengenai sumber data, variabel penelitian, serta metode analisis yang digunakan dalam penelitian.

BAB IV HASIL DAN PEMBAHASAN
Bab ini menyajikan hasil analisis regresi linear berganda yang diperoleh dari pengolahan data serta pembahasan terhadap hasil analisis tersebut.

BAB V KESIMPULAN
Bab ini berisi kesimpulan yang diperoleh dari hasil penelitian yang telah dilakukan.

BAB II

TINJAUAN PUSTAKA

2.1 Analisis Regresi Linear Berganda

Analisis regresi linear berganda merupakan metode statistik yang digunakan untuk menganalisis hubungan antara satu variabel dependen dengan dua atau lebih variabel independen. Metode ini bertujuan untuk mengetahui pengaruh variabel independen terhadap variabel dependen.

Model regresi linear berganda secara umum dapat dinyatakan sebagai berikut:

\[ y = \beta_0 + \beta_1 X_i+ \beta_2 X_i + \epsilon_i \] dengan:

\(Y\) : variabel dependen
\(X_i\) : variabel independen
\(\beta_0\) : konstanta
\(\beta_1, \beta_2\) : koefisien regresi
\(\epsilon_i\) : error atau galat

2.2 Estimasi parameter Regresi

Estimasi parameter pada model regresi linear berganda umumnya dilakukan dengan menggunakan metode Ordinary Least Squares (OLS). Metode ini bertujuan untuk memperoleh nilai parameter regresi yang meminimumkan jumlah kuadrat dari selisih antara nilai pengamatan dan nilai prediksi model.

Secara matematis, metode OLS meminimumkan fungsi berikut:

\[ \sum_{i=1}^{n} (Y_i - \hat{Y}_i)^2 \]

dengan:

\(Y_i\) : nilai pengamatan variabel dependen
\(\hat{Y}_i\) : nilai prediksi dari model regresi
\(n\) : jumlah pengamatan

Melalui metode ini akan diperoleh estimasi parameter \(\beta_0, \beta_1,\) dan \(\beta_2\) yang digunakan untuk membentuk model regresi linear berganda.

2.3 Uji Asumsi Klasik

Uji asumsi klasik dilakukan untuk memastikan bahwa model regresi linear berganda yang digunakan memenuhi asumsi dasar sehingga estimasi parameter yang diperoleh bersifat tidak bias dan efisien. Apabila asumsi-asumsi ini terpenuhi, maka model regresi dapat digunakan untuk melakukan analisis dan penarikan kesimpulan secara valid.

Uji Linearitas

Uji linearitas bertujuan untuk mengetahui apakah hubungan antara variabel independen dan variabel dependen bersifat linear. Pengujian ini dapat dilakukan secara visual menggunakan grafik residual terhadap nilai prediksi, serta secara formal menggunakan uji Ramsey RESET. Hipotesis nol menyatakan bahwa model regresi telah berbentuk linear. Jika nilai p-value lebih besar dari taraf signifikansi (α = 0,05), maka tidak terdapat penyimpangan dari linearitas sehingga asumsi linearitas terpenuhi.

Uji Normalitas

Uji normalitas digunakan untuk mengetahui apakah residual pada model regresi berdistribusi normal. Pengujian dapat dilakukan secara visual menggunakan Normal Q-Q Plot serta secara formal menggunakan uji Lilliefors. Hipotesis nol menyatakan bahwa residual berdistribusi normal. Jika nilai p-value lebih besar dari 0,05 maka residual dapat dianggap berdistribusi normal sehingga asumsi normalitas terpenuhi.

Uji Homoskedastisitas

Uji homoskedastisitas bertujuan untuk mengetahui apakah varians residual bersifat konstan pada setiap pengamatan. Pengujian dapat dilakukan secara visual melalui grafik residual serta secara formal menggunakan uji Glejser, yaitu dengan meregresikan nilai absolut residual terhadap variabel independen. Jika nilai signifikansi dari masing-masing variabel independen lebih besar dari 0,05 maka dapat disimpulkan bahwa model tidak mengalami heteroskedastisitas.

Uji Non-Autokorelasi

Uji non-autokorelasi digunakan untuk mengetahui apakah terdapat korelasi antara residual pada satu pengamatan dengan pengamatan lainnya. Pengujian ini dapat dilakukan menggunakan uji Durbin–Watson. Hipotesis nol menyatakan bahwa tidak terdapat autokorelasi pada residual. Jika nilai p-value lebih besar dari 0,05 maka dapat disimpulkan bahwa model regresi tidak mengalami autokorelasi.

Uji Non-Multikolinearitas

Uji non-multikolinearitas bertujuan untuk mengetahui apakah terdapat hubungan yang kuat antar variabel independen dalam model regresi. Pengujian ini dilakukan dengan melihat nilai Variance Inflation Factor (VIF). Model regresi dikatakan tidak mengalami multikolinearitas apabila nilai VIF kurang dari 10. Jika nilai VIF dari setiap variabel independen berada di bawah batas tersebut maka asumsi non-multikolinearitas terpenuhi.

2.4 Uji Signifikansi Model

Uji signifikansi model digunakan untuk mengetahui apakah variabel independen dalam model regresi memiliki pengaruh terhadap variabel dependen. Pengujian ini dilakukan baik secara simultan maupun secara parsial. Secara simultan pengujian dilakukan menggunakan uji F, sedangkan secara parsial menggunakan uji t.

Uji F (Uji Kecocokan Model)

Uji F digunakan untuk mengetahui apakah variabel independen secara bersama-sama berpengaruh signifikan terhadap variabel dependen dalam model regresi. Hipotesis yang digunakan adalah \(H_0 : \beta_i = 0\) yang berarti seluruh variabel independen tidak berpengaruh terhadap variabel dependen, dan \(H_1\) menyatakan bahwa minimal terdapat satu koefisien regresi yang tidak sama dengan nol. Pengambilan keputusan didasarkan pada nilai p-value. Jika nilai p-value lebih kecil dari taraf signifikansi (\(\alpha = 0{,}05\)), maka \(H_0\) ditolak sehingga model regresi dinyatakan signifikan secara simultan.

Uji t (Uji Signifikansi Parameter)

Uji t digunakan untuk mengetahui pengaruh masing-masing variabel independen terhadap variabel dependen secara parsial. Hipotesis yang digunakan adalah \(H_0 : \beta_i = 0\) yang berarti variabel independen ke-\(i\) tidak berpengaruh terhadap variabel dependen, dan \(H_1 : \beta_i \neq 0\) yang berarti variabel independen tersebut berpengaruh terhadap variabel dependen. Pengambilan keputusan dilakukan dengan melihat nilai p-value. Jika nilai p-value lebih kecil dari taraf signifikansi (\(\alpha = 0{,}05\)), maka \(H_0\) ditolak sehingga variabel independen tersebut berpengaruh signifikan terhadap variabel dependen.

2.5 Koefisien Determinasi (\(R^2\))

Koefisien determinasi digunakan untuk mengukur seberapa besar kemampuan variabel independen dalam menjelaskan variasi variabel dependen dalam model regresi. Nilai koefisien determinasi dinyatakan dalam bentuk \(R^2\) yang memiliki nilai antara 0 hingga 1.

Nilai \(R^2\) yang mendekati 1 menunjukkan bahwa variabel independen mampu menjelaskan sebagian besar variasi variabel dependen, sedangkan nilai \(R^2\) yang mendekati 0 menunjukkan bahwa kemampuan variabel independen dalam menjelaskan variabel dependen sangat terbatas.

Dalam analisis regresi berganda, selain \(R^2\) juga digunakan Adjusted \(R^2\) yang telah disesuaikan dengan jumlah variabel independen dalam model. Nilai Adjusted \(R^2\) memberikan ukuran yang lebih akurat dalam menilai kemampuan model regresi dalam menjelaskan variasi variabel dependen.

2.6 Mean Squared Error (MSE)

Mean Square Error (MSE) merupakan ukuran yang digunakan untuk mengetahui rata-rata kuadrat kesalahan antara nilai pengamatan dan nilai prediksi dari model regresi. Nilai MSE diperoleh dari rata-rata kuadrat residual sehingga dapat digunakan untuk menilai seberapa baik model dalam melakukan prediksi.

Secara matematis, MSE dapat dinyatakan sebagai berikut:

\[ MSE = \frac{1}{n}\sum_{i=1}^{n}(Y_i - \hat{Y}_i)^2 \]

dengan:

\(Y_i\) : nilai pengamatan
\(\hat{Y}_i\) : nilai prediksi dari model
\(n\) : jumlah pengamatan

Nilai MSE yang lebih kecil menunjukkan bahwa model regresi memiliki kemampuan prediksi yang lebih baik karena kesalahan antara nilai pengamatan dan nilai prediksi semakin kecil.

BAB III

METODOLOGI PENELITIAN

3.1 Sumber Data

Data yang digunakan dalam penelitian ini merupakan data sekunder yang diperoleh dari beberapa sumber daring. Data luas lubang ozon diperoleh dari situs Our World in Data, data jumlah benda yang diluncurkan ke luar angkasa juga diperoleh dari Our World in Data, sedangkan data suhu permukaan bumi diperoleh dari Climate Change Data milik International Monetary Fund (IMF).

Data yang digunakan merupakan data tahunan yang mencakup periode tahun 1970 hingga 2023 dengan jumlah pengamatan sebanyak 54 data.

3.2 Variabel Peneletian

Variabel yang digunakan dalam penelitian ini terdiri dari satu variabel dependen dan dua variabel independen. Variabel dependen dalam penelitian ini adalah luas lubang ozon (Y). Sedangkan variabel independen yang digunakan adalah jumlah benda yang diluncurkan ke angkasa (X1) dan suhu permukaan bumi (X2).

Penjelasan masing-masing variabel adalah sebagai berikut:

\(Y\) : Luas lubang ozon
\(X_1\) : Jumlah benda yang diluncurkan ke angkasa
\(X_2\) : Suhu permukaan bumi

3.3 Metode Analisis Data

Metode analisis yang digunakan dalam penelitian ini adalah analisis regresi linear berganda untuk mengetahui pengaruh jumlah benda yang diluncurkan ke angkasa dan suhu permukaan bumi terhadap luas lubang ozon. Pengolahan data dilakukan menggunakan perangkat lunak R melalui R Markdown.

Tahapan analisis yang dilakukan dalam penelitian ini meliputi:

Melakukan transformasi data apabila diperlukan.
Membentuk model regresi linear berganda.
Melakukan uji asumsi klasik yang meliputi uji linearitas, uji normalitas, uji homoskedastisitas, uji non-autokorelasi, dan uji non-multikolinearitas.
Melakukan uji signifikansi model menggunakan uji F dan uji t.
Menghitung koefisien determinasi serta nilai Mean Square Error (MSE) untuk menilai kemampuan model.

3.4 Software yang Digunakan

Pengolahan dan analisis data dalam penelitian ini dilakukan menggunakan perangkat lunak R dengan bantuan RStudio sebagai lingkungan pengembangan (IDE). Penulisan laporan analisis dilakukan menggunakan R Markdown, sehingga proses analisis data dan penyusunan laporan dapat dilakukan secara terintegrasi.

Beberapa paket (library) dalam R yang digunakan dalam penelitian ini antara lain readxl untuk membaca data dari file Excel, ggplot2 untuk visualisasi data, car untuk analisis regresi dan pengujian multikolinearitas, psych untuk analisis statistik deskriptif, lmtest untuk beberapa pengujian dalam model regresi, serta nortest untuk melakukan uji normalitas.

BAB IV

HASIL DAN PEMBAHASAN

4.1 Statistik Deskriptif

##     Tahun           Luas Lubang Ozon (Y)
##  Length:54          Min.   :  600000    
##  Class :character   1st Qu.:10100000    
##  Mode  :character   Median :19350000    
##                     Mean   :16838889    
##                     3rd Qu.:23375000    
##                     Max.   :26600000    
##  Jumlah benda yang diluncurkan ke angkasa (X1) Suhu Permukaan Bumi (X2)
##  Min.   :  72.0                                Min.   :-0.3000         
##  1st Qu.: 123.2                                1st Qu.: 0.2250         
##  Median : 136.0                                Median : 0.6500         
##  Mean   : 239.4                                Mean   : 0.6537         
##  3rd Qu.: 161.8                                3rd Qu.: 1.0000         
##  Max.   :1833.0                                Max.   : 1.7000

Statistik deskriptif memberikan gambaran umum mengenai data penelitian dari tahun 1970 hingga 2023, dengan jumlah pengamatan sebanyak 54. Variabel yang dianalisis meliputi luas lubang ozon (Y), jumlah benda yang diluncurkan ke angkasa (X1), dan suhu permukaan bumi (X2).

Luas lubang ozon memiliki nilai minimum 600.000 dan maksimum 26.600.000, dengan rata-rata 16.838.889 dan median 19.350.000, menunjukkan sebagian besar nilai berada di sekitar median.

Jumlah benda yang diluncurkan ke angkasa berkisar antara 72 hingga 1833, dengan rata-rata 239,4, memperlihatkan variasi yang cukup besar selama periode pengamatan.

Suhu permukaan bumi memiliki nilai minimum −0,3 dan maksimum 1,7, dengan rata-rata 0,6537, menunjukkan tren peningkatan suhu permukaan bumi selama periode pengamatan.

4.2 Visualisasi Data

1. Histogram

Histogram digunakan untuk melihat sebaran data masing-masing variabel penelitian.

Luas lubang ozon (Y) menunjukkan sebaran yang agak miring ke kanan, dengan sebagian besar data berada pada nilai menengah, namun terdapat beberapa data ekstrem di sisi atas, mengindikasikan beberapa tahun dengan luas lubang ozon yang sangat besar.
Jumlah benda yang diluncurkan ke angkasa (X1) memiliki sebaran yang sangat miring ke kanan, di mana sebagian besar tahun memiliki jumlah benda yang relatif rendah, tetapi terdapat beberapa tahun dengan jumlah benda yang sangat tinggi, mencerminkan lonjakan eksplorasi antariksa tertentu.
Suhu permukaan bumi (X2) cenderung memiliki sebaran simetris, dengan sebagian besar nilai berada di sekitar tengah dan beberapa nilai ekstrem di kedua sisi, menunjukkan variasi suhu yang tidak terlalu ekstrim.

2. Boxplot

Boxplot digunakan untuk melihat distribusi data, nilai tengah (median), sebaran, dan pencilan (outlier) dari masing-masing variabel.

Luas lubang ozon (Y): median berada di sekitar 19.350.000, sesuai dengan pusat histogram. Boxplot menunjukkan sebaran data yang cukup luas dengan rentang nilai dari yang sangat kecil hingga mendekati 27.000.000. Tidak terlihat pencilan yang menonjol, sehingga sebagian besar data masih berada dalam rentang sebaran utama.
Jumlah benda yang diluncurkan ke angkasa (X1): boxplot terlihat memanjang ke arah atas, mencerminkan kemiringan positif (right-skewed). Terdapat beberapa nilai pencilan (outlier) di bagian atas yang menunjukkan adanya beberapa tahun dengan jumlah peluncuran yang jauh lebih tinggi dibandingkan sebagian besar data lainnya.
Suhu permukaan bumi (X2): boxplot menunjukkan sebaran data yang relatif cukup seimbang dengan median sekitar 0,65. Rentang data berada dari nilai negatif hingga sekitar 1,7, dan tidak terlihat pencilan yang signifikan sehingga distribusi data relatif stabil.

3. Stem and Leaf Plot

## Stem and Leaf Plot Y

## 
##   The decimal point is 7 digit(s) to the right of the |
## 
##   0 | 111111
##   0 | 55889
##   1 | 000011244
##   1 | 78999999
##   2 | 11122223333334444
##   2 | 555566677

## 
## Stem and Leaf Plot X1

## 
##   The decimal point is 2 digit(s) to the right of the |
## 
##    0 | 77990001111222233333333334444445555666666777
##    2 | 1224
##    4 | 561
##    6 | 
##    8 | 
##   10 | 
##   12 | 7
##   14 | 
##   16 | 
##   18 | 13

## 
## Stem and Leaf Plot X2

## 
##   The decimal point is 1 digit(s) to the left of the |
## 
##   -2 | 000
##   -0 | 00
##    0 | 00000
##    2 | 000000000
##    4 | 000000
##    6 | 0000
##    8 | 00000000
##   10 | 0000000
##   12 | 000
##   14 | 00000
##   16 | 00

Stem-and-leaf plot digunakan untuk melihat distribusi data dengan tetap mempertahankan nilai asli setiap pengamatan.

Luas lubang ozon (Y): sebagian besar data berada pada kisaran 2×10⁷, terlihat dari banyaknya daun pada batang 2. Nilai pada batang 0 dan 1 juga ada, tetapi jumlahnya lebih sedikit.
Jumlah benda yang diluncurkan ke angkasa (X1): sebagian besar data terkonsentrasi pada batang 0, yang menunjukkan mayoritas nilai berada pada kisaran ratusan. Namun terdapat beberapa nilai pada batang yang lebih tinggi seperti 12 dan 18, yang menunjukkan adanya beberapa pengamatan dengan nilai yang jauh lebih besar.
Suhu permukaan bumi (X2): data tersebar dari nilai negatif hingga sekitar 1,6, dengan sebagian besar pengamatan berada pada kisaran 0 hingga 1, sehingga menunjukkan variasi yang relatif kecil.

4. Probability Plot

Probability plot digunakan untuk melihat apakah data mengikuti distribusi normal. Jika titik-titik data berada di sekitar garis diagonal, maka data cenderung berdistribusi normal.

Luas lubang ozon (Y): titik-titik pada Q-Q plot tidak sepenuhnya mengikuti garis diagonal dan terlihat melengkung pada bagian atas, sehingga menunjukkan adanya penyimpangan dari distribusi normal.
Jumlah benda yang diluncurkan ke angkasa (X1): banyak titik yang menyimpang cukup jauh dari garis diagonal, terutama pada nilai yang besar, yang menunjukkan bahwa data tidak berdistribusi normal dan terdapat beberapa nilai ekstrem.
Suhu permukaan bumi (X2): titik-titik data relatif mengikuti garis diagonal sehingga menunjukkan bahwa distribusi data cukup mendekati normal.

5. Mean Plot

Mean plot digunakan untuk melihat rata-rata dari masing-masing variabel serta membandingkan kecenderungan nilai antar variabel.

Luas lubang ozon (Y): nilai rata-rata berada pada kisaran yang cukup besar dan relatif stabil dibandingkan variabel lainnya, sejalan dengan sebaran data yang cukup luas pada boxplot.
Jumlah benda yang diluncurkan ke angkasa (X1): rata-rata nilai cenderung dipengaruhi oleh beberapa nilai yang sangat besar, sehingga menunjukkan variasi yang cukup tinggi dibandingkan sebagian besar data lainnya.
Suhu permukaan bumi (X2): rata-rata berada pada kisaran nilai positif kecil dan relatif stabil, sesuai dengan sebaran data yang tidak terlalu ekstrem.

6. Scatterplot

Scatterplot digunakan untuk melihat hubungan antara variabel respon dengan variabel prediktor serta mengetahui pola hubungan yang terbentuk.

Scatterplot Y vs X1: titik-titik data terlihat cukup menyebar dan tidak membentuk pola linear yang jelas. Sebagian besar nilai X1 berada pada kisaran rendah, namun terdapat beberapa nilai yang jauh lebih besar. Hal ini menunjukkan bahwa hubungan antara Y dan X1 tidak terlalu kuat.
Scatterplot Y vs X2: titik-titik data cenderung menunjukkan pola meningkat, sehingga mengindikasikan adanya hubungan positif antara Y dan X2. Artinya, ketika nilai X2 meningkat, nilai Y juga cenderung meningkat.

4.3 Transformasi Data

## Estimated transformation parameter 
##        Y 
## 1.111439

## Estimated transformation parameter 
##        X1 
## -1.105283

Transformasi data dilakukan untuk memperbaiki distribusi data agar lebih mendekati distribusi normal sebelum dilakukan analisis regresi. Pada penelitian ini digunakan transformasi Yeo-Johnson yang ditentukan melalui fungsi powerTransform.

Hasil estimasi parameter transformasi menunjukkan bahwa nilai λ untuk variabel Y sebesar 1,111439, sedangkan λ untuk variabel X1 sebesar −1,105283. Berdasarkan nilai tersebut dilakukan transformasi pada kedua variabel.

Histogram hasil transformasi menunjukkan bahwa distribusi Y_trans dan X1_trans menjadi lebih terpusat dan relatif lebih simetris dibandingkan sebelum transformasi. Hal ini menunjukkan bahwa transformasi yang dilakukan membantu memperbaiki bentuk distribusi data sehingga lebih sesuai untuk analisis selanjutnya.

4.4 Pembentukan Model Regresi Berganda

Model Awal

Model regresi linear berganda \[ y = \beta_0 + \beta_1 X_i+ \beta_2 X_i + \epsilon_i \] Sehingga dapat dibangun model regresi awalnya yaitu :

\[ Y = 8.2235315\times 10^{9} + -9.068589\times 10^{9}X_1 + 6.9461029\times 10^{7}X_2 \]

4.5 Uji Asumsi Klasik

1. Uji Linearitas

Secara Visual

Berdasarkan plot Residuals vs Fitted, terlihat bahwa titik-titik residual menyebar di sekitar garis horizontal nol. Garis smoothing (garis pink) menunjukkan pola yang relatif mendekati garis lurus meskipun terdapat sedikit lengkungan pada beberapa bagian.

Secara umum, tidak terlihat pola sistematis yang kuat pada sebaran residual, sehingga dapat dikatakan bahwa asumsi linearitas pada model regresi cukup terpenuhi.

Secara Formal

## 
##  RESET test
## 
## data:  model
## RESET = 1.7194, df1 = 2, df2 = 49, p-value = 0.1898

Berdasarkan hasil RESET test, diperoleh nilai p-value sebesar 0,1898. Karena nilai p-value lebih besar dari α = 0,05, maka gagal menolak H₀.

Hal ini menunjukkan bahwa model regresi telah memenuhi asumsi linearitas, sehingga hubungan antara variabel prediktor dan variabel respon dapat dianggap linear.

2. Uji Normalitas

Secara Visual

Berdasarkan plot normal probability (Q-Q plot) residual, titik-titik data cenderung mengikuti garis diagonal. Hal ini menunjukkan bahwa distribusi residual mendekati distribusi normal.

Secara Formal

## 
##  Lilliefors (Kolmogorov-Smirnov) normality test
## 
## data:  residual
## D = 0.10157, p-value = 0.1785

Berdasarkan hasil uji Lilliefors (Kolmogorov–Smirnov) diperoleh nilai p-value sebesar 0,1785. Karena nilai p-value lebih besar dari α = 0,05, maka gagal menolak H₀.

Hal ini menunjukkan bahwa residual berdistribusi normal, sehingga asumsi normalitas pada model regresi telah terpenuhi.

3. Uji Homoskedastisitas

Secara Visual

Berdasarkan Scale-Location plot, terlihat bahwa titik-titik data menyebar secara acak dan tidak membentuk pola tertentu. Meskipun terdapat sedikit lengkungan pada garis smoothing, secara umum penyebaran residual relatif merata sehingga tidak menunjukkan adanya pola varians yang semakin membesar atau mengecil.

Secara Formal

## 
## Call:
## lm(formula = abs(resid(model)) ~ X1_trans + X2)
## 
## Residuals:
##       Min        1Q    Median        3Q       Max 
## -37018497 -13364464  -5894021  10560501  43024338 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)  
## (Intercept) -1.223e+09  1.658e+09  -0.738   0.4641  
## X1_trans     1.399e+09  1.841e+09   0.760   0.4508  
## X2          -1.226e+07  5.688e+06  -2.155   0.0359 *
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 20860000 on 51 degrees of freedom
## Multiple R-squared:  0.08403,    Adjusted R-squared:  0.04811 
## F-statistic: 2.339 on 2 and 51 DF,  p-value: 0.1067

Berdasarkan hasil pengujian diperoleh p-value sebesar 0,1067. Karena nilai p-value lebih besar dari α = 0,05, maka gagal menolak H₀. Hal ini menunjukkan bahwa tidak terdapat indikasi heteroskedastisitas pada model regresi.

Dengan demikian, dapat disimpulkan bahwa asumsi homoskedastisitas pada model regresi telah terpenuhi.

4. Uji Non-Autokorelasi

## 
##  Durbin-Watson test
## 
## data:  model
## DW = 1.1262, p-value = 0.0001163
## alternative hypothesis: true autocorrelation is greater than 0

Uji autokorelasi dilakukan menggunakan Durbin–Watson test. Berdasarkan hasil pengujian diperoleh nilai statistik Durbin–Watson sebesar \(d = 1.1262\) dengan p-value sebesar \(0.0001163\).

Dengan \(\alpha = 5\%\), \(n = 54\), dan \(k = 2\) diperoleh nilai \(d_L = 1.4851\) dan \(d_U = 1.6383\). Berdasarkan kriteria Durbin–Watson, jika \(0 < d < d_L\) maka hipotesis nol (\(H_0\)) ditolak yang berarti terdapat autokorelasi positif.

Karena nilai \(d = 1.1262 < d_L = 1.4851\), maka \(H_0\) ditolak. Dengan demikian dapat disimpulkan bahwa terdapat autokorelasi positif pada residual model regresi.

5. Uji Non-Multikolinearitas

## X1_trans       X2 
## 1.079784 1.079784

Uji multikolinearitas dilakukan dengan melihat nilai Variance Inflation Factor (VIF) pada masing-masing variabel prediktor. Hasil pengujian menunjukkan bahwa nilai VIF untuk \(X_{1\_trans}\) sebesar 1.079784 dan nilai VIF untuk \(X_2\) sebesar 1.079784.

Karena seluruh nilai VIF < 10, maka dapat disimpulkan bahwa tidak terjadi multikolinearitas antar variabel prediktor dalam model regresi.

4.6 Uji Signifikansi Model

1. Uji F (Uji Kecocokan Model)

## 
## Call:
## lm(formula = Y_trans ~ X1_trans + X2, data = df_model)
## 
## Residuals:
##       Min        1Q    Median        3Q       Max 
## -74435606 -17930962   5843375  23874554  62076785 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  8.224e+09  2.975e+09   2.764  0.00792 ** 
## X1_trans    -9.069e+09  3.304e+09  -2.745  0.00834 ** 
## X2           6.946e+07  1.021e+07   6.805 1.11e-08 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 37420000 on 51 degrees of freedom
## Multiple R-squared:  0.4805, Adjusted R-squared:  0.4602 
## F-statistic: 23.59 on 2 and 51 DF,  p-value: 5.583e-08

Uji F digunakan untuk mengetahui apakah variabel independen secara simultan berpengaruh terhadap variabel dependen.

Berdasarkan hasil analisis regresi diperoleh nilai F-statistic = 23.59 dengan p-value = 5.583 × 10⁻⁸ pada taraf signifikansi \(\alpha = 0.05\). Karena nilai p-value < 0.05, maka hipotesis nol (\(H_0\)) ditolak.

Hal ini menunjukkan bahwa variabel \(X_{1\_trans}\) dan \(X_2\) secara bersama-sama berpengaruh signifikan terhadap variabel respon \(Y_{trans}\).

2. Uji t (Uji Signifikansi Parameter)

##                Estimate Std. Error   t value     Pr(>|t|)
## (Intercept)  8223531485 2974769404  2.764427 7.916384e-03
## X1_trans    -9068589037 3303803283 -2.744894 8.337480e-03
## X2             69461029   10207025  6.805218 1.105510e-08

Uji t digunakan untuk mengetahui pengaruh masing-masing variabel independen terhadap variabel dependen secara parsial.

Berdasarkan hasil analisis regresi diperoleh nilai p-value untuk variabel \(X_{1\_trans}\) sebesar \(0.008337\) dan untuk variabel \(X_2\) sebesar \(1.10551 \times 10^{-8}\). Dengan taraf signifikansi \(\alpha = 0.05\), kedua nilai p-value tersebut lebih kecil dari 0.05.

Oleh karena itu, hipotesis nol (\(H_0\)) ditolak untuk kedua variabel. Hal ini menunjukkan bahwa variabel \(X_{1\_trans}\) dan \(X_2\) secara parsial berpengaruh signifikan terhadap variabel respon \(Y_{trans}\).

4.7 Koefisien Determinasi

## [1] 0.480525

## [1] 0.4601534

Koefisien determinasi digunakan untuk mengetahui seberapa besar kemampuan variabel independen dalam menjelaskan variasi variabel dependen.

Berdasarkan hasil analisis regresi diperoleh nilai Multiple \(R^2\) sebesar 0.4805 dan Adjusted \(R^2\) sebesar 0.4602. Hal ini menunjukkan bahwa sebesar 48.05% variasi pada variabel respon \(Y_{trans}\) dapat dijelaskan oleh variabel \(X_{1\_trans}\) dan \(X_2\), sedangkan sisanya sebesar 51.95% dijelaskan oleh faktor lain di luar model.

4.8 MSE (Mean Squared Error)

## [1] 1.400413e+15

Berdasarkan hasil perhitungan, diperoleh nilai Mean Squared Error (MSE) sebesar 1.400413 × 10^15. Nilai MSE ini menggambarkan rata-rata kuadrat selisih antara nilai aktual dengan nilai prediksi yang dihasilkan oleh model regresi.

Nilai MSE yang terlihat sangat besar disebabkan oleh skala data variabel dependen, yaitu luas lubang ozon (Y), yang memiliki nilai hingga puluhan juta kilometer persegi. Karena MSE menghitung kuadrat dari selisih antara nilai aktual dan nilai prediksi, maka ketika variabel memiliki skala yang besar, nilai MSE yang dihasilkan juga akan menjadi sangat besar.

Dengan demikian, besarnya nilai MSE pada penelitian ini tidak secara langsung menunjukkan bahwa model regresi yang digunakan memiliki kinerja yang buruk, melainkan lebih dipengaruhi oleh besarnya skala data yang digunakan dalam analisis. Oleh karena itu, evaluasi kinerja model regresi juga perlu didukung oleh ukuran lain seperti koefisien determinasi (R²) serta analisis residual untuk melihat seberapa baik model mampu menjelaskan variasi luas lubang ozon.

4.9 Model Akhir

## 
## Call:
## lm(formula = Y_trans ~ X1_trans + X2, data = df_model)
## 
## Residuals:
##       Min        1Q    Median        3Q       Max 
## -74435606 -17930962   5843375  23874554  62076785 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  8.224e+09  2.975e+09   2.764  0.00792 ** 
## X1_trans    -9.069e+09  3.304e+09  -2.745  0.00834 ** 
## X2           6.946e+07  1.021e+07   6.805 1.11e-08 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 37420000 on 51 degrees of freedom
## Multiple R-squared:  0.4805, Adjusted R-squared:  0.4602 
## F-statistic: 23.59 on 2 and 51 DF,  p-value: 5.583e-08

Berdasarkan hasil analisis regresi linear berganda diperoleh model regresi sebagai berikut:

\[ Y = 8.2235315\times 10^{9} + -9.068589\times 10^{9}X_1 + 6.9461029\times 10^{7}X_2 \]

Nilai konstanta sebesar \(8.224 \times 10^9\) menunjukkan bahwa apabila variabel jumlah benda yang diluncurkan ke angkasa yang telah ditransformasi (\(X_{1\_trans}\)) dan suhu permukaan bumi (\(X_2\)) bernilai nol, maka nilai prediksi luas lubang ozon (Y) sebesar \(8.224 \times 10^9\).

Koefisien regresi untuk variabel jumlah benda yang diluncurkan ke angkasa yang telah ditransformasi (\(X_{1\_trans}\)) sebesar \(-9.069 \times 10^9\). Hal ini menunjukkan bahwa setiap peningkatan satu satuan pada \(X_{1\_trans}\) akan menurunkan luas lubang ozon sebesar \(9.069 \times 10^9\) satuan, dengan asumsi variabel suhu permukaan bumi konstan.

Koefisien regresi untuk variabel suhu permukaan bumi (\(X_2\)) sebesar \(6.946 \times 10^7\). Hal ini menunjukkan bahwa setiap peningkatan suhu permukaan bumi sebesar satu satuan akan meningkatkan luas lubang ozon sebesar \(6.946 \times 10^7\) satuan, dengan asumsi variabel lainnya konstan.

Meskipun model telah memenuhi sebagian besar asumsi klasik, masih ditemukan adanya penyimpangan pada asumsi autokorelasi. Hal ini menunjukkan bahwa terdapat kemungkinan hubungan antar residual pada periode waktu tertentu. Namun demikian, model regresi yang diperoleh masih dapat memberikan gambaran mengenai hubungan antara variabel independen dan variabel dependen dalam penelitian ini.

BAB V

PENUTUP

5.1 Kesimpulan

Berdasarkan hasil analisis regresi linear berganda yang telah dilakukan terhadap data luas lubang ozon, jumlah benda yang diluncurkan ke angkasa, dan suhu permukaan bumi pada periode tahun 1970–2023, maka dapat diperoleh beberapa kesimpulan sebagai berikut:

Hasil analisis menunjukkan bahwa terdapat hubungan antara jumlah benda yang diluncurkan ke angkasa dan suhu permukaan bumi terhadap luas lubang ozon. Hal ini terlihat dari hasil analisis regresi yang menunjukkan adanya keterkaitan antara variabel prediktor dengan variabel respon.
Berdasarkan hasil uji signifikansi model, diperoleh nilai F-statistic sebesar 23.59 dengan p-value sebesar 5.583 × 10⁻⁸ yang lebih kecil dari taraf signifikansi 0.05. Hal ini menunjukkan bahwa variabel jumlah benda yang diluncurkan ke angkasa dan suhu permukaan bumi secara simultan berpengaruh signifikan terhadap luas lubang ozon. Selain itu, hasil uji t menunjukkan bahwa masing-masing variabel independen juga berpengaruh signifikan secara parsial terhadap luas lubang ozon.
Model regresi linear berganda yang diperoleh dalam penelitian ini adalah

\[ Y = 8.2235315\times 10^{9} + -9.068589\times 10^{9}X_1 + 6.9461029\times 10^{7}X_2 \]

dengan nilai koefisien determinasi \(R^2\) sebesar 0.4805. Hal ini menunjukkan bahwa sebesar 48.05% variasi luas lubang ozon dapat dijelaskan oleh variabel jumlah benda yang diluncurkan ke angkasa dan suhu permukaan bumi, sedangkan sisanya sebesar 51.95% dijelaskan oleh faktor lain di luar model yang tidak dimasukkan dalam penelitian ini.

5.2 Saran

Berdasarkan hasil penelitian yang telah dilakukan, beberapa saran yang dapat diberikan adalah sebagai berikut:

Penelitian selanjutnya disarankan untuk menambahkan variabel lain yang diduga berpengaruh terhadap luas lubang ozon, seperti konsentrasi gas rumah kaca, emisi klorofluorokarbon (CFC), atau faktor atmosfer lainnya agar model yang diperoleh dapat menjelaskan variasi data secara lebih baik.
Mengingat pada model regresi masih ditemukan adanya penyimpangan pada asumsi autokorelasi, penelitian selanjutnya dapat menggunakan metode analisis lain yang lebih sesuai untuk data runtun waktu (time series), sehingga hasil analisis yang diperoleh dapat menjadi lebih akurat.
Penelitian ini diharapkan dapat menjadi referensi bagi penelitian selanjutnya yang berkaitan dengan analisis statistik terhadap fenomena lingkungan global, khususnya mengenai dinamika luas lubang ozon dan faktor-faktor yang mempengaruhinya.