Kebahagiaan merupakan salah satu indikator penting dalam menilai tingkat kesejahteraan masyarakat di suatu negara. Tingkat kebahagiaan sering diukur melalui happiness score yang menggambarkan kondisi kesejahteraan subjektif masyarakat berdasarkan berbagai faktor yang mempengaruhinya. Dalam berbagai penelitian, faktor sosial menjadi salah satu aspek yang berperan dalam membentuk tingkat kebahagiaan individu maupun masyarakat secara keseluruhan.
Salah satu faktor sosial yang diduga memiliki hubungan dengan tingkat kebahagiaan adalah social support atau dukungan sosial. Social support merupakan bentuk dukungan yang diperoleh individu dari lingkungan sosialnya, seperti keluarga, teman, maupun komunitas. Dukungan tersebut dapat membantu individu dalam menghadapi berbagai permasalahan hidup, meningkatkan rasa percaya diri, serta memberikan rasa aman dan nyaman dalam kehidupan sehari-hari. Oleh karena itu, semakin tinggi dukungan sosial yang diterima seseorang, maka semakin besar kemungkinan individu tersebut memiliki tingkat kebahagiaan yang lebih tinggi.
Berdasarkan hal tersebut, diperlukan suatu metode analisis statistik untuk mengetahui hubungan antara social support dengan happiness score. Salah satu metode yang dapat digunakan adalah analisis regresi linear sederhana, yang bertujuan untuk mengetahui pengaruh variabel independen terhadap variabel dependen. Oleh karena itu, pada penelitian ini dilakukan analisis pengaruh social support terhadap happiness score di 137 negara pada rentang bulan Januari hingga Mei 2023 menggunakan metode regresi linear sederhana.
Berdasarkan latar belakang dan tahapan analisis yang dilakukan, maka rumusan masalah dalam penelitian ini adalah sebagai berikut:
Berdasarkan rumusan masalah yang telah disusun, maka tujuan dari penelitian ini adalah sebagai berikut:
Analisis regresi linear sederhana merupakan salah satu metode statistik yang digunakan untuk mengetahui hubungan antara satu variabel independen dan satu variabel dependen. Metode ini bertujuan untuk melihat sejauh mana variabel independen dapat mempengaruhi atau menjelaskan perubahan pada variabel dependen.
Secara umum, model regresi linear sederhana dapat dituliskan sebagai berikut:
\[ y = \beta_0 + \beta_1 X_1 + \epsilon \] Dimana :
Uji normalitas bertujuan untuk mengetahui apakah residual dari model regresi berdistribusi normal. Asumsi ini penting agar estimasi parameter dan pengujian statistik dalam model regresi menjadi valid. Pengujian normalitas dapat dilakukan secara visual menggunakan grafik Normal Q–Q Plot maupun secara formal menggunakan uji statistik seperti Kolmogorov–Smirnov atau Shapiro–Wilk.
Uji linearitas bertujuan untuk mengetahui apakah hubungan antara variabel independen dan variabel dependen bersifat linear. Pengujian ini dapat dilakukan secara visual melalui scatterplot antara nilai residual dan nilai prediksi. Jika titik-titik menyebar secara acak tanpa membentuk pola tertentu, maka hubungan antar variabel dianggap linear.
Homoskedastisitas merupakan kondisi dimana varians residual pada model regresi bersifat konstan. Pengujian dapat dilakukan melalui scatterplot antara residual dan nilai prediksi. Jika sebaran titik tidak membentuk pola tertentu, maka asumsi homoskedastisitas terpenuhi.
Autokorelasi terjadi ketika residual antar pengamatan saling berkorelasi. Model regresi yang baik seharusnya tidak mengalami autokorelasi. Salah satu metode yang digunakan untuk mendeteksi autokorelasi adalah uji Durbin–Watson.
Uji F digunakan untuk mengetahui apakah model regresi secara keseluruhan memiliki hubungan yang signifikan antara variabel independen dan variabel dependen. Jika nilai signifikansi lebih kecil dari tingkat signifikansi (α), maka model regresi dinyatakan signifikan.
Uji t digunakan untuk mengetahui pengaruh variabel independen terhadap variabel dependen secara parsial. Jika nilai signifikansi lebih kecil dari tingkat signifikansi (α), maka variabel independen berpengaruh signifikan terhadap variabel dependen.
Koefisien determinasi (R²) digunakan untuk mengukur seberapa besar kemampuan variabel independen dalam menjelaskan variasi variabel dependen. Nilai R² berada antara 0 hingga 1, dimana nilai yang lebih besar menunjukkan kemampuan model yang lebih baik.
Model akhir merupakan persamaan yang sesuai dengan uji-uji asumsi yang diperoleh dan memenuhi asumsi-asumsi serta uji signifikansi yang telah dilakukan
Data yang digunakan dalam penelitian ini merupakan data dari 137 negara dengan happiness score sebagai variabel dependen (Y) dan social support sebagai variabel independen (X). Data tersebut diperoleh dari World Happiness Report 2023 yang tersedia pada platform Kaggle dan mencakup rentang waktu Januari hingga Mei 2023.
Install Packages
## Warning: package 'readxl' was built under R version 4.3.3
## Warning: package 'ggplot2' was built under R version 4.3.3
## Warning: package 'lmtest' was built under R version 4.3.3
## Warning: package 'zoo' was built under R version 4.3.3
## Warning: package 'car' was built under R version 4.3.3
## Warning: package 'carData' was built under R version 4.3.3
Input data dari file Excel
## # A tibble: 6 × 4
## No Country Y X
## <dbl> <chr> <chr> <chr>
## 1 1 Afghanistan 1859 0
## 2 2 Albania 5277 0.951
## 3 3 Algeria 5329 1298
## 4 4 Argentina 6024 1388
## 5 5 Armenia 5342 1134
## 6 6 Australia 7095 1497
## tibble [137 × 4] (S3: tbl_df/tbl/data.frame)
## $ No : num [1:137] 1 2 3 4 5 6 7 8 9 10 ...
## $ Country: chr [1:137] "Afghanistan" "Albania" "Algeria" "Argentina" ...
## $ Y : num [1:137] 1859 5277 5329 6024 5342 ...
## $ X : num [1:137] 0 0.951 1298 1388 1134 ...
##
## Call:
## lm(formula = Y ~ X, data = data)
##
## Residuals:
## Min 1Q Median 3Q Max
## -5463.4 -186.6 437.2 994.9 3188.8
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 4204.9105 284.2465 14.793 <2e-16 ***
## X 0.8220 0.2609 3.151 0.002 **
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 1931 on 135 degrees of freedom
## Multiple R-squared: 0.06852, Adjusted R-squared: 0.06162
## F-statistic: 9.931 on 1 and 135 DF, p-value: 0.002003
Berdasarkan output di atas, maka diperoleh model awalnya: \[ y = 4204.9105 + 0.8220 X + \epsilon \]
##
## Asymptotic one-sample Kolmogorov-Smirnov test
##
## data: res
## D = 0.22267, p-value = 2.517e-06
## alternative hypothesis: two-sided
Berdasarkan hasil uji Kolmogorov–Smirnov, diperoleh nilai p-value = 2.517e-06 yang lebih kecil dari tingkat signifikansi 0,05. Oleh karena itu, H₀ ditolak, sehingga dapat disimpulkan bahwa residual pada model regresi tidak berdistribusi normal.
Berdasarkan grafik Normal Q–Q Plot, terlihat bahwa sebagian titik tidak
mengikuti garis diagonal dan menyimpang cukup jauh dari garis tersebut.
Oleh karena itu, dapat disimpulkan bahwa residual pada model regresi
tidak berdistribusi normal.
Berdasarkan grafik scatterplot antara nilai prediksi dan residual,
terlihat bahwa titik-titik residual tidak sepenuhnya menyebar secara
acak dan terdapat kecenderungan pola tertentu. Oleh karena itu, dapat
disimpulkan bahwa asumsi linearitas pada model regresi belum sepenuhnya
terpenuhi.
##
## studentized Breusch-Pagan test
##
## data: model
## BP = 1.8673, df = 1, p-value = 0.1718
Berdasarkan hasil uji Breusch–Pagan, diperoleh nilai p-value = 0,1718 yang lebih besar dari tingkat signifikansi 0,05. Oleh karena itu, H₀ tidak ditolak, sehingga dapat disimpulkan bahwa model regresi tidak mengalami heteroskedastisitas atau memenuhi asumsi homoskedastisitas.
##
## Durbin-Watson test
##
## data: model
## DW = 2.2033, p-value = 0.8857
## alternative hypothesis: true autocorrelation is greater than 0
Berdasarkan hasil uji Durbin–Watson, diperoleh nilai p-value = 0,8857 yang lebih besar dari tingkat signifikansi 0,05. Oleh karena itu, H₀ tidak ditolak, sehingga dapat disimpulkan bahwa tidak terdapat autokorelasi pada model regresi.
##
## Call:
## lm(formula = Y ~ X, data = data)
##
## Residuals:
## Min 1Q Median 3Q Max
## -5463.4 -186.6 437.2 994.9 3188.8
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 4204.9105 284.2465 14.793 <2e-16 ***
## X 0.8220 0.2609 3.151 0.002 **
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 1931 on 135 degrees of freedom
## Multiple R-squared: 0.06852, Adjusted R-squared: 0.06162
## F-statistic: 9.931 on 1 and 135 DF, p-value: 0.002003
Berdasarkan hasil uji F diperoleh nilai F-statistic sebesar 9,931 dengan p-value = 0,002003 yang lebih kecil dari tingkat signifikansi 0,05. Oleh karena itu, H₀ ditolak, sehingga dapat disimpulkan bahwa model regresi secara keseluruhan signifikan, artinya variabel social support (X) secara bersama-sama berpengaruh terhadap happiness score (Y).
##
## Call:
## lm(formula = Y ~ X, data = data)
##
## Residuals:
## Min 1Q Median 3Q Max
## -5463.4 -186.6 437.2 994.9 3188.8
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 4204.9105 284.2465 14.793 <2e-16 ***
## X 0.8220 0.2609 3.151 0.002 **
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 1931 on 135 degrees of freedom
## Multiple R-squared: 0.06852, Adjusted R-squared: 0.06162
## F-statistic: 9.931 on 1 and 135 DF, p-value: 0.002003
Berdasarkan hasil uji t diperoleh nilai p-value untuk variabel X sebesar 0,002 yang lebih kecil dari tingkat signifikansi 0,05. Oleh karena itu, H₀ ditolak, sehingga dapat disimpulkan bahwa variabel social support (X) berpengaruh signifikan terhadap happiness score (Y).
## [1] 0.06852023
Berdasarkan hasil analisis diperoleh nilai koefisien determinasi (R²) sebesar 0,0685. Hal ini menunjukkan bahwa variabel social support mampu menjelaskan sebesar 6,85% variasi pada happiness score, sedangkan 93,15% sisanya dijelaskan oleh faktor lain di luar model penelitian ini.
Berdasarkan model regresi linear sederhana yang diperoleh, yaitu
\[ y = 4204.9105 + 0.8220 X + \epsilon \]
dapat disimpulkan bahwa variabel X memiliki pengaruh positif terhadap variabel Y. Hal ini ditunjukkan oleh nilai koefisien regresi sebesar 0.8220, yang berarti setiap peningkatan 1 satuan pada variabel X akan meningkatkan nilai Y sebesar 0.8220 satuan, dengan asumsi faktor lain dianggap konstan. Selain itu, nilai konstanta sebesar 4204.9105 menunjukkan bahwa ketika nilai X = 0, maka nilai Y diperkirakan sebesar 4204.9105.
Dengan demikian, secara keseluruhan dapat disimpulkan bahwa model regresi linear sederhana menunjukkan adanya hubungan linear positif antara variabel X dan variabel Y, sehingga peningkatan nilai variabel X cenderung diikuti oleh peningkatan nilai variabel Y. Model ini dapat digunakan untuk menggambarkan dan memprediksi hubungan antara kedua variabel tersebut.