1 Pendahuluan
1.1 Latar Belakang
Dalam statistika dikenal berbagai metode yang dapat digunakan untuk mengetahui hubungan antar variabel salah satunya adalah analisis regresi. Analisis regresi merupakan metode analisis data yang digunakna untuk mengetahui hubungan antara variabel prediktor dan variabel respon. Analisis ini sudah sangat sering digunakan dalam berbagai penelitian. Umumnya analisis ini diguanakan untuk mengestimasi pengaruh penggunaan variabel prediktor tertentu terhadap variabel respon. Seperti yang dilakukan oleh Padilah & Adam (2019) yang menggunakan analisis regresi berganda untuk mengestimasi produktivitas tanaman padi di Karawang. Selain itu, Mona dkk. (2015) menggunakan analisis regresi untuk mengestimasi pendapatan petani kelapa di Desa Beo, Kecamatan Beo kabupaten Talaud. Maka dari itu, pada mini projek kali ini akan dilakukan analisis regresi untuk mengetahui pengaruh Iklan di Sosial media youtube, facebook dan news paper terhadap sales (penjualan) yang dilakukan perusahaan. Analisis ini akan dilakukan dengan bantuan software R.
1.2 Statistika Deskrkptif
Statistika deskriptif merupakan metode yang digunakan untuk memberikan deskripsi data, seperti menata data dan menyederhanakan data dengan tujuan mempermudah memahami karakteristik data (Yitnosumarto, 1990). Statistika deskriptif pada umumnya disajikan dalam bentuk gambar baik berupa histogram, scatter plot, Pie Chart dan lain lain. Penyajian dalam bentuk gambar ini dilakukan agar tampilan lebih menarik dan mempermudah pembaca untuk memahami makna dari gambar tersebut. Adapun dalam stastika deskriptif dikenal ukuran pemusatan dan penyebaran data. Ukuran pemusatan data terdiri dari rata-rata, median dan modus. Sedangkan ukuran penyebaran data terdiri dari varian, jangkauan dan simpangan baku.
1.3 Regresi Linier Berganda
Analisis regresi adalah metode statistika yang digunakan untuk menjelaskan hubungan anatara peubah prediktor dengan peubah respon. Jika hanya terdapat satu peubah prediktor dan satu peubah respon yang bersifat kuantitatif maka dapat digunakan analisis regresi linier sederhana. Namun, Jika terdapat dua atau lebih peubah prediktor dengan satu peubah respon kuantitatif maka dapat digunakan analisis regresi berganda. Adapun bentuk persamaan regresi sebagai berikut.
\[ Y = \beta~0~ + \beta~1X1 + \dots + \beta~n~X~n~ + \epsilon \tag 1 \] Metode kuadrat terkecil merupakan metode yang umumnya digunakan untuk menentukan koefisien regresi. Secara keseluruhan hasil analisis regresi dapat dipercayai jika memenuhi beberapa asumsi yang biasa di sebut asumsi klasik (Mardiatmoko, 2020).
Normalitas sisaan Model regresi yang baik, mengharuskan sisaan menyebar secara normal. Adapun pengujian normalitas dapat dilakukan dengan berbagai metode salah satunya dengan melakukan uji shapiro wilk. Sisaan dikatakan menyebar normal jika nilai-p > \(\alpha\) (0.05).
Homoskedastisitas sisaan Selain harus menyebar normal, model regresi yang baik juga harus memiliki ragam sisaan yang homogen. Pengujian asumsi homoskedastisitas siaan dapat dilakukan dengan uji Breusch-Pagan, ragam sisaan dikatakan homogen jika nilai-p > \(\alpha\) (0.05).
Non-Autokorelasi
Autokorelasi merupakan kondisi dimana sisaan pada periode ke-t memiliki hubungan terhadap sisan pada periode ke-(t-1). Model regresi yang baik, tidak memperbolehkan adanya Autokorelasi, pengujian autokorelasi dapat dilakukan dengan uji Durbin Watson. Sisaan dikatan memenuhi asumsi non-autokorelasi jika nilai-p > \(\alpha\) (0.05).Non-Multikolinieritas
Permasalahan multikolinieritas merupakan permasalahan yang terjadi karena adanya hubungan antara variabel prediktor. Multikolinieritas sempurna antara varibel prediktor bahkan dapat menyebabkan koefisien regresi tidak dapat didugua. Sehingga, model regresi yang baik adalah model yang tidak memiliki permasalahan multikolinieritas atau memenuhi asumsi non-multikolinieritas. Pemeriksaan multikolinieritas dapat dilakukan dengan melihat nilai VIF, jik nilai VIF < 10 maka dapat dinyatakan bahwa asumsi non-multikolinieritas terpenuhi.
1.4 Data
Data yang digunakan adalah data berisi pembayaran iklan yang dikeluarkan melalui sosial media youtube, facebook, surat kabar serta penjualan yang terjadi setelah pengiklanan dilakukan dalam ribuan dollar. Adapun data ini dapat di akses melalui tautan berikut.
[https://www.kaggle.com/datasets/fayejavad/marketing-linear-multiple-regression]
2 Source Code
2.1 Library yang dibutuhkan
Untuk menjalakan seluruh kode dalam analisis ini diperlukan beberapa library sebagai berikut :
> library(knitr)
> library(rmarkdown)
> library(prettydoc)
> library(equatiomatic)
> library(ggplot2)
> library(gridExtra)
> library(lmtest)
> library(car)
> library(broom)2.2 Mengimpor data
> market <- read.csv('E:/kuliah/KOMSTAT/laporan praktikum/marketing_data.csv',
+ sep = ',', header = TRUE)
> paged_table(market)read.csv merupakan fungsi yang digunakan untuk mengimpor data berupa file csv. setelah memanggil fungsi read.csv masukan lokasi file dan pembatas data dengan perintah sep = , karena dalam hal ini pembatas data adalah tanda ,.
paged_table merupakan fungsi dari library rmarkdown yang digunakan untuk memunculkan dataset secara keseluruhan, dari sini terlihat bahwa dataset market memiliki sebuah dataset yang bernama ï..youtube, penamaan seperti ini sangat mungkin mempersulit dalam analisis. Sehingga perlu dilakukan penggantian nama kolom dengan kode sebagai berikut.
> names(market)[1] <- paste("youtube") untuk mengganti nama kolom digunakan fungsi names, dengan variabel masukan yaitu data frame yang akan diganti namanya. [1] dalam code di atas untuk mengubah kolom pertama dalam dataset yaitu species. Sehingga dataframe market akan berubah sebagai berikut.
> str(market)
'data.frame': 171 obs. of 4 variables:
$ youtube : num 84.7 351.5 135.5 116.6 318.7 ...
$ facebook : num 19.2 34 20.9 1.8 24 ...
$ newspaper: num 48.96 51.84 46.32 36 0.36 ...
$ sales : num 12.6 25.7 14.3 11.5 20.9 ...2.3 Statistika Deskriptif
> summary(market)
youtube facebook newspaper sales
Min. : 0.84 Min. : 0.00 Min. : 0.36 Min. : 1.92
1st Qu.: 91.08 1st Qu.:11.70 1st Qu.: 13.74 1st Qu.:12.54
Median :179.76 Median :26.76 Median : 31.08 Median :15.48
Mean :178.02 Mean :27.67 Mean : 35.24 Mean :16.92
3rd Qu.:262.98 3rd Qu.:43.68 3rd Qu.: 50.88 3rd Qu.:20.82
Max. :355.68 Max. :59.52 Max. :121.08 Max. :32.40 Fungsi summary digunakan untuk menunjukkan ringkasan data secara keseluruhan. dalam hal ini didapatkan ringkasan dari setiap variabel. Dalam hal ini diperoleh nilai dari ukuran pemusatan dan penyebaran data yaitu mean, median, nilai minimum, maksimum, serta kuartil.
- Plot
> yt <- ggplot(market, aes(youtube, sales)) +
+ geom_point()
> fb <- ggplot(market, aes(facebook, sales)) +
+ geom_point()
> newsp <- ggplot(market, aes(newspaper, sales))+
+ geom_point()
> grid.arrange(yt, fb, newsp)
ggplot() digunakan untuk membentuk kanvas kosong, selanjutnya dalam kanvas tersebut dimasukkan data yang digunakan. selanjutnya dimasukan variabel yang akan dijadikan sumbu x dan y dengan perintah aes. Untuk membentuk scatter plot digunakan fungsi geom_point
2.4 Analisis Regresi Berganda
Dengan menggunakan regresi berganda ingin diketahui pengaruh iklan yang dilakukan di sosial media youtube, facebook dan newspaper terhadap sales (penjualan).
2.4.1 Model regresi
> market_model <- lm(sales ~., data = market)
> summary(market_model)
Call:
lm(formula = sales ~ ., data = market)
Residuals:
Min 1Q Median 3Q Max
-10.6212 -0.9316 0.2776 1.4111 3.3701
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 3.505871 0.399647 8.772 1.96e-15 ***
youtube 0.045235 0.001516 29.830 < 2e-16 ***
facebook 0.188398 0.009016 20.895 < 2e-16 ***
newspaper 0.004279 0.006501 0.658 0.511
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 2.01 on 167 degrees of freedom
Multiple R-squared: 0.9005, Adjusted R-squared: 0.8987
F-statistic: 503.7 on 3 and 167 DF, p-value: < 2.2e-16lm digunakan untuk membentuk model hubungan antara variabel prediktor terhadap respon. Dalam hal ini variabel respon adalah sales selainnya adalah variabel prediktor.
summary digunakan untuk menampilkan ringkasan model, mulai dari penduga beta hingga asil uji parsial.
2.4.2 Uji asumsi
- normalitas
> res <- residuals(market_model)
> shapiro.test(res)
Shapiro-Wilk normality test
data: res
W = 0.91394, p-value = 1.734e-08residuals digunakan untuk mengekstrak sisaan yang telah terbentuk dalam model.
shapiro.test merupakan fungsi yang digunakan untuk melakukan uji normalitas shapiro wilk. Pada kasus ini uji normalitas dilakukan terhadap sisaan
- Homoskedastisitas
> bptest(market_model)
studentized Breusch-Pagan test
data: market_model
BP = 5.0942, df = 3, p-value = 0.165bptest merupakan fungsi dari library lmtest yang berfungsi untuk melakukan uji Breusch-Pagan untuk menguji homoskedastisitas
- Non-Autokorelasi
> dwtest(market_model)
Durbin-Watson test
data: market_model
DW = 2.0646, p-value = 0.6656
alternative hypothesis: true autocorrelation is greater than 0dwtest merupakan fungsi dari library lmtest untuk melakukan uji Durbin-Watson untuk mengetahui adanya permasalahan autokorelasi.
- Non-Multikolinieritas
> vif(market_model)
youtube facebook newspaper
1.015706 1.097761 1.103072 vif merupakan fungsi dari library car yang berguna untuk menunjukkan nilai VIF dari setiap variabel prediktor dalam model.
3 Hasil dan Pembahasan
3.1 Statistika Deskriptif
> knitr::kable(summary(market), caption = 'Statistika Deskriptif')| youtube | newspaper | sales | ||
|---|---|---|---|---|
| Min. : 0.84 | Min. : 0.00 | Min. : 0.36 | Min. : 1.92 | |
| 1st Qu.: 91.08 | 1st Qu.:11.70 | 1st Qu.: 13.74 | 1st Qu.:12.54 | |
| Median :179.76 | Median :26.76 | Median : 31.08 | Median :15.48 | |
| Mean :178.02 | Mean :27.67 | Mean : 35.24 | Mean :16.92 | |
| 3rd Qu.:262.98 | 3rd Qu.:43.68 | 3rd Qu.: 50.88 | 3rd Qu.:20.82 | |
| Max. :355.68 | Max. :59.52 | Max. :121.08 | Max. :32.40 |
Dari hasil terlihat diperoleh beberapa kesimpulan sebagai berikut :
biaya minimal yang dikeluarkan untuk iklan youtube adalah $ 0.84 ribu dan paling banyak $ 355.68 ribu dengan rata-rata pembayaran sebesar $178.02 ribu.
biaya minimal yang dikeluarkan untuk iklan facebook adalah $ 0.00 ribu dan paling banyak $ 59.52 ribu dengan rata-rata pembayaran sebesar $27.67 ribu.
biaya minimal yang dikeluarkan untuk iklan news paper adalah $ 0.36 ribu dan paling banyak $ 121.08 ribu dengan rata-rata pembayaran sebesar $35.24 ribu.
penjualan minimal yang dapat dilakukan adalah $ 1.92 ribu dan maksimal $ 32.40 ribu dengan rata-rata $ 16.92 ribu.
> yt Plot di atas mengenidikasikan adanya hubungan linier antara pembayaran iklan di youtube dengan penjualan yang di dapatkan.
> fb plot di atas mengindikasikan adanya hubungan linier antara pembayaran iklan facebook dengan penjualan yang diperoleh.
> newsp plot di atas menunjukan hubungan yang tidak antara pembayaran iklan di newspaper terhadap penjualan yang diperoleh.
3.2 Regresi Linier Berganda
Studi kasus ini bertujuan untuk mengetahui pengaruh harga iklan di sosial media terhadap penjualan yang di dapatkan perusahaan
3.2.1 Model Regresi
Model regresi sebelumnya telah ditentukan dengan menggunakan fungsi lm. Berdasarkan model tersebut dibentuk tabel yang berisi penduga koefisien regresi dengan fungsi kable
> kable(coefficients(market_model), caption = 'Penduga koefisien regresi')| x | |
|---|---|
| (Intercept) | 3.5058710 |
| youtube | 0.0452354 |
| 0.1883978 | |
| newspaper | 0.0042795 |
Berikut model regresi untuk mengetahui pengaruh iklan youtube, facebook dan newspaper terhadap penjualan.
\[ sales = 3.506 + 0.045youtube + 0.188facebook + 0.004newspaper + \epsilon \]
Berdasarkan model di atas diperoleh beberapa kesimpulan sebagai berikut:
Jika tidak dilakukan iklan pada seluruh media sosial maka rata-rata penjualan bernilai 3.506 ribu dollar.
Jika pembayaran youtube meningkat $ 1000 maka penjualan akan meningkan $ 0.045 ribu
jika pembayaran facebook meningkat $ 1000 maka penjualan akan meningkan $ 0.188 ribu
jika pembayaran news paper meningkat $ 1000 maka penjualan akan meningkan $ 0.004 ribu
3.2.2 Uji Parsial
Uji parsial digunakan untuk mengetahui pengaruh masing-masing variabel prediktor terhadap variabel respon.
Hipotesis :
- Youtube
H0 : pembayaran iklan youtube tidak berpengaruh terhadap penjualan.
H1 : pembayaran iklan youtube berpengaruh terhadap penjualan.
H0 : pembayaran iklan facebook tidak berpengaruh terhadap penjualan.
H1 : pembayaran iklan facebook berpengaruh terhadap penjualan.
- Newspaper
H0 : pembayaran iklan Newspaper tidak berpengaruh terhadap penjualan.
H1 : pembayaran iklan Newspaper berpengaruh terhadap penjualan.
Menggunakan model yang telah terbentuk, diperoleh hasil uji t sebagai berikut:
> kable(summary(market_model)$coefficients[,3:4], caption = 'Uji Parsial')| t value | Pr(>|t|) | |
|---|---|---|
| (Intercept) | 8.7724110 | 0.0000000 |
| youtube | 29.8298753 | 0.0000000 |
| 20.8953417 | 0.0000000 | |
| newspaper | 0.6582438 | 0.5112879 |
Berdasarkan hasil di atas diperoleh beberapa kesimpulan sebagai berikut:
Nilai-p variabel youtube(0.00) < \(\alpha\) (0.05) sehingga H0 di tolak, dengan demikian dapat disimpulkan bahwa dengan tingkat kepercayaan 95% benar terdapat pengaruh pembayaran iklan youtube terhadap penjualan.
Nilai-p variabel facebook (0.00) < \(\alpha\) (0.05) sehingga H0 di tolak, dengan demikian dapat disimpulkan bahwa dengan tingkat kepercayaan 95% benar terdapat pengaruh pembayaran iklan facebook terhadap penjualan.
nilai-p variabel newspaper (0.511) > \(\alpha\) (0.05) sehingga H0 di tolak, dengan demikian dapat disimpulkan bahwa dengan tingkat kepercayaan 95% benar tidak terdapat pengaruh pembayaran iklan newspaper terhadap penjualan.
3.2.3 Uji Simultan
Uji simultan merupakan uji yang digunakan untuk mengetahui pengaruh variabel prediktor secara keseluruhan terhadap variabel respon. Adapun hipotesis uji simultan sebagai berikut.
H0 : pembayaran iklan youtube, facebook dan news paper secara bersama-sama tidak berpengaruh terhadap penjualan.
H1 : pembayaran iklan youtube, facebook dan newspaper secara bersama-sama berpengaruh terhadap penjualan.
Untuk mengekstrak hasil uji yang sudah dilakukan digunakan fungsi glance seperti kode berikut.
> kable(glance(market_model)[,4:5],caption = "uji simultan")| statistic | p.value |
|---|---|
| 503.6581 | 0 |
Berdasarkan hasil di atas diperoleh nilai-p (0.000) < \(\alpha\) (0.05) sehingga H0 ditolak. dengan demikian dapat disimpulkan bahwa benar terdapat hubungan pembayaran iklan youtube, facebook, dan newspaper secara bersama-sama terhadap penjualan.
3.3 Uji Asumsi
3.3.1 Uji normalitas
Hipotesis :
H0 : sisaan menyebar normal
H1 : sisaan tidak menyebar normal
Uji shapiro wilk menunjukkan hasil sebagai berikut.
> kable(glance(shapiro.test(res)), caption = "Uji Normalitas sisaan")| statistic | p.value | method |
|---|---|---|
| 0.9139421 | 0 | Shapiro-Wilk normality test |
Uji shapiro wilk terhadap sisaan diperoleh nilai-p (0) < \(\alpha\) (0.05) sehingga H0 ditolak, dengan demikian dapat disimpulkan bahwa data tidak berdistribusi normal. Karena ukuran sampel > 30 maka digunakan dalil limit pusat yang menyatakan apabila ukuran semakin besar (sampel data ≥ 30), maka distribusi dianggap normal sehingga asumsi normalitas terpenuhi.
3.3.2 Homoskedastisitas
Hipotesis :
H0 : Ragam sisaan homogen
H1 : Ragam sisaan tidak homogen
> kable(glance(bptest(market_model)), caption = "Uji Asumsi Homogenitas")| statistic | p.value | parameter | method |
|---|---|---|---|
| 5.094157 | 0.165031 | 3 | studentized Breusch-Pagan test |
Berdasarkan hasil uji Breusch-Pagan di atas diperoleh nilai-p(0.165) > \(\alpha\) (0.05) sehingga H0 diterima, dengan demikian dapat disimpulkan bahwa ragam sisaan homogon sehingga asumsi homoskedastisitas terpenuhi.
3.3.3 Non-Autokorelasi
Hipotesis :
H0 : Tidak terjadi autokorelasi (non autokorelasi terpenuhi)
H1 : terjadi autokorelasi (non autokorelasi tidak terpenuhi)
> kable(glance(dwtest(market_model)), caption = "uji asumsi Non-Autokorelasi")| statistic | p.value | method | alternative |
|---|---|---|---|
| 2.064582 | 0.6656091 | Durbin-Watson test | true autocorrelation is greater than 0 |
Berdasarkan hasil uji Durbin Watson diperolen nilai-p(0.665) > \(\alpha\) (0.05) sehingga H0 diterima, dengan demikian dapat disimpulkan bahwa tidak terdapat permasalahan autokorelasi.
3.3.4 Non-multikolinieritas
Pemeriksaan asumsi non-multikolinieritas dilakukan dengan milihat nilal VIF. Berikut nilai VIF setiap variabel prediktor.
> kable(vif(market_model), caption = "Nilai VIF" )| x | |
|---|---|
| youtube | 1.015706 |
| 1.097761 | |
| newspaper | 1.103072 |
Dari hasil di atas terlihat bahwa nilai VIF seluruh variabel prediktor kurang dari 10. sehingga dapat disimpulkan bahwa tidak terdapat permasalahan multkolinieritas atau asumsi non-multikolinieritas terpenuhi
4 Daftar Pustaka
Mardiatmoko, G. (2020). Pentingnya Uji Asumsi Klasik pada Analisis Regresi Linier Berganda ( Studi Kasus Penyusunan Persamaan Allometrik Kenari Muda [CANARIUM INDICUM L.]). BAREKENG : Jurnal Ilmu Matematika dan Terapan, 14(3), 333-342.
Mona, M. G., Kekenusa, J. S., & Prang, J. D. (2015). Penggunaan Regresi Linier Berganda untuk Menganalisis Pendapatan Petani Kelapa Studi Kasus: Petani Kelapa di desa Beo, kecamatan Beo kabupaten Talaud. Journal of Dedicators Community, 4(2), 196-203.
Padilah, T. N., & Adam, I. R. (2019). Analisis Regresi Linier Berganda dalam Estimasi Produktivitas Tanaman Padi di Kabupaten Karawang. FIBONACCI : Jurnal Pendidikan Matematika dan Matematika, 5(2), 117-128.
Yitnosumarto, S. (1990). Dasar-Dasar STATISTIKA. Jakarta: Rajawali.