ANALISIS REGRESI BERGANDA UNTUK MENGETAHUI PENGARUH INCOME DAN HARGA TERHADAP KONSUMSI ES KRIM DI AMERIKA SERIKAT

Dea Amanda Christina

5/16/2022

Library:

> library(knitr)
> library(rmarkdown)
> library(prettydoc)
> library(equatiomatic)

1 PENDAHULUAN

1.1 Latar Belakang

Pada zaman modern ini, banyak sekali minuman olahan yang terbuat dari susu, salah satunya adalah es krim. Es krim merupakan salah satu produk yang banyak disukai oleh banyak orang, mulai dari anak-anak, orang dewasa hingga orang tua yang termasuk kelompok umur berisiko tinggi. Oleh karena itu, tidak heran jika industri es krim terus berpeluang meningkatkan pertumbuhannya. Industri es krim pun kini berkembang dengan memberikan berbagai varian rasa yang dapat dinikmati oleh banyak orang. Persaingan antara perusahaan es krim pun tentunya semakin ketat, seiring makin menjamurnya perusahaan baru di bidang industri ini. Salah satu hal yang dapat membuat penjualan es krim suatu perusahaan dapat bertahan adalah dengan penentuan harga yang tepat. Harga merupakan faktor yang penting juga yang harus diperhatikan oleh perusahaan dalam memasarkan produknya karena dapat menimbulkan rasa puas atau tidak puas dari konsumen. Rasa puas konsumen dapat tercipta ketika konsumen menyetujui harga yang ditawarkan oleh penyedia produk dan bersedia membeli produk tersebut sebab konsumen melihat bahwa harga yang ditawarkan adalah harga yang wajar. Penentuan harga yang tepat dapat memengaruhi seseorang untuk membeli dan mengkonsumsi produk es krim. Kebanyakan orang cenderung menyukai produk dengan harga terjangkau, promosi produk, maupun potongan harga atau diskon dari produk tersebut. Semakin terjangkau harganya, maka besar kemungkinan orang akan banyak membeli produk es krim tersebut dan mengkonsumsinya.

Hal lain dalam kesediaan konsumen ketika membeli atau mengkonsumsi suatu produk, dalam hal ini produk es krim, bergantung dari income atau penghasilan yang diperoleh oleh tiap-tiap individu. Penghasilan seseorang juga dapat memengaruhi konsumsi es krim. Seperti yang kita ketahui, bahwa es krim bukan merupakan kebutuhan pokok manusia, sehingga tidak semua orang dengan penghasilan yang beragam akan selalu mengkonsumsi es krim sepanjang waktu. Dari keterangan yang ada, dapat dibuat suatu pengertian bahwa konsumsi es krim bisa dipengaruhi oleh harga dari es krim tersebut dan juga penghasilan yang diterima oleh tiap-tiap individu. Untuk mengetahui besar pengaruh dari harga es krim dan penghasilan seseorang terhadap konsumsi es krim dapat dilakukan analisis regresi linier berganda.

Berdasarkan uraian diatas, penulis tertarik untuk melakukan penelitian yang berjudul “ANALISIS REGRESI BERGANDA UNTUK MENGETAHUI PENGARUH INCOME DAN HARGA TERHADAP KONSUMSI ES KRIM DI AMERIKA SERIKAT”.

2 Tinjauan Pustaka

2.1 Analisis Regresi Linier

Analisis regresi linear berganda digunakan untuk mengetahui arah dan seberapa besar pengaruh variabel independen terhadap variabel dependen (Ghozali, 2016). Hubungan antara variabel yang dimaksudkan tersebut digambarkan dalam bentuk persamaan atau model yang menghubungkan antara variabel dependen atau respon (Y) dan satu atau lebih variabel independen atau prediktor (X).

Variabel independen pada regresi linier berganda dinotasikan dengan X_1,X_2,…,X_k dimana k merupakan jumlah variabel independen, Persamaan model regresi linier berganda dapat dituliskan sebagai berikut :

\[ Y_{i}=\beta_{0}+\beta_{1}X_i1+\beta_{2}X_i2+\dots+\beta_{k}X_ik+\epsilon_{i} \]

Keterangan :
\(Y_i\) : nilai variabel respon untuk pengamatan ke-i
\(\beta_{0}\) : konstanta model regresi linier berganda
\(\beta_{k}\) : slope atau koefisien regresi liner berganda pada variabel ke-k
\(X_{ik}\) : nilai pengamatan ke-i pada variabel prediktor ke-k
\(\epsilon_{i}\) : galat pengamatan ke-i yang berdistribusi normal
\(i\) : 1,2,…,n
\(k\) : 1,2,…,p-1

Analisis regresi pada RStudio dapat dilakukan dengan menggunakan fungsi lm(formula, data), dimana :

Argumen Penjelasan
formula Rumus untuk menyatakan model regresi
data Data frame dengan variabel yang dinyatakan pada formula
lainnya Argumen lain yang bersifat opsional

Table : Source Code Analisis Regresi

2.2 Pemeriksaan Plot Sisaan

Pemeriksaan sisaan atau Residuals Diagnostic merupakan langkah awal untuk memeriksa secara visual, apakah terdapat pelanggaran asumsi dari model regresi yang sudah terbentuk. Pemeriksaan sisaan bisa dilakukan dengan melihat beberapa diagram atau plot yang melibatkan sisaan.

Pada RStudio, untuk mendapatkan output plot sisaan, dapat digunakan fungsi plot(x, which = c(1,2,3,4,5),...), dimana :

Argumen Penjelasan
x Obyek kelas lm atau anova
which Jenis plot yang ingin ditampilkan
1 plot Residuals vs Fitted untuk memeriksa ketepatan model
2 Q-Q plot untuk normalitas
3 Plot Scale-Location untuk memeriksa kesamaan ragam
4 Jarak Cook vs Urutan pengamatan
5 Leverage vs Sisaan yang dibakukan
Table : Source Code Pemeriksaan Sisaan

2.3 Asumsi Analisis Regresi Linier Berganda

Model regresi linier berganda dibangun atas beberapa asumsi yang menjadi syarat yang harus dipenuhi sebelum melakukan pengujian. Asumsi persayaratan analisis regresi adalah asumsi normalitas, asumsi homoskedastisitas, asumsi non autokorelasi, dan asumsi non multikolinieritas.

2.3.1 1. Asumsi Normalitas

Asumsi persyaratan normalitas harus terpenuhi untuk mengetahui apakah data sampel berasal dari populasi yang berdistribusi normal. Uji statistik yang digunakan antara lain :

  • Jarque Berra
  • Saphiro Wilk, dll

Pelanggaran asumsi ini dapat berakibat pada tidak sahnya hasil uji hipotesis, sehingga ketika terdapat pelanggaran asumsi normalitas maka perlu ada penanganan. Pelanggaran normalitas dapat ditangani dengan beberapa cara, antara lain :

  • Menambah banyaknya pengamatan.
  • Menghilangkan data yang menyebabkan tidak normal.
  • Transformasi data menjadi log, ln, atau pangkat.
  • Menggunakan boostrap untuk mendapatkan sebaran penduga dan pengujian hipotesis.

Uji normalitas diterapkan pada sisaan model. Setelah melakukan analisis regresi, sisaan dapat diperoleh dengan bantuan fungsi residuals(), dengan parameter berupa obyek variabel pada fungsi lm yang sudah diperoleh sebelumnya. Sementara untuk melakukan uji statistik untuk asumsi normalitas, diperlukan package tseries untuk mengakses perintah bagi Jarque Berra test dan Saphiro Wilk test.

2.3.2 Asumsi Homoskedastisitas

Ketika didapati bahwa ragam galat untuk setiap variabel prediktor adalah sama, maka asumsi homoskedastisitas terpenuhi. Bila asumsi ini tidak terpenuhi atau disebut heteroskedastisitas, maka akan meningkatkan ragam dari sebaran \(\hat\beta\) sehingga \(\hat\beta\) bukan lagi penduga yang paling efisien. Jika tidak terdeteksi, ragam \(\hat\beta\) diduga lebih rendah (underestimated) yang berakibat pada statistik uji \(t\) dan uji \(F\) menjadi lebih besar dari sebenarnya, sehingga uji tersebut menjadi kurang terpercaya karena lebih sering menolak \(H_0\).

Homoskedastisitas

Heteroskedastisitas

Untuk melakukan uji bagi asumsi homoskedastisitas, dapat dilakukan Breusch Pagan test. Untuk mengakses perintah bagi Breusch Pagan test di RStudio diperlukan package lmtest. Sementara untuk menangani pelanggaran asumsi ini dapat dilakukan beberapa metode, antara lain :

  • Weighted Least Square (WLS)
  • White Method

2.3.3 Asumsi Non Autokorelasi

Asumsi non autokorelasi merupakan asumsi kebebasan antar galat. Asumsi ini bertujuan untuk mengetahui apakah model regresi linier terdapat korelasi antara kesalahan penggunaan periode t dengan kesalahan penggunaan periode t-1 atau periode sebelumnya. Asumsi ini lebih sering diujikan pada data deret waktu (time series), sementara pada data panel (cross section) jarang sekali dilakukan uji ini karena urutan waktu diabaikan. Kebebasan antar galat dapat digambarkan seperti berikut :

\[ cov(u_t, u_s) = 0, t \neq s \]

Efek akibat pelanggaran asumsi autokorelasi adalah ragam penduga yang menjadi lebih besar, sehingga berakibat pada penduga tidak lagi efisien. Jika autokorelasi tidak terdeteksi, maka penduga ragam menjadi tidak konsisten yang menyebabkan uji t lebih sering dinyatakan signifikan karena adalah overestimated R2.

Autokorelasi Positif

Autokorelasi Negatif

Non-Autokorelasi

Untuk melakukan uji bagi asumsi non-autokorelasi, dapat dilakukan Durbin Watson test. Untuk mengakses perintah bagi Durbin Watson test di RStudio diperlukan package lmtest. Sementara untuk menangani pelanggaran asumsi ini dapat dilakukan metode Cochrane-Orcutt Iterative Procedure.

2.3.4 Asumsi Non-Multikolinearitas

Kolinearitas terjadi karena terdapat korelasi yang cukup tinggi diantara variabel-variabel independen (X). Non-multikolinearitas berarti bahwa tidak ada hubungan linier antar variabel prediktor dalam model. Multikolinearitas sempurna mengakibatkan \(X'X\) menjadi matriks singular, sehingga tidak dapat ditemukan penduga \(/beta\) yang solutif. Sementara multikolinearitas tidak sempurna berakibat pada penduga MKT tetap dapat diduga namun selang kepercayaan menjadi lebih besar dan hipotesis nol lebih sering diterima (tidak signifikan).

Untuk melakukan uji bagi asumsi non-multikolinearitas, dapat menggunakan VIF (Variance Inflation Factor), untuk mengakses perintah bagi VIF pada RStudio diperlukan package car.

2.4 Data

Data yang digunakan untuk analisis ini adalah Data Konsumsi Es Krim di Kota Inggris, seperti yang tertera pada tabel berikut :

> Ice_cream <- read.csv("D:/STATISTIKA ASOY/SEMESTER 6/KOMSTAT/Prak/penjualan ice cream.csv")
> Ice_cream
   Konsumsi Income Harga
1     0.386     78 0.270
2     0.374     79 0.282
3     0.393     81 0.277
4     0.425     80 0.280
5     0.406     76 0.272
6     0.344     78 0.262
7     0.327     82 0.275
8     0.288     79 0.267
9     0.269     76 0.265
10    0.256     79 0.277
11    0.286     82 0.282
12    0.298     85 0.270
13    0.329     86 0.272
14    0.318     83 0.287
15    0.381     84 0.277
16    0.381     82 0.287
17    0.470     80 0.280
18    0.443     78 0.277
19    0.386     84 0.277
20    0.342     86 0.277
21    0.319     85 0.292
22    0.307     87 0.287
23    0.284     94 0.277
24    0.326     92 0.285
25    0.309     95 0.282
26    0.359     96 0.265
27    0.376     94 0.265
28    0.416     96 0.265
29    0.437     91 0.268
30    0.548     90 0.260

Data Source :
Hildreth, C. and J. Lu (1960) Demand relations with autocorrelated disturbances, Technical Bulletin No 2765, Michigan State University.

Keterangan - Konsumsi : Konsumsi ice cream rata-rata tiap orang (liter) - Income : Rata-rata penghasilan keluarga per minggu (US $) - Harga : Harga ice cream (US $)

3 Source Code

3.1 Analisis Regresi Linier Berganda

> reg <- lm(Konsumsi ~ Harga + Income, data = Ice_cream)
> summary(reg)

Call:
lm(formula = Konsumsi ~ Harga + Income, data = Ice_cream)

Residuals:
     Min       1Q   Median       3Q      Max 
-0.10951 -0.03865 -0.01045  0.03665  0.15635 

Coefficients:
              Estimate Std. Error t value Pr(>|t|)  
(Intercept)  0.9002400  0.4550344   1.978   0.0582 .
Harga       -2.0300382  1.4738940  -1.377   0.1797  
Income       0.0002135  0.0019687   0.108   0.9144  
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 0.06583 on 27 degrees of freedom
Multiple R-squared:  0.0678,    Adjusted R-squared:  -0.001257 
F-statistic: 0.9818 on 2 and 27 DF,  p-value: 0.3876

Untuk melakukan analisis regresi pada RStudio, dapat dilakukan dengan bantuan fungsi lm() dengan memasukkan parameter berupa variabel respon yaitu Konsumsi dan variabel prediktor yaitu Harga dan Income serta data yang akan dianalisis yaitu Data Ice_cream.
Sementara untuk menampilkan hasil analisis regresi dapat menggunakan fungsi summary() dengan parameter variabel reg pada fungsi sebelumnya.

3.2 Pemeriksaan Plot Sisaan

> plot(reg, which = c(1,2,3,4,5))

Untuk menampilkan kelima plot sisaan pada RStudio, dapat dilakukan dengan bantuan fungsi plot() yang diikuti dengan parameter variabel reg dan nomor plot yang mengindikasikan jenis plot yang ingin ditamplikan.

3.3 Uji Asumsi

3.3.1 Asumsi Normalitas

> sisa <- residuals(reg)
> library(tseries)
> jarque.bera.test(sisa)

    Jarque Bera Test

data:  sisa
X-squared = 0.92081, df = 2, p-value = 0.631
> shapiro.test(sisa)

    Shapiro-Wilk normality test

data:  sisa
W = 0.97765, p-value = 0.7601

Uji asumsi normalitas membutuhkan informasi sisaan (residual) dari model regresi. Untuk menampilkan hasil sisaan model pada RStudio, dapat dilakukan dengan memanfaatkan fungsi residuals() disertai parameter berupa variabel reg. Untuk dapat melakukan uji normalitas pada RStudio, diperlukan packages tseries agar dapat mengakses beberapa perintah didalamnya.
Uji Jarque Berra dapat dibantu dengan perintah jarque.berra.test() dan uji Saphiro Wilk dapat dibantu dengan perintah saphiro.test()disertai parameter variabel pada fungsi residual.

3.3.2 Asumsi Homoskedastisitas

> library(lmtest)
> bptest(reg)

    studentized Breusch-Pagan test

data:  reg
BP = 4.5797, df = 2, p-value = 0.1013

Untuk dapat melakukan uji homoskedastisitas pada RStudio, diperlukan packages tseries agar dapat mengakses beberapa perintah didalamnya.
Uji Breusch Pagan dapat dibantu dengan perintah bptest() disertai parameter variabel reg.

3.3.3 Asumsi Non-Autokorelasi

> dwtest(reg)

    Durbin-Watson test

data:  reg
DW = 0.42351, p-value = 1.919e-09
alternative hypothesis: true autocorrelation is greater than 0

Uji Durbin Watson dapat dibantu dengan perintah dwtest() disertai parameter variabel reg.

3.3.4 Asumsi Non-Multikolinearitas

> library(car)
> vif(reg)
   Harga   Income 
1.011687 1.011687 

Untuk dapat melakukan ujI non-multikolinearitas pada RStudio, diperlukan packages car agar dapat mengakses beberapa perintah didalamnya.
Untuk melihat nilai VIF dapat dibantu dengan perintah VIF() disertai parameter variabel reg.

4 Hasil dan Pembahasan

4.1 Analisis Regresi Linier Berganda

4.1.1 Uji Parsial

\[ H0 : \beta_{i}=0, \space i=1,2,3 \] \[ H1 : \beta_{i} \neq 0 \] Berdasarkan output
p-value Harga > \(\alpha\)
p-value Income > \(\alpha\)
Sehingga Terima H0 untuk kedua variabel, yang dapat disimpulkan bahwa dengan kepercayaan 95% dapat dibuktikan bahwa tidak terdapat pengaruh signifikan antara Harga Es Krim maupun Income terhadap Konsumsi Es Krim.

4.1.2 Uji Serempak

\[ H0 : \beta_{1}=\beta_{2}=\beta_{3}=0 \] \[ H1 : paling \space tidak \space terdapat \space salah \space satu \space \beta_{i} \neq 0 \] Berdasarkan output
p-value > \(\alpha\)
Sehingga Terima H0 untuk kedua variabel, yang dapat disimpulkan bahwa dengan kepercayaan 95% dapat dibuktikan bahwa secara serempak tidak terdapat pengaruh signifikan antara Harga Es Krim maupun Income terhadap Konsumsi Es Krim.

4.2 Pemeriksaan Plot Sisaan

Berdasarkan plot hasil output, dapat dijelaskan :

  • Plot 1 Residuals vs Fitted
    Garis merah tampak tidak membentuk garis horizontal, sehingga dapat diartikan bahwa model kurang tepat.

  • Plot 2 Q-Q plot
    Titik-titik data nampak berada tidak jauh dari garis horizontal, sehingga menunjukkan tidak ada outlier dan normalitas terpenuhi.

  • Plot 3 Scale-Location
    Garis merah yang terbentuk cenderung membentuk kurva, sehingga dicurigai terdapat ketidaksamaan ragam (heteroskedastisitas)

  • Plot 4 Jarak Cook vs Urutan
    Tampak bahwa pengamatan ke-9 dan ke-30 memiliki nilai yang cenderung lebih besar dibandingkan rata-rata pengamatan lainnya.

  • Plot 5 Leverage vs Sisaan
    Tampak bahwa data pengamatan ke-30 hampir mendekati area warning yang menunjukkan bahwa data ke-30 hampir mendekati kemungkinan amatan yang berpengaruh.

4.3 Uji Asumsi

4.3.1 Asumsi Normalitas

\[ H0 : Galat \space menyebar \space normal \] \[ H1 : Galat \space tidak \space menyebar \space normal \]

Berdasarkan output,
p-value Jarque Berra > \(\alpha\)
p-value Saphiro Test > \(\alpha\)
Sehingga Terima H0 yang berarti, dengan tingkat kepercayaan 95%, dapat disimpulkan bahwa sisaan mengindikasikan bahwa galat berdistribusi normal.

4.3.2 Asumsi Homoskedastisitas

\[ H0 : \delta_{i}=0, \space i=2,3 \] \[ H1 : paling \space tidak \space terdapat \space satu \space \delta_{i} \neq 0 \]

Berdasarkan output diatas
p-value Breusch Pagan > \(\alpha\)
Sehingga Terima H0 yang berarti, dengan tingkat kepercayaan 95%, dapat disimpulkan bahwa tidak terdapat heteroskedastisitas, dan asumsi homoskedastisitas terpenuhi.

4.3.3 Asumsi Non-Autokorelasi

\[ H0 : asumsi \space non \space autokorelasi \space terpenuhi \] \[ H1 : terdapat \space masalah \space autokorelasi \]

Berdasarkan output diatas
p-value Durbin Watson < \(\alpha\)
Sehingga Tolak H0 yang berarti, dengan tingkat kepercayaan 95%, dapat disimpulkan bahwa terdapat autokorelasi, namun karena data Es Krim yang digunakan ini berupa data panel dan tidak memperhatikan urutan waktu didalamnya, maka pelanggaran asumsi ini dapat diabaikan.

4.3.4 Asumsi Non-Multikolinearitas

Berdasarkan output diatas
VIF Harga < 10
VIF Income < 10
Sehingga dapat diartikan bahwa tidak ada indikasi multikolinearitas untuk kedua variabel.

4.4 Model Analisis Regresi Berganda

\[ Konsumsi = -2.03Harga+0.0002Income \]

Yang berarti bahwa setiap kenaikan 1 US$ Harga Es Krim, akan menurunkan Konsumsi Es Krim sebesar 2.03 liter. Sedangkan setiap kenaikan 1 US$ Income (Pendapatan) akan menaikkan konsumsi Es Krim sebesar 0.0002 liter.

5 Daftar Pustaka

Hildreth, C. and J. Lu (1960) Demand relations with autocorrelated disturbances, Technical Bulletin No 2765, Michigan State University.
Fatlahah, A. (2015). Pengaruh Kualitas produk dan Citra merek terhadap keputusan pembelian es krim wall’s magnum. Diamond, 1, 3.