Library:
> install.packages("knitr")
> install.packages("rmarkdown")
Error in contrib.url(repos, "source"): trying to use CRAN without setting a mirror
> install.packages("tinytex")
Error in contrib.url(repos, "source"): trying to use CRAN without setting a mirror
> install.packages("prettydoc")
Error in contrib.url(repos, "source"): trying to use CRAN without setting a mirror
> install.packages("equatiomatic")
Error in contrib.url(repos, "source"): trying to use CRAN without setting a mirror
> install.packages("pscl")
Error in contrib.url(repos, "source"): trying to use CRAN without setting a mirror
> install.packages("generalhoslem")
Error in contrib.url(repos, "source"): trying to use CRAN without setting a mirrorMobil merupakan salah satu jenis transportasi yang sering digunakan di Indonesia. Nama ‘mobil’ sendiri merupakan kependekan dari otomobil yang berasal dari Bahasa Yunani ‘autos’ dan Latin ‘movere’.Dari data ’Perkembangan Jumlah Kendaraan Bermotor Menurut Jenis(Unit) yang dirilis BPS tahun 2021-2022 mencatat bahwa terdapat sebanyak 17.168.862 unit mobil yang beredar di Indonesia, ini merupakan jenis kendaraan terbanyak kedua yang digunakan di Indonesia setelah motor.
Sebagai salah satu kendaraan yang paling banyak digunakan, tentunya mobil sering diburu untuk dibeli para konsumen. Ada beberapa faktor yang berasal dari konsumen tersebut yang mempengaruhi dalam menentukan keputusan akan membeli mobil tersebut atau tidak. Faktor-faktor tersebut diantaranya adalah usia, jenis kelamin, status pernikahan, jumlah kepemilikan mobil sebelumnya, dan penghasilan calon pembeli. Untuk melihat pengaruh hubungan faktor-faktor tersebut terhadap keputusan calon pembeli, maka akan digunakan analisis regresi logistik terhadap data calon pembeli yang telah ada.
Regresi logistik merupakan salah satu metode untuk menggambarkan hubungan antara variabel respons dengan variabel prediktor yang memiliki dua atau lebih kategori variabel respons memiliki skala kategorik maupun interval(Hosmer dan lemeshow, 1989).Dalam hal ini keputusan calon pembeli sebagai variabel respons dan faktor-faktor usia, jenis kelamin, status pernikahan, jumlah kepemilikan mobil sebelumnya, dan penghasilan calon pembeli sebagai variabel prediktor.
Regresi logistik adalah bagian dari analisis regresi yang digunakan untuk menganalisis variabel dependen yang bersifat kategori dan variabel independen bersifat kategori, kontinu, atau gabungan dari keduanya. Model regresi logistik biner digunakan untuk menganalisis hubungan antara satu variabel respon (variabel tak bebas) dan beberapa variabel bebas, dengan variabel responnya berupa data kualitatif dikotomi yaitu bernilai 1 untuk menyatakan keberadaan sebuah karakteristik dan bernilai 0 untuk menyatakan ketidakberadaaan sebuah karakteristik (Agresti, 2007). Model regresi logistik tersebut adalah: \[ g(x)=ln\frac{(𝜋(x)}{1−𝜋(𝑥)}=\beta_0+\beta_1X_1+\beta_2X_2+...+\beta_pX_p \]
Model Uji signifikansi parameter secara individual dilakukan dengan menggunakan Wald Test dengan rumusan hipotesis sebagai berikut: \[H_0 : \qquad \text{parameter berpengaruh signifikan} \\ H_1 : \qquad \text{parameter tidak berpengaruh signifikan} \]
Statistik uji yang digunakan: \[ W=\frac{\beta_j}{SE(\beta_j)} \]
Uji yang pertama kali dilakukan adalah pengujian peranan parameter di dalam model secara keseluruhan yaitu dengan hipotesis sebagai berikut: \[H_0 : \qquad \text{model berpengaruh signifikan} \\ H_1 : \qquad \text{model tidak berpengaruh signifikan} \]
Statistik uji yang digunakan: \[ G=-2[log(\frac{l_0}{l_1})-log(l_1)]=-2(L_0-L_1) \]
Multikolinearitas menurut Ragnar Frisch (1934) terjadi karena adanya hubungan linier sempurna antarvariabel regresor dalam suatu permodelan regresi (Gujarati, 2003). Uji multikolinearitas dimaksudkan untuk menguji apakah terdapat hubungan antarvariabel bebas dalam model regresi, karena diketahui bahwa model regresi yang baik adalah yang tidak terdapat hubungan antarvariabel independen (Ghozali Imam, 2005). Multikolinearitas dapat dilihat dari indikator Varians Inflasi Faktor (VIF) VIF didefinisikan sebagai: \[ VIF=\frac{1}{1-R^2} \]
Uji Odds Ratio membandingkan dua odds atau peluang terjadinya suatu kejadian dibandingkan tidak.Adapun perhitungannya adalah sebagai berikut: \[OddsRatio=\frac{\theta_h(j,k)}{\theta_i(j,k)}=\frac{𝑛11.𝑛22}{𝑛12.𝑛21} \]
Uji yang dipakai untuk menguji kecocokan model dalam regresi logistik adalah uji Hosmer-Lemeshow dengan hipotesis sebagai berikut: \[ X^2=∑\frac{(O_i-N_i𝜋_1)^2}{N_i𝜋_1(1-𝜋_1)} \]
> datareglog=read_excel("C:/Users/DELL/Documents/calonpembelimobil.xlsx")
Error in read_excel("C:/Users/DELL/Documents/calonpembelimobil.xlsx"): could not find function "read_excel"
> str(datareglog)
Error in eval(expr, envir, enclos): object 'datareglog' not found
> Y=as.factor(datareglog$Beli_Mobil)
Error in eval(expr, envir, enclos): object 'datareglog' not found
> X1=datareglog$Usia
Error in eval(expr, envir, enclos): object 'datareglog' not found
> X2=as.factor(datareglog$Status)
Error in eval(expr, envir, enclos): object 'datareglog' not found
> X3=as.factor(datareglog$Kelamin)
Error in eval(expr, envir, enclos): object 'datareglog' not found
> X4=datareglog$Memiliki_Mobil
Error in eval(expr, envir, enclos): object 'datareglog' not found
> X5=datareglog$Penghasilan
Error in eval(expr, envir, enclos): object 'datareglog' not found
> str(Y)
Error in eval(expr, envir, enclos): object 'Y' not found
> data_logistik<-data.frame(X1,X2,X3,Y)
Error in eval(expr, envir, enclos): object 'X1' not found
> str(data_logistik)
Error in eval(expr, envir, enclos): object 'data_logistik' not found> reg1 <- lm(X1~X2+X3+X4+X5, data=data_logistik)
Error in eval(mf, parent.frame()): object 'data_logistik' not found
> summary(reg1)
Error in eval(expr, envir, enclos): object 'reg1' not found
> R2_1 <- 1/(1-0.02385)
> R2_1
[1] 1.024433
>
> reg2 <- glm(X2~X1+X3+X4+X5, family=binomial, data =data_logistik)
Error in eval(mf, parent.frame()): object 'data_logistik' not found
> summary(reg2)
Error in eval(expr, envir, enclos): object 'reg2' not found
> pR2(reg2)
Error in pR2(reg2): could not find function "pR2"
> R2_2 <- 1/(1-2.320647e-03)
> R2_2
[1] 1.002326
>
> reg3 <- glm(X3~X1+X2+X4+X5, family = binomial, data =data_logistik)
Error in eval(mf, parent.frame()): object 'data_logistik' not found
> summary(reg3)
Error in eval(expr, envir, enclos): object 'reg3' not found
> pR2(reg3)
Error in pR2(reg3): could not find function "pR2"
> R2_3 <- 1/(1-7.579262e-03)
> R2_3
[1] 1.007637
>
> reg4 <- lm(X4~X1+X2+X3+X5, data=data_logistik)
Error in eval(mf, parent.frame()): object 'data_logistik' not found
> summary(reg4)
Error in eval(expr, envir, enclos): object 'reg4' not found
> R2_4 <- 1/(1-0.03007)
> R2_4
[1] 1.031002
>
> reg5 <- lm(X5~X1+X2+X3+X4, data=data_logistik)
Error in eval(mf, parent.frame()): object 'data_logistik' not found
> summary(reg5)
Error in eval(expr, envir, enclos): object 'reg5' not found
> R2_5 <- 1/(1-0.04234)
> R2_5
[1] 1.044212> beta<-(coef(reglog))
Error in eval(expr, envir, enclos): object 'reglog' not found
> beta
function (a, b)
.Internal(beta(a, b))
<bytecode: 0x000001cfed4af728>
<environment: namespace:base>
> OR_beta<-exp(beta)
Error in exp(beta): non-numeric argument to mathematical function
> OR_beta
Error in eval(expr, envir, enclos): object 'OR_beta' not found
> cbind(beta,OR_beta)
Error in eval(expr, envir, enclos): object 'OR_beta' not found> yp_hat<-fitted(reglog)
Error in eval(expr, envir, enclos): object 'reglog' not found
> data_logistik$yp_hat<-yp_hat
Error in eval(expr, envir, enclos): object 'yp_hat' not found
> data_logistik
Error in eval(expr, envir, enclos): object 'data_logistik' not found
> class<-table(data_logistik$Y,data_logistik$yp_hat>0.5)
Error in eval(expr, envir, enclos): object 'data_logistik' not found
> class
function (x) .Primitive("class")Dari hasil perhitungan VIF 5 variabel prediktor didapatkan hasil seluruhnya mendekati 1, artinya tidak terjadi multikolinearitas antarvariabel prediktor tersebut
Diperoleh nilai G2 sebesar 130.6250160 dengan nilai chi-square sebesar 5.991465. Dari hasil tersebut nilai G2 lebih besar dibandingkan chi-square sehingga dapat disimpulkan minimal terdapat satu variabel yang berpengaruh terhadap keputusan calon pembeli mobil.
Berdasarkan output didapatkan bahwa variabel X1(usia), X2(status), X3(jenis kelamin), dan X5(penghasilan) memiliki p-value kurang dari alpha 0,05 sehingga dapat disimpulkan bahwa variabel-variabel tersebut berpengaruh signifikan terhadap keputusan calon pembeli mobil.
\[ g(x)=ln\frac{(𝜋(x)}{1−𝜋(𝑥)}=-0.133013+0.046208X1-0.540751X2-0.439856X3+0.231612X4-1.421260X5 \]
Usia(X1): apabila usia bertambah 1 tahun maka kecenderungan seseorang calon pembeli untuk membeli mobil meningkat 1.0472917 kali lipat Status(X2): apabila status sudah menikah maka kecenderungan seseorang calon pembeli untuk membeli mobil meningkat 0.5823106 kali lipat Jenis Kelamin(X3): apabila jenis kelamin laki-laki maka kecenderungan seseorang calon pembeli untuk membeli mobil meningkat 0.6441292 kali lipat Memiliki Mobil(X4): tidak signifikan Penghasilan(X4): apabila penghasilan bertambah 1 juta maka kecenderungan seseorang calon pembeli untuk membeli mobil meningkat 0.2414096 kali lipat
Dari 367 amatan dengan Y=0, hanya 127 yang diklasifikan dengan benar Dari 633 amatan dengan Y=1, terdapat 533 diklasifikasikan dengan benar Tingkat akurasi model sebesar 77,3%
Dari perhitungan didapatkan p-value (1.14e-10) kurang dari alpha 0,05 maka dapat disimpulkan bahwa model yang terbentuk kurang layak untuk digunakan
Dari nilai R-Square didapatkan bahwa variabel prediktor dapat menjelaskan 11,25% potensi keputusan seorang calon pembeli mobil sedangkan 88,75% dijelaskan oleh model lain
Dari hasil tersebut model regresi logistik diketahui belum cukup layak untuk menjelaskan hubungan antara keputusan calon pembeli mobil dengan faktor-faktor yang mempengaruhinya.
Ghozi, S., Ramli, R., & Setyani, A. (2018). ANALISIS KEPUTUSAN NASABAH DALAM MEMILIH JENIS BANK: PENERAPAN MODEL REGRESI LOGISTIK BINER (STUDI KASUS PADA BANK BRI CABANG BALIKPAPAN). MEDIA STATISTIKA, 11(1), 17-26. Hosmer Jr, D. W., Lemeshow, S., & Sturdivant, R. X. (2013). Applied logistic regression. John Wiley & Sons. Azizah, I. N., Arum, P. R., & Wasono, R. (2021). Model terbaik uji multikolinearitas untuk analisis faktor-faktor yang mempengaruhi produksi padi di Kabupaten Blora tahun 2020. Sensitifitas Indikator Multikolinearitas dalam Model Regresi Linear Multipel. Statistika, 10(1). Pengujian Asosiasi Tipe Wilayah dengan Kualitas Angkatan Kerja yang Bekerja di Provinsi Bengkulu. Statistika, 18(2), 147-152.