Library:

> # install.packages("knitr")
> # install.packages("rmarkdown")
> # install.packages("prettydoc")
> # install.packages("equatiomatic")

1 PENDAHULUAN

1.1 Latar Belakang

LatarBelakang Dalam proses pembuatan anggur merah, akan dilalui proses harvesting, penghancuran buah, fermentasi, penjernihan, dan penuaan serta pengemasan. Dalam proses fermentasi, sifat alami dalam buah anggur menyebabkan anggur merah difermentasi tanpa penambahan gula, asam, enzim, atau nutrisi lain. Namun ingin diketahui apakah penambahan bahan kimiawi mempengaruhi kualitas anggur merah. Dalam hal ini melihat konsentrasi asam tartarat, klorida, total sulfur dioksida dan persentase alkohol dalam anggur merah.

1.2 Tinjauan Pustaka

1.2.1 ANALISIS REGRESI

Analisis regresi adalah analisis yang bertujuan untuk menjelaskan dan memodelkan hubungan antarvariabel. Terdapat variabel respons atau dependen (Y) dan variabel prediktor atau independen (X). Dalam persamaan regresi hanya terdapat 1 variabel respons, sedangkan untuk variabel prediktor bisa lebih dari 1. Model regresi memiliki fungsi utama sebagai deskripsi data, pemeriksaan parameter, prediksi, dan kontrol.

Regresi linier berganda adalah model regresi yang melibatkan lebih dari satu variabel prediktor untuk mengetahui seberapa besar pengaruh variabel prediktor tersebut terhadap variabel respons.

Persamaan Model Regresi Linier Berganda sebagai berikut; \[ Y = β_0 + β_1 X_1+β_2X_2+...+β_kX_k+ε \]

1.2.2 UJI HIPOTESIS

1.2.2.1 Uji SIMULTAN

Uji Simultan bertujuan untuk menguji apakah variabel prediktor berpengaruh secara keseluruhan atau serentak terhadap variabel respon atau tidak.

Hipotesis:

\(H_0: β_0 = β_1 = β_2 = 0\)

\(H_1:\) terdapat minimal satu \(β_i\) ≠ 0

Keputusan:

  • p-value < α, maka tolak \(H_0\). Dapat disimpulkan bahwa variabel prediktor berpengaruh terhadap variabel respon

  • p-value > α, maka terima \(H_0\). Dapat disimpulkan bahwa variabel prediktor tidak berpengaruh terhadap variabel respon.

1.2.2.2 UJI PARSIAL

Uji parsial bertujuan untuk menguji setiap variabel prediktor terhadap variabel respon. Dengan uji parsial dapat dilihat variabel prediktor yang berpengaruh secara signifikan terhadap variabel respon.

Hipotesis:

\(H_0: β_i = 0\)

\(H_0: β_i ≠ 0\)

Keputusan:

  • p-value < α, maka tolak \(H_0\). Dapat disimpulkan bahwa variabel prediktor berpengaruh terhadap variabel respon.

  • p-value > α, maka terima \(H_0\). Dapat disimpulkan bahwa variabel prediktor tidak berpengaruh terhadap variabel respon.

1.2.3 UJI ASUMSI

1.2.3.1 ASUMSI NORMALITAS

Uji Normalitas bertujuan untuk menguji apakah data berdistribusi normal atau tidak. Uji normalitas dapat dilakukan dengan uji Kolmogorov Smirnov, Shapiro Wilk, Q-Q Plot, dan lain-lain.

Hipotesis:

\(H_0\): residual berdistribusi normal

\(H_1\): residual tidak berdistribusi normal

Keputusan:

  • p-value < α, maka tolak \(H_0\). Dapat disimpulkan bahwa residual tidak berdistribusi normal.

  • p-value > α, maka terima \(H_0\). Dapat disimpulkan bahwa residual berdistribusi normal.

1.2.3.2 ASUMSI NONAUTOKORELASI

Uji Nonautokorelasi adalah uji yang digunakan untuk mengetahui apakah ada hubungan antar residual. Uji Nonautokorelasi bisa menggunakan uji Durbin Watson.

Hipotesis:

\(H_0: ρ = 0\)

\(H_0: ρ ≠ 0\)

Keputusan:

  • p-value < α, maka tolak \(H_0\). Dapat disimpulkan bahwa terdapat hubungan antar residual data atau terjadi autokorelasi pada residual.

  • p-value > α, maka terima \(H_0\). Dapat disimpulkan bahwa tidak terdapat hubungan antar residual data atau tidak terjadi autokorelasi pada residual.

1.2.3.3 ASUMSI NONMULTIKOLINIERITAS

Asumsi Nonmultikolinieritas adalah uji yang digunakan untuk melihat apakah antar variabel prediktor memiliki hubungan yang linier dalam model regresi. Pengujian asumsi nonmultikolinieritas digunakaan saat variabel prediktor lebih dari 1. Asumsi ini bisa dideteksi dengan melihat nilai VIF.

Keputusan:

Jika VIF > 10, maka terjadi multikolinieritas

1.2.3.4 HOMOSKEDASTISITAS

Uji Homoskedastitas adalah uji untuk melihat apakah ragam residual bersifat konstan atau tidak. Jika ragam dari data tidak konstan maka akan menyebabkan ragam residual meningkat dan analisi menjadi tidak efisien. Uji Homoskedastisitas bisa menggunakan Korelasi Rank Spearman atau dengan menggunakan grafik.

Hipotesis:

\(H_0: δ_2 = δ_3 = 0\)

\(H_0: Setidaknya ada satu δ_i ≠ 0\)

Keputusan:

  • p-value < α, maka tolak \(H_0\). Dapat disimpulkan bahwa ragam residual tidak bersifat homokedasitas.

  • p-value > α, maka terima \(H_0\). Dapat disimpulkan bahwa ragam residual bersifat homokedasitas.

1.3 Data

Data yang digunakan diambil dari website kaggle.com, dengan judul Wine Quality Dataset. Untuk variabel prediktor pada data tersebut sebenarnya ada 11 dengan total 1143 data. Namun dalam pengujian ini, hanya diambil 200 sampel data acak dengan 4 variabel prediktor yaitu variabel konsentrasi asam tartarat, konsentrasi klorida, total sulfur dioksida, dan persentase alkohol. Data dapat diakses pada https://www.kaggle.com/datasets/yasserh/wine-quality-dataset/data

1.4 Tujuan

Tujuan dari analisis ini adalah mengetahui hubungan antara konsentrasi asam tartarat, konsentrasi klorida, total sulfur dioksida dan persentase alkohol dengan kualitas anggur merah.

2 SOURCE CODE

2.1 Library

> library(readr)
> library(ggplot2)
> library(lmtest)

2.2 Impor Data

> library(readr)
> data <- read.csv('C:/Users/Dell/Documents/tgs/KOMSTAT/WineQT (1).csv')
Error in file(file, "rt"): cannot open the connection
> head(data)
                                                                            
1 function (..., list = character(), package = NULL, lib.loc = NULL,        
2     verbose = getOption("verbose"), envir = .GlobalEnv, overwrite = TRUE) 
3 {                                                                         
4     fileExt <- function(x) {                                              
5         db <- grepl("\\\\.[^.]+\\\\.(gz|bz2|xz)$", x)                     
6         ans <- sub(".*\\\\.", "", x)                                      

2.3 STATISTIKA DESKRIPTIF

> summary(data)
Error in object[[i]]: object of type 'closure' is not subsettable
> library(ggplot2)
> plot(data$fixed.acidity, data$quality,
+      col = "pink", xlab = "Konsentrasi Asam Tartarat", ylab = "Kualitas Anggur Merah", pch = 10)
Error in data$fixed.acidity: object of type 'closure' is not subsettable
> plot(data$chlorides, data$quality,
+      col = "pink", xlab = "Konsentrasi Klorida", ylab = "Kualitas Anggur Merah", pch = 10)
Error in data$chlorides: object of type 'closure' is not subsettable
> plot(data$total.sulfur.dioxide, data$quality,
+      col = "pink", xlab = "Total Sulfur Dioksida", ylab = "Kualitas Anggur Merah", pch = 10)
Error in data$total.sulfur.dioxide: object of type 'closure' is not subsettable
> plot(data$alcohol, data$quality,
+      col = "pink", xlab = "Persentase Alkohol", ylab = "Kualitas Anggur Merah", pch = 10)
Error in data$alcohol: object of type 'closure' is not subsettable

Jika plot membentuk suatu pola garis lurus, diasumsikan bahwa variabel-variabel X memiliki hubungan dengan variabel Y

2.4 REGRESI LINIER BERGANDA

2.4.1 ANALISIS REGRESI

> regmod = lm(quality~fixed.acidity+chlorides+total.sulfur.dioxide+alcohol, data = data)
Error in model.frame.default(formula = quality ~ fixed.acidity + chlorides + : 'data' must be a data.frame, environment, or list
> regmod$coefficients
Error in eval(expr, envir, enclos): object 'regmod' not found

2.5 UJI HIPOTESIS

2.5.1 UJI SIMULTAN

> anova(regmod)
Error in eval(expr, envir, enclos): object 'regmod' not found

2.5.2 UJI PARSIAL

> summary(regmod)
Error in eval(expr, envir, enclos): object 'regmod' not found

2.6 UJI ASUMSI

2.6.1 ASUMSI NORMALITAS

> residual = residuals(regmod)
Error in eval(expr, envir, enclos): object 'regmod' not found
> residual
Error in eval(expr, envir, enclos): object 'residual' not found
> shapiro.test(residual)
Error in eval(expr, envir, enclos): object 'residual' not found

2.6.2 ASUMSI NONAUTOKORELASI

> library(lmtest)
> dwtest(regmod)
Error in eval(expr, envir, enclos): object 'regmod' not found

2.6.3 ASUMSI NONMULTIKOLINIERITAS

> car::vif(regmod)
Error in eval(expr, envir, enclos): object 'regmod' not found

2.6.4 HOMOSKEDASTISITAS

> library(lmtest)
> bptest(regmod)
Error in eval(expr, envir, enclos): object 'regmod' not found

3 HASIL DAN PEMBAHASAN

3.1 Statistika Deskriptif

Berdasarkan Data yang digunakan, untuk Konsentrasi Asam Tartarat paling tinggi yang digunakan adalah sebesar 15.6 gram/liter, sedangkan Konsentrasi Asam Tartarat paling rendah yang digunakan adalah sebesar 5 gram/liter, dan berkisar pada 9.828 gram/liter. Untuk Konsentrasi Klorida paling tinggi yaitu sebesar 0.358 gram/liter, sedangkan paling rendah sebesar 0.045 gram/liter, dan berkisar pada 0.0878 gram/liter. Kemudian untuk Total Sulfur Dioksida yang paling tinggi digunakan sebesar 165 mg/liter, sedangkan yang paling rendah yaitu sebesar 10 mg/liter, dan berkisar pada 44.4 mg/liter. Persentase Alkohol tertinggi yaitu 14%, sedangkan yang terendah 8.4% dan berkisar pada 10.47%. Kualitas Anggur Merah diukur dengan skor antara 0-10, dimana nilai tertinggi yaitu 8, sedangkan terendah 3 dan berkisar dari skor 5-6.

3.2 REGRESI LINIER BERGANDA

3.2.1 ANALISIS REGRESI

Dari pemodelan analisi regresi yang didapatkan bahwa rata-rata kualitas anggur merah ketika tidak ada pengaruh konsentrasi asam tartarat, klorida, total sulfur dioksida dan alkohol adalah 2.25624. Dan akan berkurang setiap bertambahnya 1 satuan konsentrasi asam tartarat sebesar 0.01224. Akan bertambah setiap kenaikan 1 satuan konsentrasi klorida sebesar 1.20444.Berkuran setiap bertambahnya 1 satuan total sulfur dioksida sebesar 0.00543, dan bertambah setiap kenaikan 1 persentase alkohol sebesar 0.36522. Model Regresi Linier Berganda yang didapatkan sebagai beriku: \[ Y = 2.25624- 0.01224 X_1 + 1.20444 X_2 - 0.00543 X_3 + 0.36522 X_4 \] ## Uji Hipotesis ###Uji Simultan Dari uji simultan yang telah dilakukan didapatkan p-value dari masing-masing variabel konsentrasi asam tartarat dan klorida adalah 0.4633 dan 0.7084, dari hasil tersebut p-value lebih besar daripada α. Sedangkan untuk p-value masing-masing variabel total sulfur dioksida dan alkohol adalah 6.037e-05 dan 2.717e-13 dari hasil tersebut p-value lebih kecil daripada α. Oleh karena itu, akan dilanjutkan dengan uji parsial dan uji asumsi untuk mengambil kesimpulan.

###Uji Parsial Dari uji parsial didapatkan p-value dari masing masing β masing-masing sebesar 0.000391, 0.635788, 0.452009, 0.003459, dan 2.72e-13. Dapat dilihat bahwa p-value dari β lebih kecil dari pada α adalah intersep, total sulfur dioksida, dan alkohol. Oleh karena itu dapat disimpulkan bahwa \(β_0\), \(β_3\), dan \(β_4\) berpengaruh secara parsial terhadap variabel respon dan model yang telah didapatkan bisa digunakan untuk memprediksi nilai variabel respon berikutnya.

3.3 Uji Asumsi

3.3.1 ASUMSI NORMALITAS

Dari uji asumsi normalitas dengan menggunakan Shapiro-Wilk test didapatkan p-value 0.8702. Didapatkan p-value lebih besar dar α, maka terima \(H_0\). Jadi dapat disimpulkan bahwa residual dari data berdistribusi normal.

3.3.2 ASUMSI NONAUTOKORELASI

Untuk menguji asumsi autokorelasi digunakan Durbin-Watson test, dengan Durbin_watson test didapatkan p-value 0.2436. Didapatkan p-value lebih besar dari α, maka terima \(H_0\). Jadi dapat disimpulkan bahwa tidak terjadi autokorelasi.

3.3.3 ASUMSI NONMULTIKOLINIERITAS

Aumsi nonmultikolinieritas dapat dilihat dengan melihat besar VIF. didapatkan seluruh VIF dari masing-masing variabel prediktor 1.1473, 1.0517, 1.1783, dan 1.0531. Oleh karena itu, VIF<10 maka tidak terjadi multikolinieritas antar variabel prediktor.

3.3.4 ASUMSI HOMOSKEDASTISITAS

Untuk menguji asumsi homoskedastisitas digunakan Breusch-Pagan test. Didapatkan p-value, 0.01007 lebih kecil daripada α,maka tolak \(H_0\). Jadi dapat disimpulkan bahwa ragam dari residual tidak konstan atau asumsi homoskedasitisitas tidak terpenuhi.

4 KESIMPULAN

Setelah melakukan Analisis Regresi Linear Berganda untuk Mengetahui Pengaruh Konsentrasi Asam Tartarat, Klorida, Sulfur Dioksida dan Alkohol Terhadap Kualitas Anggur Merah, dapat disimpulkan bahwa tidak semua variabel dalam pengujian mempengaruhi Kualitas Anggur Merah. Variabel yang mempengaruhi adalah Total Sulfur Dioksida, dan Persentase Alkohol.

5 DAFTAR PUSTAKA

Ovihapsany, R. A., Mustofa A., Suhartatik, N.(2019). Karakteristik Minuman Beralkohol dengan Variasi Kadar Ekstrak Buah Bit (Beta vulgaris L.) dan Lama Fermentasi

Khasanah, U. (2021). Analisis Regresi

Kompasiana. (2024, Juni 03). Mengenal Proses Pembuatan Wine Mulai dari Anggur hingga Menjadi Wine. Diakses dari https://www.kompasiana.com/rionaldowiratma8386/605200a88ede482e254591d2/mengenal-prose-pembuatan-wine-mulai-dari-anggur-hingga-menjadi-wine