STUDI KASUS ANALISIS DATA

Data 1

Masalah

Sebuah penelitian dilakukan untuk mengevaluasi kualitas sensorik suatu produk pangan berdasarkan dua faktor utama, yaitu:

Perlakuan (Treatment): terdiri dari 3 jenis (A, B, C, dan D)
Waktu Penyimpanan (Time): terdiri dari 2 level (H7 dan H14)

Setiap kombinasi perlakuan dan waktu diuji sebanyak 3 kali ulangan (replikasi). Penilaian kualitas produk dilakukan berdasarkan 4 parameter sensorik:

Warna
Aroma
Rasa
Tekstur

Skala penilaian menggunakan rentang numerik (semakin tinggi nilai menunjukkan kualitas semakin baik). Tentukan:

Apakah terdapat pengaruh signifikan dari Perlakuan?
Apakah terdapat pengaruh signifikan dari Waktu?
Apakah terdapat interaksi antara Perlakuan dan Waktu?

Penyelesaian

#Package yang digunakan
library(readxl)
library(car)
library(MASS)

#Input Data
data_1 <- read_xlsx("C:/Users/dals/OneDrive - untirta.ac.id/KULIAH/Sem 6/Konstat/Data/Data Studi Kasus.xlsx", sheet = "Data 1")
head(data_1, 10)

#Mengubah Variabel Menjadi Faktor
data_1$Perlakuan <- as.factor(data_1$Perlakuan)
data_1$Waktu <- as.factor(data_1$Waktu)

#Eksplorasi Data
str(data_1)

## tibble [24 × 6] (S3: tbl_df/tbl/data.frame)
##  $ Perlakuan: Factor w/ 4 levels "A","B","C","D": 1 1 1 1 1 1 2 2 2 2 ...
##  $ Waktu    : Factor w/ 2 levels "H14","H7": 2 2 2 1 1 1 2 2 2 1 ...
##  $ Warna    : num [1:24] 2.67 2.69 2.62 2.69 2.67 2.76 2.69 2.71 2.96 2.84 ...
##  $ Aroma    : num [1:24] 2.58 2.71 2.71 2.78 2.64 2.87 2.71 2.78 2.91 2.78 ...
##  $ Rasa     : num [1:24] 2.76 2.73 2.62 2.93 2.58 2.73 2.69 2.78 2.69 3.04 ...
##  $ Tekstur  : num [1:24] 2.56 2.84 2.8 2.76 2.4 2.51 2.78 2.64 2.93 2.98 ...

summary(data_1)

##  Perlakuan Waktu        Warna           Aroma            Rasa      
##  A:6       H14:12   Min.   :2.620   Min.   :2.580   Min.   :2.580  
##  B:6       H7 :12   1st Qu.:2.705   1st Qu.:2.763   1st Qu.:2.730  
##  C:6                Median :2.925   Median :2.945   Median :3.065  
##  D:6                Mean   :3.015   Mean   :3.031   Mean   :3.033  
##                     3rd Qu.:3.248   3rd Qu.:3.295   3rd Qu.:3.290  
##                     Max.   :3.690   Max.   :3.670   Max.   :3.640  
##     Tekstur     
##  Min.   :2.400  
##  1st Qu.:2.775  
##  Median :3.065  
##  Mean   :3.051  
##  3rd Qu.:3.315  
##  Max.   :3.710

boxplot(Warna ~ Perlakuan*Waktu, data = data_1,
        main = "Boxplot Warna")

boxplot(Aroma ~ Perlakuan*Waktu, data = data_1,
        main = "Boxplot Aroma")

boxplot(Rasa ~ Perlakuan*Waktu, data = data_1,
        main = "Boxplot Rasa")

boxplot(Tekstur ~ Perlakuan*Waktu, data = data_1,
        main = "Boxplot Tekstur")

#Model Anova
model_warna <- aov(Warna ~ Perlakuan*Waktu, data = data_1)
model_aroma <- aov(Aroma ~ Perlakuan*Waktu, data = data_1)
model_rasa <- aov(Rasa ~ Perlakuan*Waktu, data = data_1)
model_tekstur <- aov(Tekstur ~ Perlakuan*Waktu, data = data_1)

#Uji Asumsi Variabel Warna
plot(model_warna, 2)

shapiro.test(residuals(model_warna))

## 
##  Shapiro-Wilk normality test
## 
## data:  residuals(model_warna)
## W = 0.86843, p-value = 0.004902

leveneTest(Warna ~ Perlakuan*Waktu, data = data_1)

Interpretasi:

Plot Berdasarkan grafik Q-Q plot residual, terlihat bahwa sebagian besar titik berada di sekitar garis diagonal, yang menunjukkan bahwa distribusi residual mendekati distribusi normal. Namun, terdapat beberapa titik yang menyimpang cukup jauh dari garis, terutama pada bagian ekor (ujung kiri dan kanan), yang mengindikasikan adanya penyimpangan dari normalitas serta kemungkinan adanya outlier. Oleh karena itu, dapat disimpulkan bahwa asumsi normalitas tidak sepenuhnya terpenuhi, meskipun secara umum pola distribusi residual masih mendekati normal.
Shapiro Wilk Berdasarkan hasil uji normalitas menggunakan Shapiro-Wilk terhadap residual model, diperoleh nilai p-value sebesar 0.004902 yang lebih kecil dari taraf signifikansi 0.05. Hal ini menunjukkan bahwa residual tidak berdistribusi normal, sehingga asumsi normalitas pada model ANOVA belum terpenuhi. Hasil ini juga dapat didukung oleh visualisasi plot normal Q-Q yang menunjukkan adanya penyimpangan titik-titik dari garis diagonal.
Levene Test Berdasarkan uji homogenitas varians menggunakan uji Levene, diperoleh nilai p-value sebesar 0.2315 (>0.05). Hal ini menunjukkan bahwa varians antar kelompok adalah homogen, sehingga asumsi homogenitas varians telah terpenuhi. Dengan demikian, meskipun asumsi normalitas tidak terpenuhi, asumsi homogenitas varians sudah dipenuhi sehingga analisis ANOVA masih dapat dipertimbangkan untuk dilanjutkan dengan catatan tertentu.

#Uji Asumsi Variabel Aroma
plot(model_aroma, 2)

shapiro.test(residuals(model_aroma))

## 
##  Shapiro-Wilk normality test
## 
## data:  residuals(model_aroma)
## W = 0.96479, p-value = 0.5418

leveneTest(Aroma ~ Perlakuan*Waktu, data = data_1)

Interpretasi:

Plot Berdasarkan grafik Q-Q plot residual, terlihat bahwa sebagian besar titik berada di sekitar garis diagonal, yang menunjukkan bahwa distribusi residual mendekati distribusi normal. Meskipun terdapat beberapa titik yang sedikit menyimpang, khususnya pada bagian ekor, penyimpangan tersebut tidak terlalu signifikan. Oleh karena itu, dapat disimpulkan bahwa asumsi normalitas pada variabel aroma secara umum telah terpenuhi.
`Shapiro Wilk` Berdasarkan hasil uji normalitas Berdasarkan hasil uji normalitas menggunakan Shapiro-Wilk, diperoleh nilai p-value sebesar 0.5418 yang lebih besar dari 0.05. Hal ini menunjukkan bahwa residual berdistribusi normal, sehingga asumsi normalitas telah terpenuhi.
Levene Test Berdasarkan uji homogenitas varians menggunakan Levene Test, diperoleh nilai p-value sebesar 0.7644 (> 0.05). Hal ini menunjukkan bahwa varians antar kelompok adalah homogen, sehingga asumsi homogenitas varians telah terpenuhi.

#Uji Asumsi Variabel Rasa
plot(model_rasa, 2)

shapiro.test(residuals(model_rasa))

## 
##  Shapiro-Wilk normality test
## 
## data:  residuals(model_rasa)
## W = 0.95572, p-value = 0.3586

leveneTest(Rasa ~ Perlakuan*Waktu, data = data_1)

Interpretasi:

Plot Berdasarkan grafik Q-Q plot residual, terlihat bahwa sebagian besar titik mengikuti garis diagonal, yang mengindikasikan bahwa distribusi residual mendekati distribusi normal. Namun, terdapat beberapa titik yang menyimpang pada bagian ekor, terutama di sisi kiri dan kanan, yang menunjukkan adanya sedikit deviasi dari normalitas. Meskipun demikian, secara keseluruhan pola masih cukup mengikuti garis diagonal, sehingga asumsi normalitas dapat dianggap terpenuhi.
Shapiro Wilk Berdasarkan hasil uji normalitas berdasarkan hasil uji normalitas, diperoleh nilai p-value sebesar 0.3586 yang lebih besar dari 0.05, sehingga dapat disimpulkan bahwa residual berdistribusi normal.
Levene Test Berdasarkan uji homogenitas berdasarkan hasil uji homogenitas varians, diperoleh nilai p-value sebesar 0.6129 (>0.05), yang menunjukkan bahwa varians antar kelompok homogen.

#Uji Asumsi Variabel Tekstur
plot(model_tekstur, 2)

shapiro.test(residuals(model_tekstur))

## 
##  Shapiro-Wilk normality test
## 
## data:  residuals(model_tekstur)
## W = 0.97694, p-value = 0.8335

leveneTest(Tekstur ~ Perlakuan*Waktu, data = data_1)

Interpretasi:

Plot Berdasarkan grafik Q-Q plot residual, terlihat bahwa titik-titik residual hampir seluruhnya berada di sekitar garis diagonal dan mengikuti pola garis tersebut dengan baik. Penyimpangan yang terjadi relatif kecil dan tidak signifikan. Hal ini menunjukkan bahwa distribusi residual sangat mendekati distribusi normal, sehingga asumsi normalitas pada variabel tekstur telah terpenuhi dengan baik.
Shapiro Wilk Berdasarkan hasil uji normalitas berdasarkan hasil uji normalitas, diperoleh nilai p-value sebesar 0.8335 yang lebih besar dari 0.05, yang menunjukkan bahwa residual berdistribusi normal.
Levene Test Berdasarkan uji homogenitas berdasarkan hasil uji homogenitas varians, diperoleh nilai p-value sebesar 0.8741 (>0.05), yang menunjukkan bahwa varians antar kelompok homogen.

#Transformasi Variabel Warna
boxcox(model_warna)

data_1$Warna_bc <- 1 / sqrt(data_1$Warna)
model_warna2 <- aov(Warna_bc ~ Perlakuan*Waktu, data = data_1)

shapiro.test(residuals(model_warna2))

## 
##  Shapiro-Wilk normality test
## 
## data:  residuals(model_warna2)
## W = 0.89727, p-value = 0.01885

Interpretasi:

Berdasarkan hasil transformasi data menggunakan metode Box-Cox, diperoleh nilai parameter \(\lambda\) yang mengarah pada transformasi \(\frac{1}{\sqrt x}\). Setelah dilakukan transformasi dan pengujian ulang normalitas menggunakan uji Shapiro-Wilk, diperoleh nilai p-value sebesar 0.01885 yang masih lebih kecil dari taraf signifikansi 0.05. Hal ini menunjukkan bahwa residual model setelah transformasi masih belum berdistribusi normal, sehingga asumsi normalitas belum sepenuhnya terpenuhi. Meskipun demikian, terjadi peningkatan nilai p-value dibandingkan sebelum transformasi, yang mengindikasikan adanya perbaikan terhadap distribusi residual.

#Analisis ANOVA TWO WAY
summary(model_warna)

##                 Df Sum Sq Mean Sq F value   Pr(>F)    
## Perlakuan        3 1.9578  0.6526  23.071 4.71e-06 ***
## Waktu            1 0.0852  0.0852   3.012    0.102    
## Perlakuan:Waktu  3 0.0545  0.0182   0.643    0.599    
## Residuals       16 0.4526  0.0283                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

summary(model_warna2)

##                 Df   Sum Sq  Mean Sq F value   Pr(>F)    
## Perlakuan        3 0.017582 0.005861  27.349 1.55e-06 ***
## Waktu            1 0.000585 0.000585   2.728    0.118    
## Perlakuan:Waktu  3 0.000297 0.000099   0.462    0.713    
## Residuals       16 0.003429 0.000214                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

summary(model_aroma)

##                 Df Sum Sq Mean Sq F value   Pr(>F)    
## Perlakuan        3 1.9388  0.6463  16.838 3.32e-05 ***
## Waktu            1 0.0400  0.0400   1.043    0.322    
## Perlakuan:Waktu  3 0.0126  0.0042   0.109    0.953    
## Residuals       16 0.6141  0.0384                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

summary(model_rasa)

##                 Df Sum Sq Mean Sq F value   Pr(>F)    
## Perlakuan        3 1.7342  0.5781  19.532 1.35e-05 ***
## Waktu            1 0.0840  0.0840   2.839    0.111    
## Perlakuan:Waktu  3 0.0258  0.0086   0.290    0.832    
## Residuals       16 0.4735  0.0296                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

summary(model_tekstur)

##                 Df Sum Sq Mean Sq F value Pr(>F)    
## Perlakuan        3 2.3145  0.7715  20.831  9e-06 ***
## Waktu            1 0.0353  0.0353   0.952  0.344    
## Perlakuan:Waktu  3 0.1548  0.0516   1.393  0.281    
## Residuals       16 0.5926  0.0370                   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Interpretasi:

Apakah terdapat pengaruh signifikan dari Perlakuan?

Berdasarkan hasil analisis ANOVA dua arah, diperoleh bahwa faktor Perlakuan memiliki nilai p-value yang sangat kecil (p-value < 0,05) pada seluruh parameter sensorik, yaitu warna (p = 4.71e-06 dan 1.55e-06 setelah transformasi), aroma (p = 3.32e-05), rasa (p = 1.35e-05), dan tekstur (p = 9e-06). Hal ini menunjukkan bahwa terdapat pengaruh yang signifikan dari perlakuan terhadap kualitas produk pangan pada semua aspek yang diuji. Dengan demikian, dapat disimpulkan bahwa perbedaan jenis perlakuan (A, B, C, dan D) memberikan dampak nyata terhadap penilaian sensorik produk, di mana setiap perlakuan menghasilkan kualitas yang berbeda.

Apakah terdapat pengaruh signifikan dari Waktu?

Berdasarkan hasil ANOVA, faktor Waktu penyimpanan menunjukkan nilai p-value yang lebih besar dari 0,05 pada seluruh parameter, yaitu warna (p = 0.102 dan 0.118 setelah transformasi), aroma (p = 0.322), rasa (p = 0.111), dan tekstur (p = 0.344). Hal ini menunjukkan bahwa tidak terdapat pengaruh signifikan dari waktu penyimpanan terhadap kualitas produk. Dengan kata lain, perbedaan waktu penyimpanan antara H7 dan H14 tidak memberikan perubahan yang signifikan terhadap kualitas sensorik produk berdasarkan keempat parameter yang diuji.

Apakah terdapat interaksi antara Perlakuan dan Waktu?

Hasil analisis juga menunjukkan bahwa interaksi antara Perlakuan dan Waktu memiliki nilai p-value yang lebih besar dari 0,05 pada semua parameter, yaitu warna (p = 0.599 dan 0.713), aroma (p = 0.953), rasa (p = 0.832), dan tekstur (p = 0.281). Hal ini menunjukkan bahwa tidak terdapat interaksi yang signifikan antara perlakuan dan waktu penyimpanan terhadap kualitas produk. Dengan demikian, pengaruh perlakuan terhadap kualitas produk tidak bergantung pada waktu penyimpanan, begitu pula sebaliknya.

Secara keseluruhan, dapat disimpulkan bahwa faktor yang paling berpengaruh terhadap kualitas sensorik produk pangan adalah perlakuan, sedangkan faktor waktu penyimpanan dan interaksi antara perlakuan dan waktu tidak memberikan pengaruh yang signifikan. Hal ini menunjukkan bahwa kualitas produk lebih ditentukan oleh jenis perlakuan dibandingkan lamanya waktu penyimpanan dalam rentang yang diuji.

#Uji Lanjut
TukeyHSD(model_warna)

##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = Warna ~ Perlakuan * Waktu, data = data_1)
## 
## $Perlakuan
##          diff        lwr       upr     p adj
## B-A 0.1083333 -0.1694828 0.3861495 0.6854623
## C-A 0.5266667  0.2488505 0.8044828 0.0002970
## D-A 0.6900000  0.4121838 0.9678162 0.0000136
## C-B 0.4183333  0.1405172 0.6961495 0.0027373
## D-B 0.5816667  0.3038505 0.8594828 0.0001009
## D-C 0.1633333 -0.1144828 0.4411495 0.3644715
## 
## $Waktu
##              diff        lwr        upr     p adj
## H7-H14 -0.1191667 -0.2647253 0.02639201 0.1018615
## 
## $`Perlakuan:Waktu`
##                    diff         lwr         upr     p adj
## B:H14-A:H14  0.09000000 -0.38544208  0.56544208 0.9971723
## C:H14-A:H14  0.59000000  0.11455792  1.06544208 0.0100463
## D:H14-A:H14  0.79000000  0.31455792  1.26544208 0.0006113
## A:H7-A:H14  -0.04666667 -0.52210875  0.42877542 0.9999610
## B:H7-A:H14   0.08000000 -0.39544208  0.55544208 0.9986462
## C:H7-A:H14   0.41666667 -0.05877542  0.89210875 0.1089870
## D:H7-A:H14   0.54333333  0.06789125  1.01877542 0.0194561
## C:H14-B:H14  0.50000000  0.02455792  0.97544208 0.0356729
## D:H14-B:H14  0.70000000  0.22455792  1.17544208 0.0021192
## A:H7-B:H14  -0.13666667 -0.61210875  0.33877542 0.9686069
## B:H7-B:H14  -0.01000000 -0.48544208  0.46544208 1.0000000
## C:H7-B:H14   0.32666667 -0.14877542  0.80210875 0.3134991
## D:H7-B:H14   0.45333333 -0.02210875  0.92877542 0.0674032
## D:H14-C:H14  0.20000000 -0.27544208  0.67544208 0.8184975
## A:H7-C:H14  -0.63666667 -1.11210875 -0.16122458 0.0051783
## B:H7-C:H14  -0.51000000 -0.98544208 -0.03455792 0.0310467
## C:H7-C:H14  -0.17333333 -0.64877542  0.30210875 0.8999836
## D:H7-C:H14  -0.04666667 -0.52210875  0.42877542 0.9999610
## A:H7-D:H14  -0.83666667 -1.31210875 -0.36122458 0.0003262
## B:H7-D:H14  -0.71000000 -1.18544208 -0.23455792 0.0018425
## C:H7-D:H14  -0.37333333 -0.84877542  0.10210875 0.1861504
## D:H7-D:H14  -0.24666667 -0.72210875  0.22877542 0.6310042
## B:H7-A:H7    0.12666667 -0.34877542  0.60210875 0.9791194
## C:H7-A:H7    0.46333333 -0.01210875  0.93877542 0.0589276
## D:H7-A:H7    0.59000000  0.11455792  1.06544208 0.0100463
## C:H7-B:H7    0.33666667 -0.13877542  0.81210875 0.2820001
## D:H7-B:H7    0.46333333 -0.01210875  0.93877542 0.0589276
## D:H7-C:H7    0.12666667 -0.34877542  0.60210875 0.9791194

TukeyHSD(model_aroma)

##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = Aroma ~ Perlakuan * Waktu, data = data_1)
## 
## $Perlakuan
##          diff         lwr       upr     p adj
## B-A 0.0900000 -0.23361719 0.4136172 0.8553683
## C-A 0.4733333  0.14971614 0.7969505 0.0035180
## D-A 0.7000000  0.37638281 1.0236172 0.0000698
## C-B 0.3833333  0.05971614 0.7069505 0.0176851
## D-B 0.6100000  0.28638281 0.9336172 0.0003153
## D-C 0.2266667 -0.09695052 0.5502839 0.2274506
## 
## $Waktu
##               diff        lwr        upr     p adj
## H7-H14 -0.08166667 -0.2512223 0.08788895 0.3224198
## 
## $`Perlakuan:Waktu`
##                    diff          lwr          upr     p adj
## B:H14-A:H14  0.04666667 -0.507157218  0.600490551 0.9999862
## C:H14-A:H14  0.46666667 -0.087157218  1.020490551 0.1335141
## D:H14-A:H14  0.72000000  0.166176116  1.273823884 0.0067397
## A:H7-A:H14  -0.09666667 -0.650490551  0.457157218 0.9982941
## B:H7-A:H14   0.03666667 -0.517157218  0.590490551 0.9999974
## C:H7-A:H14   0.38333333 -0.170490551  0.937157218 0.3056843
## D:H7-A:H14   0.58333333  0.029509449  1.137157218 0.0352918
## C:H14-B:H14  0.42000000 -0.133823884  0.973823884 0.2160996
## D:H14-B:H14  0.67333333  0.119509449  1.227157218 0.0119060
## A:H7-B:H14  -0.14333333 -0.697157218  0.410490551 0.9822003
## B:H7-B:H14  -0.01000000 -0.563823884  0.543823884 1.0000000
## C:H7-B:H14   0.33666667 -0.217157218  0.890490551 0.4514648
## D:H7-B:H14   0.53666667 -0.017157218  1.090490551 0.0610467
## D:H14-C:H14  0.25333333 -0.300490551  0.807157218 0.7530354
## A:H7-C:H14  -0.56333333 -1.117157218 -0.009509449 0.0447189
## B:H7-C:H14  -0.43000000 -0.983823884  0.123823884 0.1955816
## C:H7-C:H14  -0.08333333 -0.637157218  0.470490551 0.9993379
## D:H7-C:H14   0.11666667 -0.437157218  0.670490551 0.9945823
## A:H7-D:H14  -0.81666667 -1.370490551 -0.262842782 0.0020872
## B:H7-D:H14  -0.68333333 -1.237157218 -0.129509449 0.0105400
## C:H7-D:H14  -0.33666667 -0.890490551  0.217157218 0.4514648
## D:H7-D:H14  -0.13666667 -0.690490551  0.417157218 0.9863692
## B:H7-A:H7    0.13333333 -0.420490551  0.687157218 0.9881554
## C:H7-A:H7    0.48000000 -0.073823884  1.033823884 0.1155764
## D:H7-A:H7    0.68000000  0.126176116  1.233823884 0.0109771
## C:H7-B:H7    0.34666667 -0.207157218  0.900490551 0.4175588
## D:H7-B:H7    0.54666667 -0.007157218  1.100490551 0.0543578
## D:H7-C:H7    0.20000000 -0.353823884  0.753823884 0.9041441

TukeyHSD(model_rasa)

##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = Rasa ~ Perlakuan * Waktu, data = data_1)
## 
## $Perlakuan
##          diff        lwr       upr     p adj
## B-A 0.0900000 -0.1941682 0.3741682 0.8018426
## C-A 0.5100000  0.2258318 0.7941682 0.0005224
## D-A 0.6333333  0.3491651 0.9175016 0.0000495
## C-B 0.4200000  0.1358318 0.7041682 0.0032172
## D-B 0.5433333  0.2591651 0.8275016 0.0002714
## D-C 0.1233333 -0.1608349 0.4075016 0.6107115
## 
## $Waktu
##              diff        lwr        upr     p adj
## H7-H14 -0.1183333 -0.2672201 0.03055344 0.1114149
## 
## $`Perlakuan:Waktu`
##                     diff          lwr        upr     p adj
## B:H14-A:H14  0.163333333 -0.322979381  0.6496460 0.9314643
## C:H14-A:H14  0.576666667  0.090353953  1.0629794 0.0145738
## D:H14-A:H14  0.643333333  0.157020619  1.1296460 0.0057772
## A:H7-A:H14  -0.043333333 -0.529646047  0.4429794 0.9999798
## B:H7-A:H14  -0.026666667 -0.512979381  0.4596460 0.9999993
## C:H7-A:H14   0.400000000 -0.086312714  0.8863127 0.1502989
## D:H7-A:H14   0.580000000  0.093687286  1.0663127 0.0139163
## C:H14-B:H14  0.413333333 -0.072979381  0.8996460 0.1278296
## D:H14-B:H14  0.480000000 -0.006312714  0.9663127 0.0543780
## A:H7-B:H14  -0.206666667 -0.692979381  0.2796460 0.8112589
## B:H7-B:H14  -0.190000000 -0.676312714  0.2963127 0.8651620
## C:H7-B:H14   0.236666667 -0.249646047  0.7229794 0.6962619
## D:H7-B:H14   0.416666667 -0.069646047  0.9029794 0.1226899
## D:H14-C:H14  0.066666667 -0.419646047  0.5529794 0.9996387
## A:H7-C:H14  -0.620000000 -1.106312714 -0.1336873 0.0079876
## B:H7-C:H14  -0.603333333 -1.089646047 -0.1170206 0.0100682
## C:H7-C:H14  -0.176666667 -0.662979381  0.3096460 0.9015587
## D:H7-C:H14   0.003333333 -0.482979381  0.4896460 1.0000000
## A:H7-D:H14  -0.686666667 -1.172979381 -0.2003540 0.0031717
## B:H7-D:H14  -0.670000000 -1.156312714 -0.1836873 0.0039926
## C:H7-D:H14  -0.243333333 -0.729646047  0.2429794 0.6686854
## D:H7-D:H14  -0.063333333 -0.549646047  0.4229794 0.9997421
## B:H7-A:H7    0.016666667 -0.469646047  0.5029794 1.0000000
## C:H7-A:H7    0.443333333 -0.042979381  0.9296460 0.0877274
## D:H7-A:H7    0.623333333  0.137020619  1.1096460 0.0076262
## C:H7-B:H7    0.426666667 -0.059646047  0.9129794 0.1083432
## D:H7-B:H7    0.606666667  0.120353953  1.0929794 0.0096128
## D:H7-C:H7    0.180000000 -0.306312714  0.6663127 0.8930576

TukeyHSD(model_tekstur)

##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = Tekstur ~ Perlakuan * Waktu, data = data_1)
## 
## $Perlakuan
##           diff        lwr       upr     p adj
## B-A  0.2133333 -0.1045597 0.5312264 0.2588962
## C-A  0.7550000  0.4371069 1.0728931 0.0000233
## D-A  0.6550000  0.3371069 0.9728931 0.0001207
## C-B  0.5416667  0.2237736 0.8595597 0.0008740
## D-B  0.4416667  0.1237736 0.7595597 0.0053908
## D-C -0.1000000 -0.4178931 0.2178931 0.8049873
## 
## $Waktu
##               diff        lwr        upr     p adj
## H7-H14 -0.07666667 -0.2432232 0.08988986 0.3436867
## 
## $`Perlakuan:Waktu`
##                     diff         lwr        upr     p adj
## B:H14-A:H14  0.376666667 -0.16736123  0.9206946 0.3053655
## C:H14-A:H14  0.880000000  0.33597210  1.4240279 0.0008135
## D:H14-A:H14  0.873333333  0.32930544  1.4173612 0.0008812
## A:H7-A:H14   0.176666667 -0.36736123  0.7206946 0.9417258
## B:H7-A:H14   0.226666667 -0.31736123  0.7706946 0.8251348
## C:H7-A:H14   0.806666667  0.26263877  1.3506946 0.0019767
## D:H7-A:H14   0.613333333  0.06930544  1.1573612 0.0215700
## C:H14-B:H14  0.503333333 -0.04069456  1.0473612 0.0805945
## D:H14-B:H14  0.496666667 -0.04736123  1.0406946 0.0870087
## A:H7-B:H14  -0.200000000 -0.74402790  0.3440279 0.8962102
## B:H7-B:H14  -0.150000000 -0.69402790  0.3940279 0.9748471
## C:H7-B:H14   0.430000000 -0.11402790  0.9740279 0.1807964
## D:H7-B:H14   0.236666667 -0.30736123  0.7806946 0.7938733
## D:H14-C:H14 -0.006666667 -0.55069456  0.5373612 1.0000000
## A:H7-C:H14  -0.703333333 -1.24736123 -0.1593054 0.0070767
## B:H7-C:H14  -0.653333333 -1.19736123 -0.1093054 0.0131619
## C:H7-C:H14  -0.073333333 -0.61736123  0.4706946 0.9996765
## D:H7-C:H14  -0.266666667 -0.81069456  0.2773612 0.6892349
## A:H7-D:H14  -0.696666667 -1.24069456 -0.1526388 0.0076874
## B:H7-D:H14  -0.646666667 -1.19069456 -0.1026388 0.0142948
## C:H7-D:H14  -0.066666667 -0.61069456  0.4773612 0.9998275
## D:H7-D:H14  -0.260000000 -0.80402790  0.2840279 0.7135677
## B:H7-A:H7    0.050000000 -0.49402790  0.5940279 0.9999751
## C:H7-A:H7    0.630000000  0.08597210  1.1740279 0.0175658
## D:H7-A:H7    0.436666667 -0.10736123  0.9806946 0.1686024
## C:H7-B:H7    0.580000000  0.03597210  1.1240279 0.0324246
## D:H7-B:H7    0.386666667 -0.15736123  0.9306946 0.2782169
## D:H7-C:H7   -0.193333333 -0.73736123  0.3506946 0.9108552

Interpretasi:

Variabel Warna Berdasarkan uji lanjut Tukey pada variabel warna, diketahui bahwa perlakuan C dan D berbeda signifikan dibandingkan perlakuan A dan B (p-value < 0.05), sedangkan A dengan B serta C dengan D tidak berbeda signifikan. Hal ini menunjukkan bahwa perlakuan C dan D menghasilkan warna yang lebih baik. Untuk faktor waktu, tidak terdapat perbedaan signifikan antara H7 dan H14 (p-value > 0.05), sehingga waktu tidak berpengaruh terhadap warna.

Variabel Aroma Berdasarkan uji lanjut Tukey pada variabel aroma, diketahui bahwa perlakuan C dan D berbeda signifikan dibandingkan perlakuan A dan B (p-value < 0.05), sedangkan A dengan B serta C dengan D tidak berbeda signifikan. Hal ini menunjukkan bahwa perlakuan C dan D menghasilkan aroma yang lebih baik. Untuk faktor waktu, tidak terdapat perbedaan signifikan antara H7 dan H14 (p-value > 0.05), sehingga waktu tidak berpengaruh terhadap aroma.

Variabel Rasa Berdasarkan uji lanjut Tukey pada variabel rasa, diketahui bahwa perlakuan C dan D berbeda signifikan dibandingkan perlakuan A dan B (p-value < 0.05), sedangkan A dengan B serta C dengan D tidak berbeda signifikan. Hal ini menunjukkan bahwa perlakuan C dan D menghasilkan rasa yang lebih baik. Untuk faktor waktu, tidak terdapat perbedaan signifikan antara H7 dan H14 (p-value > 0.05), sehingga waktu tidak berpengaruh terhadap rasa.

Variabel Tekstur Berdasarkan uji lanjut Tukey pada variabel tekstur, diketahui bahwa perlakuan C dan D berbeda signifikan dibandingkan perlakuan A dan B (p-value < 0.05), sedangkan A dengan B serta C dengan D tidak berbeda signifikan. Hal ini menunjukkan bahwa perlakuan C dan D menghasilkan tekstur yang lebih baik. Untuk faktor waktu, tidak terdapat perbedaan signifikan antara H7 dan H14 (p-value > 0.05), sehingga waktu tidak berpengaruh terhadap tekstur.

Data 2

Masalah

Sebuah organisasi ingin mengetahui faktor-faktor yang mempengaruhi kinerja karyawan (Y). Penelitian dilakukan terhadap 51 responden yang merupakan karyawan aktif dari berbagai divisi. Penelitian ini menguji tiga variabel independen:

Disiplin Kerja (X1)
Emotional Quotient (X2)
Kepuasan Kerja (X3)

Variabel dependen:

Kinerja Karyawan (Y)

Seluruh variabel diukur menggunakan skala Likert (1–5), di mana nilai yang lebih tinggi menunjukkan tingkat yang lebih baik. Tentukan apakah:

H1: Disiplin Kerja (X1) berpengaruh terhadap Kinerja (Y)

H2: Emotional Quotient (X2) berpengaruh terhadap Kinerja (Y)

H3: Kepuasan Kerja (X3) berpengaruh terhadap Kinerja (Y)

Penyelesaian

#Package
library(readxl)
library(car)
library(lmtest)
library(sandwich)

#Input Data
data_2 <- read_xlsx("C:/Users/dals/OneDrive - untirta.ac.id/KULIAH/Sem 6/Konstat/Data/Data Studi Kasus.xlsx", sheet = "Data 2")
head(data_2, 10)

#Membuat Variabel
#Disiplin Kerja (X1)
data_2$X1 <- rowMeans(data_2[, c("X1.1","X1.2","X1.3","X1.4")])

#Emotional Quotient (X2)
data_2$X2 <- rowMeans(data_2[, c("X2.1","X2.2","X2.3","X2.4","X2.5")])

#Kepuasan Kerja (X3)
data_2$X3 <- rowMeans(data_2[, c("Z1.1","Z1.2","Z1.3")])

#Kinerja (Y)
data_2$Y <- rowMeans(data_2[, c("Y1.1","Y1.2","Y1.3")])

#Eksplorasi Data
str(data_2)

## tibble [51 × 19] (S3: tbl_df/tbl/data.frame)
##  $ X1.1: num [1:51] 2 2 4 2 3 2 1 2 2 3 ...
##  $ X1.2: num [1:51] 2 1 4 2 1 2 2 1 1 3 ...
##  $ X1.3: num [1:51] 3 1 2 1 1 1 3 1 3 4 ...
##  $ X1.4: num [1:51] 4 3 3 2 1 1 3 1 3 3 ...
##  $ X2.1: num [1:51] 1 1 1 1 1 1 2 1 1 2 ...
##  $ X2.2: num [1:51] 1 1 1 1 1 1 1 1 1 1 ...
##  $ X2.3: num [1:51] 2 2 1 2 1 1 3 1 1 3 ...
##  $ X2.4: num [1:51] 3 3 2 3 1 1 3 1 1 1 ...
##  $ X2.5: num [1:51] 1 1 1 3 1 1 3 1 2 3 ...
##  $ Y1.1: num [1:51] 1 1 1 1 1 1 2 1 1 3 ...
##  $ Y1.2: num [1:51] 2 1 1 1 1 1 2 1 3 3 ...
##  $ Y1.3: num [1:51] 4 4 4 3 4 4 4 4 3 4 ...
##  $ Z1.1: num [1:51] 2 4 4 2 4 4 2 2 2 2 ...
##  $ Z1.2: num [1:51] 3 4 4 3 3 4 3 3 3 2 ...
##  $ Z1.3: num [1:51] 1 1 1 1 3 2 1 3 3 1 ...
##  $ X1  : num [1:51] 2.75 1.75 3.25 1.75 1.5 1.5 2.25 1.25 2.25 3.25 ...
##  $ X2  : num [1:51] 1.6 1.6 1.2 2 1 1 2.4 1 1.2 2 ...
##  $ X3  : num [1:51] 2 3 3 2 3.33 ...
##  $ Y   : num [1:51] 2.33 2 2 1.67 2 ...

summary(data_2)

##       X1.1           X1.2            X1.3            X1.4            X2.1      
##  Min.   :1.00   Min.   :1.000   Min.   :1.000   Min.   :1.000   Min.   :1.000  
##  1st Qu.:2.00   1st Qu.:1.000   1st Qu.:1.000   1st Qu.:1.000   1st Qu.:1.000  
##  Median :3.00   Median :2.000   Median :1.000   Median :2.000   Median :1.000  
##  Mean   :2.51   Mean   :2.059   Mean   :1.647   Mean   :2.196   Mean   :1.294  
##  3rd Qu.:3.00   3rd Qu.:3.000   3rd Qu.:2.000   3rd Qu.:3.000   3rd Qu.:1.000  
##  Max.   :4.00   Max.   :4.000   Max.   :4.000   Max.   :4.000   Max.   :3.000  
##       X2.2            X2.3            X2.4            X2.5      
##  Min.   :1.000   Min.   :1.000   Min.   :1.000   Min.   :1.000  
##  1st Qu.:1.000   1st Qu.:1.000   1st Qu.:1.000   1st Qu.:1.000  
##  Median :1.000   Median :1.000   Median :2.000   Median :1.000  
##  Mean   :1.196   Mean   :1.725   Mean   :1.961   Mean   :1.647  
##  3rd Qu.:1.000   3rd Qu.:2.000   3rd Qu.:3.000   3rd Qu.:2.000  
##  Max.   :3.000   Max.   :4.000   Max.   :4.000   Max.   :4.000  
##       Y1.1            Y1.2            Y1.3            Z1.1      
##  Min.   :1.000   Min.   :1.000   Min.   :1.000   Min.   :2.000  
##  1st Qu.:1.000   1st Qu.:1.000   1st Qu.:4.000   1st Qu.:2.000  
##  Median :1.000   Median :1.000   Median :4.000   Median :3.000  
##  Mean   :1.471   Mean   :1.373   Mean   :3.686   Mean   :2.941  
##  3rd Qu.:2.000   3rd Qu.:1.000   3rd Qu.:4.000   3rd Qu.:4.000  
##  Max.   :3.000   Max.   :3.000   Max.   :4.000   Max.   :4.000  
##       Z1.2            Z1.3             X1              X2       
##  Min.   :1.000   Min.   :1.000   Min.   :1.000   Min.   :1.000  
##  1st Qu.:3.000   1st Qu.:1.000   1st Qu.:1.625   1st Qu.:1.000  
##  Median :3.000   Median :1.000   Median :2.000   Median :1.400  
##  Mean   :2.941   Mean   :1.824   Mean   :2.103   Mean   :1.565  
##  3rd Qu.:3.000   3rd Qu.:3.000   3rd Qu.:2.500   3rd Qu.:2.000  
##  Max.   :4.000   Max.   :3.000   Max.   :3.750   Max.   :3.000  
##        X3              Y        
##  Min.   :1.667   Min.   :1.000  
##  1st Qu.:2.000   1st Qu.:2.000  
##  Median :2.667   Median :2.000  
##  Mean   :2.569   Mean   :2.176  
##  3rd Qu.:3.000   3rd Qu.:2.333  
##  Max.   :3.333   Max.   :3.333

colMeans(data_2)

##     X1.1     X1.2     X1.3     X1.4     X2.1     X2.2     X2.3     X2.4 
## 2.509804 2.058824 1.647059 2.196078 1.294118 1.196078 1.725490 1.960784 
##     X2.5     Y1.1     Y1.2     Y1.3     Z1.1     Z1.2     Z1.3       X1 
## 1.647059 1.470588 1.372549 3.686275 2.941176 2.941176 1.823529 2.102941 
##       X2       X3        Y 
## 1.564706 2.568627 2.176471

#Model Regresi Linear Berganda
model_2 <- lm( Y ~ X1+X2+X3, data = data_2)

#Uji Asumsi
shapiro.test(residuals(model_2))

## 
##  Shapiro-Wilk normality test
## 
## data:  residuals(model_2)
## W = 0.96256, p-value = 0.1072

vif(model_2)

##       X1       X2       X3 
## 1.127526 1.289677 1.153864

bptest(model_2)

## 
##  studentized Breusch-Pagan test
## 
## data:  model_2
## BP = 14.603, df = 3, p-value = 0.002189

dwtest(model_2)

## 
##  Durbin-Watson test
## 
## data:  model_2
## DW = 1.6967, p-value = 0.1555
## alternative hypothesis: true autocorrelation is greater than 0

Interpretasi:

Berdasarkan hasil uji normalitas menggunakan Shapiro-Wilk terhadap residual model regresi, diperoleh nilai p-value sebesar 0.1072 yang lebih besar dari 0.05. Hal ini menunjukkan bahwa residual berdistribusi normal, sehingga asumsi normalitas telah terpenuhi. Selanjutnya, hasil uji multikolinearitas menunjukkan bahwa nilai `Variance Inflation Factor (VIF) untuk seluruh variabel independen, yaitu X1, X2, dan X3, berada di bawah 10, sehingga dapat disimpulkan bahwa tidak terdapat masalah multikolinearitas dalam model.

Namun demikian, berdasarkan uji heteroskedastisitas menggunakan Breusch-Pagan, diperoleh nilai p-value sebesar 0.002189 yang lebih kecil dari 0.05, sehingga menunjukkan adanya gejala heteroskedastisitas, yaitu varians residual yang tidak konstan. Sementara itu, hasil uji autokorelasi menggunakan Durbin-Watson menunjukkan nilai p-value sebesar 0.1555 yang lebih besar dari 0.05, sehingga dapat disimpulkan bahwa tidak terdapat autokorelasi pada residual. Dengan demikian, sebagian besar asumsi regresi telah terpenuhi, kecuali asumsi homoskedastisitas yang belum terpenuhi.

#Penanganan Heteroskedastisitas
coeftest(model_2, vcov. = vcovHC(model_2, type = "HC1"))

## 
## t test of coefficients:
## 
##             Estimate Std. Error t value Pr(>|t|)  
## (Intercept)  1.87121    0.91229  2.0511  0.04585 *
## X1           0.12840    0.11266  1.1397  0.26017  
## X2           0.19873    0.24514  0.8107  0.42165  
## X3          -0.10734    0.21808 -0.4922  0.62487  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Interpretasi:

Berdasarkan hasil uji menggunakan coeftest dengan robust standard error, diperoleh bahwa nilai p-value untuk variabel X1 sebesar 0.26017, X2 sebesar 0.42165, dan X3 sebesar 0.62487, yang seluruhnya lebih besar dari 0.05. Hal ini menunjukkan bahwa secara parsial ketiga variabel independen tersebut tidak berpengaruh signifikan terhadap variabel dependen (kinerja karyawan). Sementara itu, nilai p-value pada intercept sebesar 0.04585 (< 0.05) menunjukkan bahwa konstanta model signifikan. Dengan demikian, meskipun telah dilakukan penanganan terhadap heteroskedastisitas, hasil analisis tetap menunjukkan bahwa tidak terdapat pengaruh signifikan dari disiplin kerja, emotional quotient, dan kepuasan kerja terhadap kinerja karyawan.

#Analisis Regresi Linear Berganda
summary(model_2)

## 
## Call:
## lm(formula = Y ~ X1 + X2 + X3, data = data_2)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -1.49480 -0.23221 -0.00473  0.21474  1.00696 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)   1.8712     0.5325   3.514 0.000987 ***
## X1            0.1284     0.1121   1.146 0.257650    
## X2            0.1987     0.1449   1.371 0.176753    
## X3           -0.1073     0.1516  -0.708 0.482429    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.5036 on 47 degrees of freedom
## Multiple R-squared:  0.1258, Adjusted R-squared:  0.06996 
## F-statistic: 2.254 on 3 and 47 DF,  p-value: 0.09439

Interpretasi:

H1: Disiplin Kerja (X1) berpengaruh terhadap Kinerja (Y)?

Berdasarkan hasil analisis regresi, variabel Disiplin Kerja (X1) memiliki nilai p-value sebesar 0.257650 (>0.05). Hal ini menunjukkan bahwa Disiplin Kerja tidak berpengaruh signifikan terhadap Kinerja Karyawan. Dengan demikian, hipotesis H1 yang menyatakan bahwa Disiplin Kerja berpengaruh terhadap Kinerja Karyawan ditolak.

H2: Emotional Quotient (X2) berpengaruh terhadap Kinerja (Y)

Berdasarkan hasil analisis regresi, variabel Emotional Quotient (X2) memiliki nilai p-value sebesar 0.176753 (>0.05). Hal ini menunjukkan bahwa Emotional Quotient tidak berpengaruh signifikan terhadap Kinerja Karyawan. Dengan demikian, hipotesis H2 yang menyatakan bahwa Emotional Quotient berpengaruh terhadap Kinerja Karyawan ditolak.

H3: Kepuasan Kerja (X3) berpengaruh terhadap Kinerja (Y)

Berdasarkan hasil analisis regresi, variabel Kepuasan Kerja (X3) memiliki nilai p-value sebesar 0.482429 (>0.05). Hal ini menunjukkan bahwa Kepuasan Kerja tidak berpengaruh signifikan terhadap Kinerja Karyawan. Dengan demikian, hipotesis H3 yang menyatakan bahwa Kepuasan Kerja berpengaruh terhadap Kinerja Karyawan ditolak.

Berdasarkan hasil analisis regresi linear berganda, diperoleh bahwa nilai p-value uji simultan (Uji F) sebesar 0.09439 yang lebih besar dari 0.05. Hal ini menunjukkan bahwa secara bersama-sama variabel Disiplin Kerja (X1), Emotional Quotient (X2), dan Kepuasan Kerja (X3) tidak berpengaruh signifikan terhadap Kinerja Karyawan (Y).

Secara parsial (Uji t), diperoleh bahwa Disiplin Kerja (X1) memiliki p-value sebesar 0.257650, Emotional Quotient (X2) sebesar 0.176753, dan Kepuasan Kerja (X3) sebesar 0.482429, yang seluruhnya lebih besar dari 0.05. Hal ini menunjukkan bahwa masing-masing variabel independen tidak berpengaruh signifikan terhadap kinerja karyawan. Dengan demikian, hipotesis H1, H2, dan H3 ditolak.

Nilai koefisien determinasi (Adjusted R-squared) sebesar 0.06996 menunjukkan bahwa model hanya mampu menjelaskan sekitar 6.996% variasi kinerja karyawan, sedangkan sisanya dipengaruhi oleh faktor lain di luar model.

Secara keseluruhan, dapat disimpulkan bahwa Disiplin Kerja, Emotional Quotient, dan Kepuasan Kerja tidak memiliki pengaruh yang signifikan terhadap Kinerja Karyawan baik secara parsial maupun simultan pada data yang digunakan.

par(mfrow = c(2,2))
plot(model_2)

Data 3

Masalah

Seorang analis ekonomi memiliki data inflasi bulanan dari Januari 2003 hingga Desember 2020 (total 216 observasi). Data ini digunakan untuk memahami pola pergerakan inflasi serta menyusun model prediksi sebagai dasar pengambilan kebijakan ekonomi. Inflasi merupakan indikator penting dalam stabilitas ekonomi, sehingga analisis yang akurat diperlukan untuk mengidentifikasi pola jangka pendek maupun jangka panjang. Tentukan:

identifikasi pola tren, musiman, dan fluktuasi acak pada data inflasi bulanan periode 2003–2020
Pemodelan time series apa yang tepat digunakan? jelaskan!
lakukan peramalan inflasi 1 tahun kedepan sebagai dasar prediksi kondisi ekonomi jangka pendek.
Hitung nilai MAE (Mean Absolute Error) dan MAPE (Mean Absolute Percentage Error) untuk melihat akurasi model

Penyelesaian

#Package
library(readxl)
library(forecast)
library(tseries)
library(Metrics)

data_3 <- read_xlsx("C:/Users/dals/OneDrive - untirta.ac.id/KULIAH/Sem 6/Konstat/Data/Data Studi Kasus.xlsx", sheet = "Data 3")
head(data_3, 10)

#Transformasi ke Time Series
data_ts <- ts(data_3$`Data Inflasi`, start = c(2003,1), frequency = 12)

#Identifikasi Pola
plot(data_ts, main = "Inflasi Bulanan 2003-2020")

Interpretasi:

Berdasarkan plot time series inflasi bulanan periode 2003–2020, terlihat bahwa data memiliki pola yang cenderung berfluktuasi dengan kecenderungan tren menurun dalam jangka panjang, terutama setelah sekitar tahun 2008 hingga 2020. Pada awal periode, terjadi peningkatan yang cukup signifikan hingga mencapai puncak sekitar tahun 2005–2006, kemudian diikuti penurunan dan pergerakan yang relatif lebih stabil meskipun tetap mengalami naik turun. Pola musiman tidak terlihat secara jelas dari plot ini, namun terdapat indikasi adanya pola berulang dalam periode tertentu.

#Dekomposisi
dekom <- decompose(data_ts)
plot(dekom)

Interpretasi:

Berdasarkan hasil dekomposisi time series, pola data dapat diidentifikasi dengan lebih jelas. Komponen tren menunjukkan adanya kecenderungan peningkatan pada awal periode yang kemudian diikuti penurunan dan stabilisasi pada periode berikutnya. Komponen musiman memperlihatkan pola yang berulang secara konsisten setiap tahun, yang menunjukkan adanya pengaruh musiman dalam data inflasi. Sementara itu, komponen residual (acak) menunjukkan adanya fluktuasi yang tidak teratur di sekitar nol, yang mencerminkan variasi acak yang tidak dapat dijelaskan oleh tren maupun musiman.

Dengan demikian, dapat disimpulkan bahwa data inflasi bulanan memiliki komponen tren, pola musiman yang cukup kuat, serta fluktuasi acak, sehingga model time series yang mempertimbangkan ketiga komponen tersebut (seperti ARIMA musiman/SARIMA) layak untuk digunakan dalam pemodelan dan peramalan.

#Pengujian Stasioneritas
diff_ts <- diff(data_ts)
adf.test(diff_ts)

## 
##  Augmented Dickey-Fuller Test
## 
## data:  diff_ts
## Dickey-Fuller = -5.6998, Lag order = 5, p-value = 0.01
## alternative hypothesis: stationary

Interpretasi:

Berdasarkan hasil uji stasioneritas menggunakan Augmented Dickey-Fuller (ADF) terhadap data yang telah dilakukan differencing, diperoleh nilai statistik uji sebesar -5.6998 dengan p-value sebesar 0.01. Nilai p-value tersebut lebih kecil dari taraf signifikansi 0.05, sehingga H0 ditolak dan dapat disimpulkan bahwa data hasil differencing sudah bersifat stasioner.

Hal ini menunjukkan bahwa proses differencing yang dilakukan berhasil menghilangkan ketidakstasioneran pada data, sehingga data telah memenuhi asumsi stasioneritas yang diperlukan dalam pemodelan time series. Dengan demikian, data tersebut sudah layak digunakan untuk tahap identifikasi dan pembentukan model, seperti ARIMA.

#Identifikasi Model
acf(diff_ts)

pacf(diff_ts)

model_ts <- auto.arima(data_ts)
summary(model_ts)

## Series: data_ts 
## ARIMA(2,1,0)(0,0,1)[12] with drift 
## 
## Coefficients:
##          ar1      ar2     sma1   drift
##       0.1362  -0.1451  -0.8150  -3e-04
## s.e.  0.0678   0.0680   0.0548   2e-04
## 
## sigma^2 = 6.291e-05:  log likelihood = 730.31
## AIC=-1450.62   AICc=-1450.33   BIC=-1433.76
## 
## Training set error measures:
##                       ME        RMSE         MAE       MPE     MAPE      MASE
## Training set 0.000142688 0.007839273 0.004000209 -1.026325 7.018252 0.1334602
##                     ACF1
## Training set 0.005910675

checkresiduals(model_ts)

## 
##  Ljung-Box test
## 
## data:  Residuals from ARIMA(2,1,0)(0,0,1)[12] with drift
## Q* = 17.263, df = 21, p-value = 0.6951
## 
## Model df: 3.   Total lags used: 24

Interpretasi:

Berdasarkan hasil pemodelan menggunakan auto.arima, diperoleh model terbaik yaitu ARIMA(2,1,0)(0,0,1)[12] dengan drift. Model ini menunjukkan bahwa data telah didifferencing satu kali (d = 1) untuk mencapai stasioneritas, serta memiliki komponen autoregressive pada lag ke-1 dan ke-2 (AR(2)), serta komponen musiman moving average orde 1 (SMA(1)) dengan periode 12, yang menandakan adanya pola musiman tahunan.

Nilai AIC yang relatif kecil (-1450.62) menunjukkan bahwa model ini cukup baik dalam menjelaskan data. Selain itu, hasil uji diagnostik residual menggunakan uji Ljung-Box menghasilkan p-value sebesar 0.6951 (> 0.05), yang menunjukkan bahwa residual bersifat white noise (tidak mengandung autokorelasi). Hal ini mengindikasikan bahwa model sudah mampu menangkap pola dalam data dengan baik.

Dengan demikian, model ARIMA(2,1,0)(0,0,1)[12] dengan drift merupakan model yang tepat digunakan karena mampu mengakomodasi pola tren (melalui differencing), pola musiman (melalui komponen musiman), serta menghasilkan residual yang memenuhi asumsi independensi.

#Forecasting 1 tahun ke depan
forecast_12 <- forecast(model_ts, h = 12)
print(forecast_12)

##          Point Forecast         Lo 80      Hi 80        Lo 95      Hi 95
## Jan 2021     0.01866747  0.0085016348 0.02883331  0.003120167 0.03421477
## Feb 2021     0.01632108  0.0009343061 0.03170785 -0.007210958 0.03985311
## Mar 2021     0.01500957 -0.0034861993 0.03350534 -0.013277269 0.04329641
## Apr 2021     0.01308146 -0.0078911978 0.03405412 -0.018993453 0.04515638
## May 2021     0.01268192 -0.0105626224 0.03592647 -0.022867542 0.04823139
## Jun 2021     0.01462941 -0.0107129541 0.03997177 -0.024128390 0.05338721
## Jul 2021     0.01879307 -0.0084826628 0.04606881 -0.022921565 0.06050771
## Aug 2021     0.01997370 -0.0091030219 0.04905042 -0.024495309 0.06444271
## Sep 2021     0.02068821 -0.0100841974 0.05146063 -0.026374128 0.06775056
## Oct 2021     0.02109605 -0.0112839027 0.05347599 -0.028424812 0.07061690
## Nov 2021     0.02026387 -0.0136475820 0.05417532 -0.031599220 0.07212696
## Dec 2021     0.02018462 -0.0151920547 0.05556130 -0.033919337 0.07428858

plot(forecast_12)

Interpretasi:

Berdasarkan hasil peramalan menggunakan model ARIMA(2,1,0)(0,0,1)[12], diperoleh bahwa nilai inflasi untuk 1 tahun ke depan (2021) cenderung berada pada tingkat yang relatif rendah dan stabil. Nilai point forecast pada awal tahun, seperti Januari dan Februari 2021, menunjukkan angka inflasi sekitar 0,018 hingga 0,016, yang mengindikasikan tidak adanya lonjakan inflasi yang signifikan dalam jangka pendek.

Selain itu, interval prediksi (baik 80% maupun 95%) menunjukkan rentang yang tidak terlalu lebar, sehingga tingkat ketidakpastian model masih dalam batas wajar. Hal ini menandakan bahwa hasil peramalan cukup konsisten dan dapat dipercaya untuk menggambarkan kondisi ke depan.

Secara keseluruhan, hasil peramalan menunjukkan bahwa kondisi inflasi dalam 1 tahun ke depan diperkirakan relatif stabil dengan kecenderungan rendah, sehingga dapat diinterpretasikan bahwa kondisi ekonomi jangka pendek cenderung terkendali tanpa tekanan inflasi yang tinggi.

#Evaluasi Model
train_data <- window(data_ts, end = c(2019,12))
test_data <- window(data_ts, start = c(2020,1))

train_model <- auto.arima(train_data)
predik <- forecast(train_model, h = length(test_data))

mae(test_data, predik$mean)

## [1] 0.01183228

mape(test_data, predik$mean)

## [1] 0.7468122

Interpretasi:

Berdasarkan hasil evaluasi model, diperoleh nilai MAE (Mean Absolute Error) sebesar 0.0118. Nilai ini menunjukkan bahwa rata-rata kesalahan absolut antara hasil prediksi dan data aktual relatif kecil, sehingga model memiliki tingkat kesalahan yang rendah dalam memprediksi nilai inflasi.

Sementara itu, nilai MAPE (Mean Absolute Percentage Error) sebesar 0.7468 atau sekitar 0.75% menunjukkan bahwa rata-rata kesalahan prediksi hanya kurang dari 1% dari nilai aktual. Hal ini mengindikasikan bahwa model memiliki tingkat akurasi yang sangat baik dalam melakukan peramalan.

Dengan demikian, dapat disimpulkan bahwa model yang digunakan memiliki akurasi yang tinggi dan layak digunakan untuk peramalan inflasi dalam jangka pendek.

Tugas Konsultasi Statistika

Dinda Dwi Anugrah Pertiwi

STUDI KASUS ANALISIS DATA

Data 1

Masalah

Penyelesaian

Data 2

Masalah

Penyelesaian

Data 3

Masalah

Penyelesaian