Analisis ini bertujuan untuk mengetahui efektivitas promosi terhadap total pendapatan pada setiap kategori ukuran gerai Makanan Cepat Saji yang tersebar di beberapa lokasi. Data yang digunakan bersumber dari Kaggle dan dapat diakses pada link berikut ini,
library(nortest)
library(lmtest)
## Warning: package 'lmtest' was built under R version 4.3.1
## Loading required package: zoo
##
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
##
## as.Date, as.Date.numeric
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(car)
## Loading required package: carData
##
## Attaching package: 'car'
## The following object is masked from 'package:dplyr':
##
## recode
#Import Data
data <- read.csv("C:/Users/monica/Documents/Fast Food Campaign Data.csv",sep=";")
Data terdiri dari 7 Variabel dengan penjelasan sebagai berikut:
summary(data$AgeOfStore)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1.000 4.000 7.000 8.504 12.000 28.000
summary(data$SalesInThousands)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 17.34 42.55 50.20 53.47 60.48 99.65
table(data$MarketSize)
##
## Large Medium Small
## 168 320 60
table(data$Promotion)
##
## 1 2 3
## 172 188 188
table(data$week)
##
## 1 2 3 4
## 137 137 137 137
Hasil Statistika Deskriptif dapat disajikan dalam tabel berikut,
| Variabel | Min | Mean | Max |
|---|---|---|---|
| AgeOfStore | 1.0 | 8.5 | 28.0 |
| SalesInThousands | 17.3 | 53.5 | 99.7 |
par(mfrow=c(1,2))
barplot(table(data$MarketSize), main = "Jumlah Gerai untuk Setiap Ukuran", xlab = "Ukuran Gerai", ylab = "Jumlah Toko", col = "lightgreen")
boxplot(SalesInThousands ~ MarketSize, data = data, main = "Ukuran Gerai vs Total Pendapatan", xlab = "Ukuran Gerai", ylab = "Total Pendapatan", col = "skyblue")
Berdasarkan Barplot di atas, terlihat bahwa gerai Medium yang paling banyak, kemudian gerai Large dan yang paling sedikit yaitu gerai Small.
Boxplot di samping menjelaskan persebaran total pendapatan pada setiap kategori gerai. Didapatkan bahwa gerai Large memiliki rata-rata penghasilan tertinggi, kemudian gerai Small, dan yang memiliki rata-rata penghasilan terendah yaitu gerai Medium.
#Menambah Variabel Baru (Kategorik)
for(i in 1:length(data$AgeOfStore)){
if(data[i,4]<10){
data[i,8]="Age <10"
}else if(data[i,4]<=20){
data[i,8]="Age 10-20"
}else{
data[i,8]="Age >20"
}
}
names(data)[8]=paste("AgeCategory")
Analisis ini digunakan untuk mengetahui keefektifitasan promosi berupa lokasi, jumlah promosi, dan minggu dilakukannya promosi terhadap total pendapatan pada setiap ukuran gerai.
#Data
data_small <- data[data$MarketSize == "Small", c("LocationID","SalesInThousands","AgeOfStore", "Promotion", "week","AgeCategory")]
#Statistika Deskriptif Small
summary(data_small$AgeOfStore)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1.0 5.0 8.0 10.8 19.0 28.0
summary(data_small$SalesInThousands)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 36.17 53.34 57.55 57.41 62.16 70.60
table(data_small$Promotion)
##
## 1 2 3
## 20 16 24
table(data_small$week)
##
## 1 2 3 4
## 15 15 15 15
Statistika Deskriptif Gerai Small,
| Variabel | Min | Mean | Max |
|---|---|---|---|
| AgeOfStore | 1.0 | 10.8 | 28.0 |
| SalesInThousands | 36.2 | 57.4 | 70.6 |
#Visualisasi
par(mfrow=c(1,3))
hist(data_small$SalesInThousands, main = "Histogram Total Pendapatan", xlab = "Total Pendapatan", col = "lightgreen", border = "black")
boxplot(data_small$AgeOfStore, main = "Boxplot Usia Gerai", ylab = "Usia Gerai", col = "#FFC0CB")
pie(table(data_small$Promotion), main = "Proporsi Jumlah Promosi", col = c("#FFC0CB", "#87CEEB", "#98FB98"), radius = 1)
Pada Histogram Total Pendapatan, diketahui terdapat 15 gerai Small yang berpenghasilan 55-60 ribu dollar dan 60-75 ribu dollar. Kemudian, terdapat <5 gerai yang berpenghasilan <40 ribu dollar, 40-45 ribu dolar, dan >70 ribu dollar.
Persebaran usia gerai Small dapat dijelaskan melalui Boxplot di atas dimana nilai tengahnya yaitu 8 tahun, memiiliki nilai minimum 1 tahun, dan maksimum >25 tahun.
Pada Pie chart di atas, mayoritas gerai Small melakukan 3 promosi sekaligus.
#Multiple Variabel
par(mfrow=c(1,3))
#Membuat BoxPlot
boxplot(SalesInThousands ~ AgeCategory, data = data_small, main = "Usia Gerai vs Total Pendapatan", xlab = "Usia Gerai", ylab = "Total Pendapatan", col = "pink")
boxplot(SalesInThousands ~ Promotion, data = data_small, main = "Promosi vs Total Pendapatan", xlab = "Jumlah Promosi", ylab = "Total Pendapatan", col = "lightgreen")
boxplot(SalesInThousands ~ week, data = data_small, main = "Minggu Promosi vs Total Pendapatan", xlab = "Promosi Minggu ke-", ylab = "Total Pendapatan", col = "grey")
title(main = "Box Plot Gerai Small", outer = TRUE, line = -1, cex.main = 1.5)
Pada Boxplot Usia Gerai vs Total Pendapatan didapatkan Usia Gerai >20 tahun memperoleh pendapatan tertinggi dibanding 2 kategori usia lainnya.
Pada Boxplot Promosi vs Total Pendapatan terlihat bahwa jumlah promosi yang paling sedikit menjual yaitu 2 promosi.
Pada Boxplot Minggu Promosi vs Total Pendapatan diketahui bahwa promosi pada minggu ke-2 memperoleh pendapatan yang lebih banyak dibandingkan jika dilakukan pada minggu lainnya.
#Analisis Korelasi
cor.test(data_small$LocationID,data_small$SalesInThousands)
##
## Pearson's product-moment correlation
##
## data: data_small$LocationID and data_small$SalesInThousands
## t = -4.914, df = 58, p-value = 7.663e-06
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## -0.6997627 -0.3342704
## sample estimates:
## cor
## -0.5421755
cor.test(data_small$AgeOfStore,data_small$SalesInThousands)
##
## Pearson's product-moment correlation
##
## data: data_small$AgeOfStore and data_small$SalesInThousands
## t = 2.7953, df = 58, p-value = 0.007019
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## 0.0993291 0.5503372
## sample estimates:
## cor
## 0.3445632
cor.test(data_small$Promotion,data_small$SalesInThousands)
##
## Pearson's product-moment correlation
##
## data: data_small$Promotion and data_small$SalesInThousands
## t = -0.10279, df = 58, p-value = 0.9185
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## -0.2665075 0.2412554
## sample estimates:
## cor
## -0.01349609
cor.test(data_small$week,data_small$SalesInThousands)
##
## Pearson's product-moment correlation
##
## data: data_small$week and data_small$SalesInThousands
## t = 0.78621, df = 58, p-value = 0.4349
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## -0.1552855 0.3475506
## sample estimates:
## cor
## 0.1026883
Didapatkan hasil korelasi sebagai berikut,
| Variabel | P-Value | cor |
|---|---|---|
| LocationID | 7.663e-06 | -0.5421755 |
| AgeOfStore | 0.0070192 | 0.3445632 |
| Promotion | 0.9184822 | -0.0134961 |
| week | 0.4349468 | 0.1026883 |
Didapatkan P-Value LocationID dan AgeOfStore < 0.05, sehingga 2 variabel ini memiliki hubungan signifikan terhadap SalesInThousand. Pada variabel LocationID memiliki pengaruh negatif-sedang (berlawanan arah) dan pada variabel AgeofStore memiliki pengaruh positif-lemah (searah)
Sedangkan variabel Promotion dan week tidak memiliki pengaruh signifikan terhadaap SalesInThousands.
#Persamaan Regresi
models <- lm(SalesInThousands ~ LocationID+AgeOfStore+Promotion+week, data = data_small)
modelsmall<-summary(models)
modelsmall
##
## Call:
## lm(formula = SalesInThousands ~ LocationID + AgeOfStore + Promotion +
## week, data = data_small)
##
## Residuals:
## Min 1Q Median 3Q Max
## -17.1976 -2.5317 -0.1349 2.8115 10.0704
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 73.734614 4.180784 17.637 < 2e-16 ***
## LocationID -0.051287 0.008598 -5.965 1.84e-07 ***
## AgeOfStore 0.090269 0.087779 1.028 0.30828
## Promotion -3.533137 0.940930 -3.755 0.00042 ***
## week 0.604133 0.576631 1.048 0.29936
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 4.994 on 55 degrees of freedom
## Multiple R-squared: 0.4716, Adjusted R-squared: 0.4332
## F-statistic: 12.27 on 4 and 55 DF, p-value: 3.357e-07
Persamaan Regresi: SalesInThousands = 73.73 - 0.051 LocationID + 0.090 AgeOfStore - 3.53 Promotion + 0.604 week
Uji Serentak: p-value = 3.357e-07 < 0.05, Variabel-variabel independen tersebut berpengaruh secara simultan terhadap model.
Uji Parsial: p-value LocationID dan Promotion < 0.05, sehingga variabel tersebut mmasing-masing berpengaruh terhadap model, dengan pengaruh negatif.
Koefisien Determinasi: Variabel dapat menjelaskan model 43.3% sedangkan sisanya dijelaskan oleh variabel lain di luar model.
#Uji Asumsi Klasik
#Normalitas
lillie.test(modelsmall$residuals)
##
## Lilliefors (Kolmogorov-Smirnov) normality test
##
## data: modelsmall$residuals
## D = 0.074928, p-value = 0.5505
#Multikolinearitas
vif(models)
## LocationID AgeOfStore Promotion week
## 1.734317 1.164722 1.552637 1.000000
#Heteroskedastisitas
bptest(modelsmall)
##
## studentized Breusch-Pagan test
##
## data: modelsmall
## BP = 2.6839, df = 4, p-value = 0.612
Uji Asumsi Klasik
1. Normalitas: Didapatkan P-Value 0.5505 > 0.05, Sehingga Residual mengikuti Distribusi Normal.
2. Uji Multikolinearitas: Didapatkan VIF < 10, Sehingga tidak terdapat gejala multikolinearitas.
3. Uji Heteroskedastisitas: Didapatkan P-Value 0.612 > 0.05, Sehingga tidak terjadi heteroskedastisitas pada model yang terbentuk.
data_medium <- data[data$MarketSize == "Medium", c("LocationID","SalesInThousands","AgeOfStore", "Promotion", "week","AgeCategory")]
#Statistika Deskriptif Medium
summary(data_medium$AgeOfStore)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1.000 4.000 7.500 8.787 12.000 27.000
summary(data_medium$SalesInThousands)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 17.34 37.92 44.59 43.99 50.34 65.11
table(data_medium$MarketSize)
## < table of extent 0 >
table(data_medium$Promotion)
##
## 1 2 3
## 96 108 116
table(data_medium$week)
##
## 1 2 3 4
## 80 80 80 80
Statistika Deskriptif Gerai Medium,
| Variabel | Min | Mean | Max |
|---|---|---|---|
| AgeOfStore | 1.0 | 8.8 | 27.0 |
| SalesInThousands | 17.34 | 43.9 | 65.1 |
#Visualisasi
par(mfrow=c(1,3))
hist(data_medium$SalesInThousands, main = "Histogram Total Pendapatan", xlab = "Total Pendapatan", col = "#FFC0CB", border = "black")
boxplot(data_medium$AgeOfStore, main = "Boxplot Usia Gerai", ylab = "Usia Gerai", col = "lightblue")
pie(table(data_medium$Promotion), main = "Proporsi Jumlah Promosi", col = c("#FFC0CB", "#87CEEB", "#98FB98"), radius = 1)
Pada Histogram Total Pendapatan, diketahui terdapat 70 gerai Medium yang berpenghasilan 45-50 ribu dollar. Kemudian, terdapat <5 gerai yang berpenghasilan >70 ribu dollar.
Persebaran usia gerai Medium dapat dijelaskan melalui Boxplot di atas dimana nilai tengahnya yaitu 8 tahun, memiiliki nilai minimum 1 tahun, dan maksimum >25 tahun.
Pada pie chart di atas, mayoritas gerai Medium melakukan 3 promosi sekaligus.
par(mfrow=c(1,3))
#Membuat BoxPlot
boxplot(SalesInThousands ~ AgeCategory, data = data_medium, main = "Usia Gerai vs Total Pendapatan", xlab = "Usia Gerai", ylab = "Total Pendapatan", col = "pink")
boxplot(SalesInThousands ~ Promotion, data = data_medium, main = "Promosi vs Total Pendapatan", xlab = "Jumlah Promosi", ylab = "Total Pendapatan", col = "lightgreen")
boxplot(SalesInThousands ~ week, data = data_medium, main = "Minggu Promosi vs Total Pendapatan", xlab = "Promosi Minggu ke-", ylab = "Total Pendapatan", col = "grey")
title(main = "Box Plot Gerai Medium", outer = TRUE, line = -1, cex.main = 1.5)
Pada Boxplot Usia Gerai vs Total Pendapatan didapatkan Usia Gerai >20 tahun memperoleh pendapatan tertinggi dibanding 2 kategori usia lainnya.
Pada Boxplot Promosi vs Total Pendapatan terlihat bahwa jumlah promosi yang paling sedikit menjual yaitu 2 promosi.
Pada Boxplot Minggu Promosi vs Total Pendapatan diketahui bahwa promosi pada minggu ke-4 memperoleh pendapatan yang lebih sedikit dibandingkan jika dilakukan pada minggu lainnya yg cenderung sama.
#Analisis Korelasi
cor.test(data_medium$LocationID,data_medium$SalesInThousands)
##
## Pearson's product-moment correlation
##
## data: data_medium$LocationID and data_medium$SalesInThousands
## t = 10.401, df = 318, p-value < 2.2e-16
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## 0.4172229 0.5813437
## sample estimates:
## cor
## 0.5038162
cor.test(data_medium$AgeOfStore,data_medium$SalesInThousands)
##
## Pearson's product-moment correlation
##
## data: data_medium$AgeOfStore and data_medium$SalesInThousands
## t = 2.4684, df = 318, p-value = 0.0141
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## 0.02789526 0.24310131
## sample estimates:
## cor
## 0.1371159
cor.test(data_medium$Promotion,data_medium$SalesInThousands)
##
## Pearson's product-moment correlation
##
## data: data_medium$Promotion and data_medium$SalesInThousands
## t = -1.3862, df = 318, p-value = 0.1667
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## -0.18556428 0.03241442
## sample estimates:
## cor
## -0.07750104
cor.test(data_medium$week,data_medium$SalesInThousands)
##
## Pearson's product-moment correlation
##
## data: data_medium$week and data_medium$SalesInThousands
## t = -0.95589, df = 318, p-value = 0.3399
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## -0.16221458 0.05644474
## sample estimates:
## cor
## -0.05352654
Didapatkan hasil korelasi sebagai berikut,
| Variabel | P-Value | cor |
|---|---|---|
| LocationID | 5.313075e-22 | 0.5038162 |
| AgeOfStore | 0.01409588 | 0.1371159 |
| Promotion | 0.1666537 | -0.07750104 |
| week | 0.3398563 | -0.05352654 |
Didapatkan P-Value LocationID dan AgeOfStore < 0.05, sehingga 2 variabel ini memiliki hubungan signifikan terhadap SalesInThousand. Pada variabel LocationID memiliki pengaruh positif-sedang (searah) dan pada variabel AgeofStore memiliki pengaruh positif-lemah (searah)
Sedangkan variabel Promotion dan week tidak memiliki pengaruh signifikan terhadaap SalesInThousands.
#Persamaan Regresi
modelm <- lm(SalesInThousands ~ LocationID+AgeOfStore+Promotion+week, data = data_medium)
modelmedium<-summary(modelm)
modelmedium
##
## Call:
## lm(formula = SalesInThousands ~ LocationID + AgeOfStore + Promotion +
## week, data = data_medium)
##
## Residuals:
## Min 1Q Median 3Q Max
## -26.5365 -5.2086 0.6301 4.9992 18.8469
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 37.369350 1.765102 21.171 < 2e-16 ***
## LocationID 0.018751 0.001743 10.760 < 2e-16 ***
## AgeOfStore 0.177364 0.066017 2.687 0.00760 **
## Promotion -1.510621 0.532027 -2.839 0.00481 **
## week -0.432662 0.383822 -1.127 0.26050
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 7.676 on 315 degrees of freedom
## Multiple R-squared: 0.2898, Adjusted R-squared: 0.2807
## F-statistic: 32.13 on 4 and 315 DF, p-value: < 2.2e-16
Persamaan Regresi: SalesInThousands = 37.37 + 0.018 LocationID + 0.177 AgeOfStore - 1.51 Promotion - 0.433 week
Uji Serentak: p-value = 2.2e-16 < 0.05, Variabel-variabel independen tersebut berpengaruh secara simultan terhadap model.
Uji Parsial: p-value LocationID, AgeOfStore, dan Promotion < 0.05, sehingga variabel tersebut mmasing-masing berpengaruh terhadap model, untuk Locationid dan AgeOfStore memiiliki pengaruh positif, dan Promotion memiliki pengaruh negatif.
Koefisien Determinasi: Variabel dapat menjelaskan model 28.0% sedangkan sisanya dijelaskan oleh variabel lain di luar model.
#Uji Asumsi Klasik
#Normalitas
lillie.test(modelmedium$residuals)
##
## Lilliefors (Kolmogorov-Smirnov) normality test
##
## data: modelmedium$residuals
## D = 0.040883, p-value = 0.216
#AutoKolerasi
vif(modelm)
## LocationID AgeOfStore Promotion week
## 1.011174 1.002702 1.012315 1.000000
#Heteroskedastisitas
bptest(modelmedium)
##
## studentized Breusch-Pagan test
##
## data: modelmedium
## BP = 2.5457, df = 4, p-value = 0.6365
Uji Asumsi Klasik
1. Normalitas: Didapatkan P-Value 0.216 > 0.05, Sehingga Residual mengikuti Distribusi Normal.
2. Uji Multikolinearitas: Didapatkan VIF < 10, Sehingga tidak terdapat gejala multikolinearitas.
3. Uji Heteroskedastisitas: Didapatkan P-Value 0.6365 > 0.05, Sehingga tidak terjadi heteroskedastisitas pada model yang terbentuk.
data_large <- data[data$MarketSize == "Large", c("LocationID","SalesInThousands","AgeOfStore", "Promotion", "week","AgeCategory")]
#Statistika Deskriptif Large
summary(data_large$AgeOfStore)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1.000 2.000 6.000 7.143 10.000 24.000
summary(data_large$SalesInThousands)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 39.36 53.62 75.02 70.12 84.53 99.65
table(data_large$MarketSize)
## < table of extent 0 >
table(data_large$Promotion)
##
## 1 2 3
## 56 64 48
table(data_large$week)
##
## 1 2 3 4
## 42 42 42 42
Statistika Deskriptif Gerai Large,
| Variabel | Min | Mean | Max |
|---|---|---|---|
| AgeOfStore | 1.0 | 7.1 | 24.0 |
| SalesInThousands | 39.4 | 70.1 | 99.7 |
#Visualisasi Data
par(mfrow=c(1,3))
hist(data_large$SalesInThousands, main = "Histogram Total Pendapatan", xlab = "Total Pendapatan", col = "skyblue", border = "black")
boxplot(data_large$AgeOfStore, main = "Boxplot Usia Gerai", ylab = "Usia Gerai", col = "#98FB98")
pie(table(data_large$Promotion), main = "Proporsi Jumlah Promosi", col = c("#FFC0CB", "#87CEEB", "#98FB98"), radius = 1)
par(mfrow=c(1,1))
Pada Histogram Total Pendapatan, diketahui terdapat >25 gerai Large yang berpenghasilan 80-85 ribu dollar. Kemudian, terdapat <5 gerai yang berpenghasilan >95 ribu dollar.
Persebaran usia gerai Large dapat dijelaskan melalui Boxplot di atas dimana nilai tengahnya yaitu 7 tahun, memiiliki nilai minimum 1 tahun, dan maksimum >20 tahun.
Pada pie chart di atas, mayoritas gerai Large melakukan 2 promosi.
par(mfrow=c(1,3))
#Membuat BoxPlot
boxplot(SalesInThousands ~ AgeCategory, data = data_large, main = "Usia Gerai vs Total Pendapatan", xlab = "Usia Gerai", ylab = "Total Pendapatan", col = "pink")
boxplot(SalesInThousands ~ Promotion, data = data_large, main = "Promosi vs Total Pendapatan", xlab = "Jumlah Promosi", ylab = "Total Pendapatan", col = "lightgreen")
boxplot(SalesInThousands ~ week, data = data_large, main = "Minggu Promosi vs Total Pendapatan", xlab = "Promosi Minggu ke-", ylab = "Total Pendapatan", col = "grey")
title(main = "Box Plot Gerai Large", outer = TRUE, line = -1, cex.main = 1.5)
Pada Boxplot Usia Gerai vs Total Pendapatan didapatkan Usia Gerai >20 tahun memperoleh pendapatan terendah dibanding 2 kategori usia lainnya.
Pada Boxplot Promosi vs Total Pendapatan terlihat bahwa jumlah promosi yang mendapat hasil penjualan lebih rendah yaitu 2 promosi, sedangkan yang paling banyak menjual yaitu 1 promosi.
Pada Boxplot Minggu Promosi vs Total Pendapatan diketahui bahwa promosi pada minggu ke-1 memperoleh pendapatan yang lebih banyak dibandingkan jika dilakukan pada minggu lainnya.
#Analisis Korelasi
cor.test(data_large$LocationID,data_large$SalesInThousands)
##
## Pearson's product-moment correlation
##
## data: data_large$LocationID and data_large$SalesInThousands
## t = -29.499, df = 166, p-value < 2.2e-16
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## -0.9377066 -0.8882427
## sample estimates:
## cor
## -0.9164063
cor.test(data_large$AgeOfStore,data_large$SalesInThousands)
##
## Pearson's product-moment correlation
##
## data: data_large$AgeOfStore and data_large$SalesInThousands
## t = -0.95172, df = 166, p-value = 0.3426
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## -0.2225939 0.0786198
## sample estimates:
## cor
## -0.07366691
cor.test(data_large$Promotion,data_large$SalesInThousands)
##
## Pearson's product-moment correlation
##
## data: data_large$Promotion and data_large$SalesInThousands
## t = 0.30746, df = 166, p-value = 0.7589
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## -0.1280156 0.1746356
## sample estimates:
## cor
## 0.0238566
cor.test(data_large$week,data_large$SalesInThousands)
##
## Pearson's product-moment correlation
##
## data: data_large$week and data_large$SalesInThousands
## t = 0.060944, df = 166, p-value = 0.9515
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## -0.1467848 0.1560282
## sample estimates:
## cor
## 0.004730135
Didapatkan hasil korelasi sebagai berikut,
| Variabel | P-Value | cor |
|---|---|---|
| LocationID | 6.539471e-68 | -0.9164063 |
| AgeOfStore | 0.3426239 | -0.07366691 |
| Promotion | 0.75888 | 0.0238566 |
| week | 0.951477 | 0.00473013 |
Didapatkan P-Value LocationID < 0.05, sehingga variabel ini memiliki hubungan signifikan terhadap SalesInThousand. Pada variabel LocationID memiliki pengaruh negatif-kuat (berlawanan arah)
Sedangkan variabel AgeOfStore, Promotion dan week tidak memiliki pengaruh signifikan terhadaap SalesInThousands.
#Persamaan Regresi
modell <- lm(SalesInThousands ~ LocationID+AgeOfStore+Promotion+week, data = data_large)
modellarge<-summary(modell)
modellarge
##
## Call:
## lm(formula = SalesInThousands ~ LocationID + AgeOfStore + Promotion +
## week, data = data_large)
##
## Residuals:
## Min 1Q Median 3Q Max
## -18.6512 -4.6494 0.0083 4.2554 13.1014
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 102.872348 2.014336 51.070 < 2e-16 ***
## LocationID -0.046065 0.001407 -32.744 < 2e-16 ***
## AgeOfStore -0.209807 0.080101 -2.619 0.00964 **
## Promotion -3.258150 0.627242 -5.194 6.06e-07 ***
## week 0.071929 0.431305 0.167 0.86776
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 6.25 on 163 degrees of freedom
## Multiple R-squared: 0.8689, Adjusted R-squared: 0.8657
## F-statistic: 270 on 4 and 163 DF, p-value: < 2.2e-16
Persamaan Regresi: SalesInThousands = 102.87 - 0.046 LocationID - 0.209 AgeOfStore - 3.258 Promotion + 0.072 week
Uji Serentak: p-value = 2.2e-16 < 0.05, Variabel-variabel independen tersebut berpengaruh secara simultan terhadap model.
Uji Parsial: p-value LocationID, AgeOfStore, dan Promotion < 0.05, sehingga variabel tersebut mmasing-masing berpengaruh terhadap model, dengan pengaruh negatif.
Koefisien Determinasi: Variabel dapat menjelaskan model 86.5% sedangkan sisanya dijelaskan oleh variabel lain di luar model.
#Uji Asumsi Klasik
#Normalitas
lillie.test(modellarge$residuals)
##
## Lilliefors (Kolmogorov-Smirnov) normality test
##
## data: modellarge$residuals
## D = 0.043286, p-value = 0.6185
#AutoKolerasi
vif(modell)
## LocationID AgeOfStore Promotion week
## 1.037600 1.005928 1.043569 1.000000
#Heteroskedastisitas
bptest(modellarge)
##
## studentized Breusch-Pagan test
##
## data: modellarge
## BP = 0.48216, df = 4, p-value = 0.9752
Uji Asumsi Klasik
1. Normalitas: Didapatkan P-Value 0.6185 > 0.05, Sehingga Residual mengikuti Distribusi Normal.
2. Uji Multikolinearitas: Didapatkan VIF < 10, Sehingga tidak terdapat gejala multikolinearitas.
3. Uji Heteroskedastisitas: Didapatkan P-Value 0.9752 > 0.05, Sehingga tidak terjadi heteroskedastisitas pada model yang terbentuk.
Lokasi dan Jumlah Promosi memberi pengaruh signifikan secara negatif terhadap Total Pendapatan. Disarankan agar Outlet Small Store mengevaluasi lebih lanjut mengenai faktor lain yang saling terkait misalnya tentang kompetitor di sekitar lokasi, sehingga diharapkan dapat mencari ide promosi yang lebih menarik agar mendorong penjualan.
Pada Outlet Small, Umur Gerai dan Minggu promosi memiliki pengaruh positif tetapi tidak signifikan terhadap total pendapatan. Sehingga, hal ini dapat turut dipertimbangkan demi meningkatkan penjualan seperti meningkatkan pelayanan seiring tingginya jam terbang operasional (umur gerai), Manajemen Outlet juga perlu memperhatikan minggu dilaksanakannya promosi dengan melihat berbagai kondisi yang menyertai agar penjualan dapat meningkat.
Lokasi dan Umur Gerai memberi pengaruh signifikan secara positif terhadap Total Pendapatan, hal ini merupakan suatu keuntungan tetapi tetap disarankan agar Outlet Medium Store mempertahankan hal ini dan turut memantau segala perubahan yang memungkinkan agar dapat dilakukan pengendalian nantinya.Sedangkan Promosi memberi pengaruh signifikan negatif terhadap Total Pendapatan, disarankan dapat mencari ide promosi yang lebih menarik agar mendorong penjualan.
Pada Outlet Medium, Minggu promosi memiliki pengaruh negatif dan tidak signifikan terhadap total pendapatan. Hal ini dapat dipertimbangkan bersama dengan Jumlah Promosi, sehingga keduanya diharapkan mampu memberi pengaruh positif terhadap total pendapatan.
Lokasi, Umur Gerai, dan Promosi memberi pengaruh signifikan secara negatif terhadap Total Pendapatan. Disarankan agar Outlet Large Store mengevaluasi lebih lanjut mengenai faktor lain yang saling terkait misalnya tentang kompetitor di sekitar lokasi, sehingga diharapkan dapat mencari ide promosi yang lebih menarik agar mendorong penjualan. Selain itu, diperlukan juga peningkatan layanan mengingat usia gerai memiliki pengaruh signifikan negatif, sehingga diharapkan seiring bertambahnya umur gerai, pelayanan semakin membaik dan dapat mendorong peningkatan total pendapatan.
Pada Outlet Large, Minggu promosi memiliki pengaruh positif dan tidak signifikan terhadap total penjualan. Hal ini dapat dipertimbangkan bersama dengan Jumlah Promosi, sehingga keduanya diharapkan mampu memberi pengaruh positif terhadap total pendapatan.