library(readxl)
## Warning: package 'readxl' was built under R version 4.2.2
Fueling_sales_at_EuroPet_data <- read_xlsx("Fueling_sales_at_EuroPet_data.xlsx")
head(Fueling_sales_at_EuroPet_data)
## # A tibble: 6 × 10
## Week Sales TV Radio `Fuel Volume` `Fuel Price` Temp Prec Holiday Visit…¹
## <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 26 24864 74.5 66.5 61825 104. 27.9 0.9 1 7
## 2 27 23809 74.5 66.5 62617 104. 27.7 1.3 1 7
## 3 28 24476 90 75 60227 107. 29.1 4.8 1 5.9
## 4 29 25279 90 75 63273 112. 30 3.1 1 5.9
## 5 30 26263 90 75 65196 109. 29.3 0 1 5.9
## 6 31 24299 90 75 64789 105. 28.1 3.6 1 5.9
## # … with abbreviated variable name ¹`Visits (1 or 2)`
Opis spremenljivk:
Week: teden v letu Sales: prodaja po tednih v trgovinicah (v eur) TV: izdatki za oglaševanje po televiziji (v eur) Radio: izdatki za oglaševanje po radiu (v eur) Fuel Volume: količina goriva (v litrih) Fuel Price: cena goriva (v eur) Temp: temperatura zraka (v °C) Prec: količina padavin (v ml) Holiday: počitnice - (1 yes), (2 no) Visits (1 or 2): povprečno število obiskov
Vir podatkov: Upravljalna ekonomika, seminar 8
Cilji analize podatkov: - Določiti minimalne, maksimalne in povprečne vrednosti spremenljivk. - S pomočjo regresijske analize proučiti povezavo med SALES in FUEL VOLUME ter ugotoviti ali je povezava statistično značilna. - S pomočjo regresijske analize analizirati povezavo med SALES in TV ter RADIO ter ugotoviti ali je statistično značilen vpliv. - Ugotoviti ali se oglaševanje splača (ugotoviti neto učinek). - Primerjati rezultate regresije, ko vključimo še temperaturo kot dodatno spremenljivko. - Narediti regresijsko analizo, kjer vključimo vse spremenljivke (razen WEEKS). - Interpretirati koeficiente s statističnega in ekonomskega vidika. - Ugotoviti ali je oglaševanje po vključitvi vseh spremenljiv dobičkonosno. - Analizirati spremembe R^2 med različnimi regresijami.
factor(Fueling_sales_at_EuroPet_data$Holiday,
levels = c(1, 0),
labels = c("DA", "NE"))
## [1] DA DA DA DA DA DA DA DA DA DA DA NE NE NE NE NE NE DA DA DA NE NE NE NE NE
## [26] DA DA DA NE NE NE NE NE NE NE DA DA NE NE NE NE DA DA DA DA DA DA NE NE NE
## [51] NE NE NE DA DA DA DA DA DA DA DA DA NE NE NE NE NE NE NE DA DA DA NE NE NE
## [76] NE NE NE DA DA NE NE NE NE NE NE DA DA DA NE NE NE NE DA DA DA DA DA NE NE
## [101] NE
## Levels: DA NE
summary(Fueling_sales_at_EuroPet_data)
## Week Sales TV Radio
## Min. : 1.00 Min. :18969 Min. : 0.00 Min. : 0.00
## 1st Qu.:13.00 1st Qu.:21171 1st Qu.: 0.00 1st Qu.: 0.00
## Median :27.00 Median :22924 Median : 0.00 Median : 0.00
## Mean :26.57 Mean :23064 Mean : 41.28 Mean : 80.47
## 3rd Qu.:40.00 3rd Qu.:24489 3rd Qu.: 70.00 3rd Qu.:205.00
## Max. :52.00 Max. :28451 Max. :225.00 Max. :260.00
## Fuel Volume Fuel Price Temp Prec
## Min. :56259 Min. :101.5 Min. : 9.10 Min. : 0.00
## 1st Qu.:61754 1st Qu.:108.0 1st Qu.:12.00 1st Qu.: 6.20
## Median :63136 Median :115.5 Median :16.80 Median :10.90
## Mean :62853 Mean :115.5 Mean :17.95 Mean :11.34
## 3rd Qu.:64637 3rd Qu.:120.9 3rd Qu.:23.10 3rd Qu.:14.50
## Max. :68549 Max. :133.7 Max. :30.70 Max. :30.30
## Holiday Visits (1 or 2)
## Min. :0.0000 Min. : 0.000
## 1st Qu.:0.0000 1st Qu.: 3.200
## Median :0.0000 Median : 6.000
## Mean :0.4653 Mean : 5.642
## 3rd Qu.:1.0000 3rd Qu.: 7.000
## Max. :1.0000 Max. :12.500
Fuel Volume, min = 56259: Najnižja natankana količina goriva znaša 56259 eur. Sales, mean = 23064: Povprečna prodaja goriva znaša 23064 eur. Fuel Price, median = 115.5: Do vključno 50% vseh cen goriva je v velikosti do 115,5 eur, preostale cene pa so višje. Temp, max = 30.70: Najvišja izmerjena temperatura je bila 30,7 stopinj celzija
hist(Fueling_sales_at_EuroPet_data$Temp,
main = "TEMPERATURA",
ylab = "FREKVENCA",
xlab = "STOPINJ CELZIJA",
breaks = seq(from = 9, to = 31, by = 1))
Histogram prikazuje frekvenčno razporeditev temperature (v stopnijah
celzija)
t.test(Fueling_sales_at_EuroPet_data$`Fuel Price`,
mu = 110,
alternative = "two.sided")
##
## One Sample t-test
##
## data: Fueling_sales_at_EuroPet_data$`Fuel Price`
## t = 6.6859, df = 100, p-value = 1.328e-09
## alternative hypothesis: true mean is not equal to 110
## 95 percent confidence interval:
## 113.8783 117.1512
## sample estimates:
## mean of x
## 115.5148
library(effectsize)
## Warning: package 'effectsize' was built under R version 4.2.2
effectsize::cohens_d(Fueling_sales_at_EuroPet_data$`Fuel Price`, mu = 110)
## Cohen's d | 95% CI
## ------------------------
## 0.67 | [0.45, 0.88]
##
## - Deviation from a difference of 110.
H0: Povpečna cena goriva = 110 H1: Povprečna cena goriva je različna od 110
Sklep: Na podlagi vzorčnih podatkov zavrnemo H0 pri p<0,001. Ugotavljamo da je povprečna cena goriva višja od 110eur. Velikost učnika je pri tem srednje velika.
Fueling_sales_at_EuroPet_data$diferenca <- Fueling_sales_at_EuroPet_data$TV - Fueling_sales_at_EuroPet_data$Radio
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.2.2
ggplot(Fueling_sales_at_EuroPet_data, aes(x = diferenca)) +
geom_histogram(bindwidth = 4, colour = "Black")
## Warning in geom_histogram(bindwidth = 4, colour = "Black"): Ignoring unknown
## parameters: `bindwidth`
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
ylab("frekvenca")
## $y
## [1] "frekvenca"
##
## attr(,"class")
## [1] "labels"
xlab("diferenca")
## $x
## [1] "diferenca"
##
## attr(,"class")
## [1] "labels"
shapiro.test(Fueling_sales_at_EuroPet_data$diferenca)
##
## Shapiro-Wilk normality test
##
## data: Fueling_sales_at_EuroPet_data$diferenca
## W = 0.64282, p-value = 2.544e-14
H0: Spremenljivka se porazdeljuje normalno H1: Spremenljivka se ne porazdeljuje normalno
Sklep: Zavrnemo H0 pri p<0,001. Ugotavljamo, da je spremenljivka porazdeljena asimetrično v levo.
wilcox.test(Fueling_sales_at_EuroPet_data$TV , Fueling_sales_at_EuroPet_data$Radio,
paired = FALSE,
correct = FALSE, exact = FALSE,
alternative = "two.sided")
##
## Wilcoxon rank sum test
##
## data: Fueling_sales_at_EuroPet_data$TV and Fueling_sales_at_EuroPet_data$Radio
## W = 4214, p-value = 0.01844
## alternative hypothesis: true location shift is not equal to 0
H0: lokaciji porazdelitve sta enaki H1: lokaciji porazdelitve nista enaki
Sklep: Na podlagi vzorčnih podatkov ne moremo zavrniti H0 (p>0,05). Ne moremo trditi da sta lokaciji porazdelitve enaki.Velikost učinka je majhna.
library(effectsize)
cohens_d(Fueling_sales_at_EuroPet_data$diferenca)
## Cohen's d | 95% CI
## --------------------------
## -0.49 | [-0.70, -0.28]
interpret_cohens_d(0,49, rules = "sawilowsky2009")
## [1] "tiny"
## (Rules: sawilowsky2009)