library(readxl)
## Warning: package 'readxl' was built under R version 4.2.2
Fueling_sales_at_EuroPet_data <- read_xlsx("Fueling_sales_at_EuroPet_data.xlsx")
head(Fueling_sales_at_EuroPet_data)
## # A tibble: 6 × 10
##    Week Sales    TV Radio `Fuel Volume` `Fuel Price`  Temp  Prec Holiday Visit…¹
##   <dbl> <dbl> <dbl> <dbl>         <dbl>        <dbl> <dbl> <dbl>   <dbl>   <dbl>
## 1    26 24864  74.5  66.5         61825         104.  27.9   0.9       1     7  
## 2    27 23809  74.5  66.5         62617         104.  27.7   1.3       1     7  
## 3    28 24476  90    75           60227         107.  29.1   4.8       1     5.9
## 4    29 25279  90    75           63273         112.  30     3.1       1     5.9
## 5    30 26263  90    75           65196         109.  29.3   0         1     5.9
## 6    31 24299  90    75           64789         105.  28.1   3.6       1     5.9
## # … with abbreviated variable name ¹​`Visits (1 or 2)`

Opis spremenljivk:

Week: teden v letu Sales: prodaja po tednih v trgovinicah (v eur) TV: izdatki za oglaševanje po televiziji (v eur) Radio: izdatki za oglaševanje po radiu (v eur) Fuel Volume: količina goriva (v litrih) Fuel Price: cena goriva (v eur) Temp: temperatura zraka (v °C) Prec: količina padavin (v ml) Holiday: počitnice - (1 yes), (2 no) Visits (1 or 2): povprečno število obiskov

Vir podatkov: Upravljalna ekonomika, seminar 8

Cilji analize podatkov: - Določiti minimalne, maksimalne in povprečne vrednosti spremenljivk. - S pomočjo regresijske analize proučiti povezavo med SALES in FUEL VOLUME ter ugotoviti ali je povezava statistično značilna. - S pomočjo regresijske analize analizirati povezavo med SALES in TV ter RADIO ter ugotoviti ali je statistično značilen vpliv. - Ugotoviti ali se oglaševanje splača (ugotoviti neto učinek). - Primerjati rezultate regresije, ko vključimo še temperaturo kot dodatno spremenljivko. - Narediti regresijsko analizo, kjer vključimo vse spremenljivke (razen WEEKS). - Interpretirati koeficiente s statističnega in ekonomskega vidika. - Ugotoviti ali je oglaševanje po vključitvi vseh spremenljiv dobičkonosno. - Analizirati spremembe R^2 med različnimi regresijami.

factor(Fueling_sales_at_EuroPet_data$Holiday,
          levels = c(1, 0),
          labels = c("DA", "NE"))
##   [1] DA DA DA DA DA DA DA DA DA DA DA NE NE NE NE NE NE DA DA DA NE NE NE NE NE
##  [26] DA DA DA NE NE NE NE NE NE NE DA DA NE NE NE NE DA DA DA DA DA DA NE NE NE
##  [51] NE NE NE DA DA DA DA DA DA DA DA DA NE NE NE NE NE NE NE DA DA DA NE NE NE
##  [76] NE NE NE DA DA NE NE NE NE NE NE DA DA DA NE NE NE NE DA DA DA DA DA NE NE
## [101] NE
## Levels: DA NE
summary(Fueling_sales_at_EuroPet_data)
##       Week           Sales             TV             Radio       
##  Min.   : 1.00   Min.   :18969   Min.   :  0.00   Min.   :  0.00  
##  1st Qu.:13.00   1st Qu.:21171   1st Qu.:  0.00   1st Qu.:  0.00  
##  Median :27.00   Median :22924   Median :  0.00   Median :  0.00  
##  Mean   :26.57   Mean   :23064   Mean   : 41.28   Mean   : 80.47  
##  3rd Qu.:40.00   3rd Qu.:24489   3rd Qu.: 70.00   3rd Qu.:205.00  
##  Max.   :52.00   Max.   :28451   Max.   :225.00   Max.   :260.00  
##   Fuel Volume      Fuel Price         Temp            Prec      
##  Min.   :56259   Min.   :101.5   Min.   : 9.10   Min.   : 0.00  
##  1st Qu.:61754   1st Qu.:108.0   1st Qu.:12.00   1st Qu.: 6.20  
##  Median :63136   Median :115.5   Median :16.80   Median :10.90  
##  Mean   :62853   Mean   :115.5   Mean   :17.95   Mean   :11.34  
##  3rd Qu.:64637   3rd Qu.:120.9   3rd Qu.:23.10   3rd Qu.:14.50  
##  Max.   :68549   Max.   :133.7   Max.   :30.70   Max.   :30.30  
##     Holiday       Visits (1 or 2) 
##  Min.   :0.0000   Min.   : 0.000  
##  1st Qu.:0.0000   1st Qu.: 3.200  
##  Median :0.0000   Median : 6.000  
##  Mean   :0.4653   Mean   : 5.642  
##  3rd Qu.:1.0000   3rd Qu.: 7.000  
##  Max.   :1.0000   Max.   :12.500

Fuel Volume, min = 56259: Najnižja natankana količina goriva znaša 56259 eur. Sales, mean = 23064: Povprečna prodaja goriva znaša 23064 eur. Fuel Price, median = 115.5: Do vključno 50% vseh cen goriva je v velikosti do 115,5 eur, preostale cene pa so višje. Temp, max = 30.70: Najvišja izmerjena temperatura je bila 30,7 stopinj celzija

hist(Fueling_sales_at_EuroPet_data$Temp,
     main = "TEMPERATURA",
     ylab = "FREKVENCA",
     xlab = "STOPINJ CELZIJA",
     breaks = seq(from = 9, to = 31, by = 1))

Histogram prikazuje frekvenčno razporeditev temperature (v stopnijah celzija)

t.test(Fueling_sales_at_EuroPet_data$`Fuel Price`,
       mu = 110,
       alternative = "two.sided")
## 
##  One Sample t-test
## 
## data:  Fueling_sales_at_EuroPet_data$`Fuel Price`
## t = 6.6859, df = 100, p-value = 1.328e-09
## alternative hypothesis: true mean is not equal to 110
## 95 percent confidence interval:
##  113.8783 117.1512
## sample estimates:
## mean of x 
##  115.5148
library(effectsize)
## Warning: package 'effectsize' was built under R version 4.2.2
effectsize::cohens_d(Fueling_sales_at_EuroPet_data$`Fuel Price`, mu = 110)
## Cohen's d |       95% CI
## ------------------------
## 0.67      | [0.45, 0.88]
## 
## - Deviation from a difference of 110.

H0: Povpečna cena goriva = 110 H1: Povprečna cena goriva je različna od 110

Sklep: Na podlagi vzorčnih podatkov zavrnemo H0 pri p<0,001. Ugotavljamo da je povprečna cena goriva višja od 110eur. Velikost učnika je pri tem srednje velika.

Fueling_sales_at_EuroPet_data$diferenca <- Fueling_sales_at_EuroPet_data$TV - Fueling_sales_at_EuroPet_data$Radio

library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.2.2
ggplot(Fueling_sales_at_EuroPet_data, aes(x = diferenca)) +
  geom_histogram(bindwidth = 4, colour = "Black")
## Warning in geom_histogram(bindwidth = 4, colour = "Black"): Ignoring unknown
## parameters: `bindwidth`
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

ylab("frekvenca")
## $y
## [1] "frekvenca"
## 
## attr(,"class")
## [1] "labels"
xlab("diferenca")
## $x
## [1] "diferenca"
## 
## attr(,"class")
## [1] "labels"
shapiro.test(Fueling_sales_at_EuroPet_data$diferenca)
## 
##  Shapiro-Wilk normality test
## 
## data:  Fueling_sales_at_EuroPet_data$diferenca
## W = 0.64282, p-value = 2.544e-14

H0: Spremenljivka se porazdeljuje normalno H1: Spremenljivka se ne porazdeljuje normalno

Sklep: Zavrnemo H0 pri p<0,001. Ugotavljamo, da je spremenljivka porazdeljena asimetrično v levo.

wilcox.test(Fueling_sales_at_EuroPet_data$TV , Fueling_sales_at_EuroPet_data$Radio,
            paired = FALSE,
            correct = FALSE, exact = FALSE,
            alternative = "two.sided")
## 
##  Wilcoxon rank sum test
## 
## data:  Fueling_sales_at_EuroPet_data$TV and Fueling_sales_at_EuroPet_data$Radio
## W = 4214, p-value = 0.01844
## alternative hypothesis: true location shift is not equal to 0

H0: lokaciji porazdelitve sta enaki H1: lokaciji porazdelitve nista enaki

Sklep: Na podlagi vzorčnih podatkov ne moremo zavrniti H0 (p>0,05). Ne moremo trditi da sta lokaciji porazdelitve enaki.Velikost učinka je majhna.

library(effectsize)
cohens_d(Fueling_sales_at_EuroPet_data$diferenca)
## Cohen's d |         95% CI
## --------------------------
## -0.49     | [-0.70, -0.28]
interpret_cohens_d(0,49, rules = "sawilowsky2009")
## [1] "tiny"
## (Rules: sawilowsky2009)