udaje <- read.csv("dataEKONOMETRIA.csv")
udaje
# Skontrolujeme názvy stĺpcov

colnames(udaje)
[1] "Nazov"       "Kategoria"   "Forma"       "ROE"         "ROA"        
[6] "EBIT"        "EBITDAmarza" "M"           "Z"          
# Skontrolujeme štruktúru dát

str(udaje)
'data.frame':   53 obs. of  9 variables:
 $ Nazov      : chr  "Accenture, s.r.o." "Beiersdorf Slovakia, s.r.o." "Beko Manufacturing Slovakia spol. s r.o." "BILLA  s.r.o." ...
 $ Kategoria  : int  3 1 4 5 3 4 4 3 4 4 ...
 $ Forma      : chr  "sro" "sro" "sro" "sro" ...
 $ ROE        : num  0.2702 0.2938 0.6643 0.0956 0.1223 ...
 $ ROA        : num  0.0788 0.0801 0.0553 0.0363 0.0216 ...
 $ EBIT       : chr  "1,250,080.00" "1,072,061.00" "12,586,000.00" "19,677,000.00" ...
 $ EBITDAmarza: num  0.139 0.0339 0.0567 0.0803 0 ...
 $ M          : int  1 2 6 5 6 4 7 0 10 1 ...
 $ Z          : int  0 1 0 3 2 0 4 2 7 0 ...
# Skontrolujeme niekoľko prvých riadkov

head(udaje)
NA
library(ggplot2)

# Scatter plot: vzťah medzi ROA a ROE
ggplot(udaje, aes(x = ROA, y = ROE)) +
  geom_point(color = "steelblue", size = 2) +     # typ grafu – bodový
  theme_minimal() +
  labs(
    title = "Vzťah medzi ROA a ROE",
    x = "Návratnosť aktív (ROA)",
    y = "Návratnosť vlastného kapitálu (ROE)"
  )

library(dplyr)
library(knitr)

# Základné štatistiky ROE podľa kategórie
roe.stats <- udaje %>%
  group_by(Kategoria) %>%
  summarise(
    n      = n(),
    mean   = mean(ROE, na.rm = TRUE),
    sd     = sd(ROE, na.rm = TRUE),
    min    = min(ROE, na.rm = TRUE),
    q25    = quantile(ROE, 0.25, na.rm = TRUE),
    median = median(ROE, na.rm = TRUE),
    q75    = quantile(ROE, 0.75, na.rm = TRUE),
    max    = max(ROE, na.rm = TRUE),
    .groups = "drop"
  )
kable(roe.stats, digits = 2, caption = "Základné štatistiky ukazovateľa ROE podľa kategórie firmy")
Základné štatistiky ukazovateľa ROE podľa kategórie firmy
Kategoria n mean sd min q25 median q75 max
1 4 0.10 0.79 -0.95 -0.16 0.20 0.46 0.94
2 12 0.12 0.78 -1.84 0.03 0.08 0.78 1.00
3 16 0.28 0.26 0.08 0.12 0.18 0.30 0.99
4 19 0.22 0.27 -0.11 0.08 0.13 0.26 1.00
5 2 0.11 0.03 0.10 0.10 0.11 0.12 0.13
# Načítanie knižnice ggplot2

library(ggplot2)

# Boxplot pre ROE podľa kategórie

ggplot(udaje, aes(x = Kategoria, y = ROE)) +
geom_boxplot(fill = "lightblue", color = "darkblue") +
theme_minimal() +
labs(title = "ROE podľa kategórie firmy", x = "Kategória", y = "ROE")

Korelačná matica medzi numerickými premennými

# Korelačná matica medzi numerickými stĺpcami (napr. ROE, ROA, EBIT, Z)

cor_matrix <- cor(udaje[, c("ROE", "ROA", "EBIT", "Z")], use = "complete.obs")
Error in cor(udaje[, c("ROE", "ROA", "EBIT", "Z")], use = "complete.obs") : 
  no complete element pairs
# Skontrolujeme počet NA hodnôt v konkrétnych stĺpcoch

colSums(is.na(udaje[, c("ROE", "ROA", "EBIT", "Z")]))
 ROE  ROA EBIT    Z 
   0    0   53    0 
# Skontrolujeme, či sú stĺpce numerické

str(udaje[, c("ROE", "ROA", "EBIT", "Z")])
'data.frame':   53 obs. of  4 variables:
 $ ROE : num  0.2702 0.2938 0.6643 0.0956 0.1223 ...
 $ ROA : num  0.0788 0.0801 0.0553 0.0363 0.0216 ...
 $ EBIT: num  NA NA NA NA NA NA NA NA NA NA ...
 $ Z   : num  0 1 0 3 2 0 4 2 7 0 ...
# Odstránime stĺpec "EBIT"

udaje_clean <- udaje %>% select(-EBIT)

# Skontrolujeme korelačnú maticu pre zostávajúce stĺpce

cor_matrix <- cor(udaje_clean[, c("ROE", "ROA", "Z")], use = "complete.obs")
print(cor_matrix)
           ROE        ROA          Z
ROE 1.00000000 0.43620558 0.08620608
ROA 0.43620558 1.00000000 0.07900175
Z   0.08620608 0.07900175 1.00000000
# Načítanie knižnice pre vizualizáciu korelácie

library(reshape2)
library(ggplot2)

# Vytvorenie heatmapy korelačnej matice

cor_melt <- melt(cor_matrix)
ggplot(cor_melt, aes(Var1, Var2, fill = value)) +
geom_tile() +
scale_fill_gradient2(low = "blue", high = "red", mid = "white", midpoint = 0, limit = c(-1, 1)) +
theme_minimal() +
labs(title = "Korelačná matica medzi ROE, ROA a Z")

install.packages("reshape2")
trying URL 'http://rspm/default/__linux__/focal/latest/src/contrib/plyr_1.8.9.tar.gz'
trying URL 'http://rspm/default/__linux__/focal/latest/src/contrib/reshape2_1.4.5.tar.gz'

The downloaded source packages are in
    ‘/tmp/RtmpZddUxO/downloaded_packages’
library(dplyr)
library(ggplot2)
library(knitr)
library(kableExtra)
library(broom)

Scatter plot pre ROE a ROA

# Scatter plot medzi ROE a ROA

ggplot(udaje, aes(x = ROE, y = ROA)) +
geom_point() +
theme_minimal() +
labs(title = "Scatter plot medzi ROE a ROA (2013)", x = "ROE", y = "ROA")

Základné štatistiky pre ROE podľa kategórie firmy

# Základné štatistiky pre ROE podľa kategórie

roe.stats <- udaje %>%
group_by(Kategoria) %>%
summarise(
n      = n(),
mean   = mean(ROE, na.rm = TRUE),
sd     = sd(ROE, na.rm = TRUE),
min    = min(ROE, na.rm = TRUE),
q25    = quantile(ROE, 0.25, na.rm = TRUE),
median = median(ROE, na.rm = TRUE),
q75    = quantile(ROE, 0.75, na.rm = TRUE),
max    = max(ROE, na.rm = TRUE),
.groups = "drop"
)

# Vygenerovanie tabuľky s knitr

kable(roe.stats, digits = 2, caption = "Základné štatistiky ROE podľa kategórie firmy")
Základné štatistiky ROE podľa kategórie firmy
Kategoria n mean sd min q25 median q75 max
1 4 0.10 0.79 -0.95 -0.16 0.20 0.46 0.94
2 12 0.12 0.78 -1.84 0.03 0.08 0.78 1.00
3 16 0.28 0.26 0.08 0.12 0.18 0.30 0.99
4 19 0.22 0.27 -0.11 0.08 0.13 0.26 1.00
5 2 0.11 0.03 0.10 0.10 0.11 0.12 0.13
NA
# Štýlovanie tabuľky pomocou kableExtra

roe.stats %>%
kable(digits = 2, caption = "Základné štatistiky ROE podľa kategórie firmy") %>%
kable_styling(full_width = FALSE, bootstrap_options = c("striped", "hover", "condensed")) %>%
column_spec(1, bold = TRUE) %>%
row_spec(0, bold = TRUE, background = "#f2f2f2") %>%
add_header_above(c(" " = 2, "ROE Statistics" = 7))
Základné štatistiky ROE podľa kategórie firmy
ROE Statistics
Kategoria n mean sd min q25 median q75 max
1 4 0.10 0.79 -0.95 -0.16 0.20 0.46 0.94
2 12 0.12 0.78 -1.84 0.03 0.08 0.78 1.00
3 16 0.28 0.26 0.08 0.12 0.18 0.30 0.99
4 19 0.22 0.27 -0.11 0.08 0.13 0.26 1.00
5 2 0.11 0.03 0.10 0.10 0.11 0.12 0.13
NA

T-test pre porovnanie ROE medzi dvoma kategóriami Lineárna regresia na predikciu ROE (napr. na základe ROA a Z(zeny vo vedeni firiem))

# Lineárna regresia na predikciu ROE

model <- lm(ROE ~ ROA + Z, data = udaje)
summary(model)

Call:
lm(formula = ROE ~ ROA + Z, data = udaje)

Residuals:
     Min       1Q   Median       3Q      Max 
-2.30969 -0.05167 -0.01887  0.03302  0.80426 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)   
(Intercept)  0.04212    0.08744   0.482  0.63208   
ROA          1.50572    0.44411   3.390  0.00137 **
Z            0.01294    0.03167   0.409  0.68460   
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.4221 on 50 degrees of freedom
Multiple R-squared:  0.193, Adjusted R-squared:  0.1607 
F-statistic: 5.978 on 2 and 50 DF,  p-value: 0.004702

Zobrazenie regresných koeficientov

# Regresné koeficienty s knižnicou broom

coef.tbl <- tidy(model, conf.int = TRUE) %>%
mutate(
term = recode(term,
"(Intercept)" = "Intercept",
"ROA" = "Return on Assets",
"Z" = "Z"
),
stars = case_when(
p.value < 0.001 ~ "***",
p.value < 0.01  ~ "**",
p.value < 0.05  ~ "*",
p.value < 0.1   ~ "·",
TRUE            ~ ""
)
) %>%
transmute(
Term = term,
Estimate = estimate,
`Std. Error` = std.error,
`t value` = statistic,
`p value` = p.value,
`95% CI` = str_c("[", round(conf.low, 3), ", ", round(conf.high, 3), "]"),
Sig = stars
)
Error in `transmute()`:
ℹ In argument: `95% CI = str_c("[", round(conf.low, 3), ", ",
  round(conf.high, 3), "]")`.
Caused by error in `str_c()`:
! could not find function "str_c"
Run `]8;;x-r-run:rlang::last_trace()rlang::last_trace()]8;;` to see where the error occurred.
# Načítanie knižnice stringr

library(stringr)
# Regresné koeficienty s knižnicou broom

coef.tbl <- tidy(model, conf.int = TRUE) %>%
mutate(
term = recode(term,
"(Intercept)" = "Intercept",
"ROA" = "Return on Assets",
"Z" = "Z"
),
stars = case_when(
p.value < 0.001 ~ "***",
p.value < 0.01  ~ "**",
p.value < 0.05  ~ "*",
p.value < 0.1   ~ "·",
TRUE            ~ ""
)
) %>%
transmute(
Term = term,
Estimate = estimate,
`Std. Error` = std.error,
`t value` = statistic,
`p value` = p.value,
`95% CI` = str_c("[", round(conf.low, 3), ", ", round(conf.high, 3), "]"),
Sig = stars
)

# Tabuľka s regresnými koeficientmi

coef.tbl %>%
kable(digits = 3, caption = "OLS Regression Coefficients") %>%
kable_styling(full_width = FALSE, bootstrap_options = c("striped", "hover", "condensed")) %>%
column_spec(1, bold = TRUE) %>%
row_spec(0, bold = TRUE, background = "#f2f2f2") %>%
footnote(
general = "Signif. codes: *** p<0.001, ** p<0.01, * p<0.05, · p<0.1.",
threeparttable = TRUE
)
OLS Regression Coefficients
Term Estimate Std. Error t value p value 95% CI Sig
Intercept 0.042 0.087 0.482 0.632 [-0.133, 0.218]
Return on Assets 1.506 0.444 3.390 0.001 [0.614, 2.398] **
Z 0.013 0.032 0.409 0.685 [-0.051, 0.077]
Note:
Signif. codes: *** p<0.001, ** p<0.01, * p<0.05, · p<0.1.
NA

Vykonali sme lineárnu regresiu, kde ROE (Return on Equity) bola závislá na Return on Assets (ROA), podieli žien vo vedení (Z) a konštante (Intercept). Tu sú hlavné zistenia:

Intercept (Konštanta):

Odhad: 0.042

P-hodnota: 0.632, čo naznačuje, že konštanta nie je štatisticky významná.

Return on Assets (ROA):

Odhad: 1.506 – znamená, že pre každú jednotkovú zmenu ROA sa ROE zmení o 1.506 jednotiek, pričom všetky ostatné faktory sú konstantné.

P-hodnota: 0.001 – je pod prahom 0.05, čo znamená, že ROA je štatisticky významný prediktor pre ROE.

95% interval spoľahlivosti: [0.614, 2.398] – s 95% istotou vieme povedať, že skutočný efekt ROA na ROE sa nachádza v tomto intervale.

Podiel žien vo vedení (Z):

Odhad: 0.013 – znamená, že zvýšenie podielu žien vo vedení o 1 jednotku (t.j. o 100 %) spôsobí nárast ROE o 0.013.

P-hodnota: 0.685 – je vyššia než 0.05, čo naznačuje, že podiel žien vo vedení (Z) nie je štatisticky významný prediktor pre ROE v tomto modeli.

95% interval spoľahlivosti: [-0.051, 0.077] – tento interval zahŕňa nulu, čo znamená, že môžeme byť náchylní k záveru, že podiel žien vo vedení nemá výrazný vplyv na ROE.

Interpretácia:

ROA (Return on Assets) má silný a štatisticky významný vplyv na ROE, pričom vyššia efektívnosť aktív (ROA) vedie k vyššiemu ROE.

Podiel žien vo vedení (Z) nemá štatisticky významný vplyv na ROE v tomto modeli. Hoci odhad ukazuje pozitívny vplyv, výsledky p-hodnoty a interval spoľahlivosti naznačujú, že tento vplyv nie je dostatočne silný na to, aby bol považovaný za štatisticky významný.

Intercept (konštanta) je štatisticky nevýznamný, čo znamená, že nulová hodnota nezávislých premenných nezaručuje významnú hodnotu ROE.

