knitr::opts_chunk$set(
  echo = TRUE,
  message = FALSE,
  warning = FALSE
)

Výber databázy: Eurostat – mesačná miera nezamestnanosti

V tomto cvičení som si zvolila databázu Eurostat – Unemployment rate (une_rt_m),
ktorá obsahuje mesačné údaje o miere nezamestnanosti v jednotlivých krajinách Európskej únie.
Tieto údaje sú zoradené v čase, a preto sa výborne hodia na analýzu trendov v ekonomike.

Zdroj dát: Eurostat – Unemployment rate (une_rt_m)


Načítanie knižníc

library(tidyverse)
library(readr)
library(ggplot2)
library(knitr)
library(kableExtra)

Import údajov

Dáta z Eurostatu je možné exportovať vo formáte .csv.
V tomto príklade simulujeme načítanie takéhoto súboru (napr. uloženého v priečinku udaje/).

# Príklad importu CSV súboru
# (v prípade potreby uprav cestu k súboru podľa uloženia)
# udaje <- read_csv("udaje/une_rt_m.csv")

# Pre ukážku vytvoríme jednoduchú tabuľku s podobnou štruktúrou
udaje <- data.frame(
  Mesiac = rep(c("2023-01", "2023-02", "2023-03", "2023-04", "2023-05", "2023-06"), 3),
  Krajina = rep(c("Slovakia", "Czechia", "Poland"), each = 6),
  Nezamestnanost = c(5.8, 5.7, 5.6, 5.6, 5.5, 5.4,
                     2.5, 2.4, 2.4, 2.3, 2.3, 2.2,
                     2.8, 2.8, 2.7, 2.6, 2.6, 2.6)
)
head(udaje)
##    Mesiac  Krajina Nezamestnanost
## 1 2023-01 Slovakia            5.8
## 2 2023-02 Slovakia            5.7
## 3 2023-03 Slovakia            5.6
## 4 2023-04 Slovakia            5.6
## 5 2023-05 Slovakia            5.5
## 6 2023-06 Slovakia            5.4

Základný popis údajov

summary(udaje)
##     Mesiac            Krajina          Nezamestnanost 
##  Length:18          Length:18          Min.   :2.200  
##  Class :character   Class :character   1st Qu.:2.425  
##  Mode  :character   Mode  :character   Median :2.650  
##                                        Mean   :3.544  
##                                        3rd Qu.:5.475  
##                                        Max.   :5.800

Vizualizácia dát – trend nezamestnanosti

Na vizualizáciu použijeme knižnicu ggplot2.
Z grafu bude viditeľný vývoj miery nezamestnanosti v čase pre vybrané krajiny.

ggplot(udaje, aes(x = Mesiac, y = Nezamestnanost, color = Krajina, group = Krajina)) +
  geom_line(size = 1.2) +
  geom_point(size = 2) +
  labs(title = "Vývoj miery nezamestnanosti (Eurostat – une_rt_m)",
       x = "Mesiac",
       y = "Miera nezamestnanosti (%)",
       color = "Krajina") +
  theme_minimal()


Základné štatistiky

Z tabuľky vieme získať napríklad priemernú nezamestnanosť podľa krajiny:

udaje %>%
  group_by(Krajina) %>%
  summarise(
    Priemer = mean(Nezamestnanost),
    Minimum = min(Nezamestnanost),
    Maximum = max(Nezamestnanost)
  ) %>%
  kable(caption = "Základné štatistiky miery nezamestnanosti podľa krajiny") %>%
  kable_styling(bootstrap_options = c("striped", "hover", "condensed"), full_width = FALSE)
Základné štatistiky miery nezamestnanosti podľa krajiny
Krajina Priemer Minimum Maximum
Czechia 2.350000 2.2 2.5
Poland 2.683333 2.6 2.8
Slovakia 5.600000 5.4 5.8

Záver

V tomto cvičení som si vyskúšala prácu s ekonomickými údajmi z databázy Eurostat.
Zvolila som tému nezamestnanosť, ktorá je dôležitým ukazovateľom vývoja ekonomiky.
Údaje sú zoradené v čase, čo umožňuje sledovať trendy a zmeny v jednotlivých krajinách.
Vďaka R som si precvičila načítanie údajov, výpočet základných štatistík a tvorbu jednoduchého grafu.

Na dnes je to odo mňa všetko, naučila som sa niečo nové a teším sa na ďalšie zadania.