knitr::opts_chunk$set(
echo = TRUE,
message = FALSE,
warning = FALSE
)
V tomto cvičení som si zvolila databázu Eurostat –
Unemployment rate (une_rt_m),
ktorá obsahuje mesačné údaje o miere nezamestnanosti v
jednotlivých krajinách Európskej únie.
Tieto údaje sú zoradené v čase, a preto sa výborne
hodia na analýzu trendov v ekonomike.
Zdroj dát: Eurostat – Unemployment rate (une_rt_m)
library(tidyverse)
library(readr)
library(ggplot2)
library(knitr)
library(kableExtra)
Dáta z Eurostatu je možné exportovať vo formáte
.csv.
V tomto príklade simulujeme načítanie takéhoto súboru (napr. uloženého v
priečinku udaje/).
# Príklad importu CSV súboru
# (v prípade potreby uprav cestu k súboru podľa uloženia)
# udaje <- read_csv("udaje/une_rt_m.csv")
# Pre ukážku vytvoríme jednoduchú tabuľku s podobnou štruktúrou
udaje <- data.frame(
Mesiac = rep(c("2023-01", "2023-02", "2023-03", "2023-04", "2023-05", "2023-06"), 3),
Krajina = rep(c("Slovakia", "Czechia", "Poland"), each = 6),
Nezamestnanost = c(5.8, 5.7, 5.6, 5.6, 5.5, 5.4,
2.5, 2.4, 2.4, 2.3, 2.3, 2.2,
2.8, 2.8, 2.7, 2.6, 2.6, 2.6)
)
head(udaje)
## Mesiac Krajina Nezamestnanost
## 1 2023-01 Slovakia 5.8
## 2 2023-02 Slovakia 5.7
## 3 2023-03 Slovakia 5.6
## 4 2023-04 Slovakia 5.6
## 5 2023-05 Slovakia 5.5
## 6 2023-06 Slovakia 5.4
summary(udaje)
## Mesiac Krajina Nezamestnanost
## Length:18 Length:18 Min. :2.200
## Class :character Class :character 1st Qu.:2.425
## Mode :character Mode :character Median :2.650
## Mean :3.544
## 3rd Qu.:5.475
## Max. :5.800
Na vizualizáciu použijeme knižnicu ggplot2.
Z grafu bude viditeľný vývoj miery nezamestnanosti v čase pre vybrané
krajiny.
ggplot(udaje, aes(x = Mesiac, y = Nezamestnanost, color = Krajina, group = Krajina)) +
geom_line(size = 1.2) +
geom_point(size = 2) +
labs(title = "Vývoj miery nezamestnanosti (Eurostat – une_rt_m)",
x = "Mesiac",
y = "Miera nezamestnanosti (%)",
color = "Krajina") +
theme_minimal()
Z tabuľky vieme získať napríklad priemernú nezamestnanosť podľa krajiny:
udaje %>%
group_by(Krajina) %>%
summarise(
Priemer = mean(Nezamestnanost),
Minimum = min(Nezamestnanost),
Maximum = max(Nezamestnanost)
) %>%
kable(caption = "Základné štatistiky miery nezamestnanosti podľa krajiny") %>%
kable_styling(bootstrap_options = c("striped", "hover", "condensed"), full_width = FALSE)
| Krajina | Priemer | Minimum | Maximum |
|---|---|---|---|
| Czechia | 2.350000 | 2.2 | 2.5 |
| Poland | 2.683333 | 2.6 | 2.8 |
| Slovakia | 5.600000 | 5.4 | 5.8 |
V tomto cvičení som si vyskúšala prácu s ekonomickými údajmi z
databázy Eurostat.
Zvolila som tému nezamestnanosť, ktorá je dôležitým
ukazovateľom vývoja ekonomiky.
Údaje sú zoradené v čase, čo umožňuje sledovať trendy a zmeny v
jednotlivých krajinách.
Vďaka R som si precvičila načítanie údajov, výpočet základných štatistík
a tvorbu jednoduchého grafu.
Na dnes je to odo mňa všetko, naučila som sa niečo nové a teším sa na ďalšie zadania.