load("m3.RData") # Podzimní sběr výkazu M3 2022
spojene_m3_pri_vice_budovach <- m3 %>%
group_by(KodObce, Izo) %>%
mutate(
ZaciSVP = sum(ZaciSVP),
ZaciCelkem = sum(ZaciCelkem)
) %>%
distinct(KodObce, Izo, .keep_all = TRUE)
rozsirene_m3 <- spojene_m3_pri_vice_budovach %>%
mutate(
PomerZakuSVP = ZaciSVP / ZaciCelkem
)
souhrn_po_mestech <- rozsirene_m3 %>%
group_by(KodObce) %>%
filter(OrganizaceSkoly == 1, DruhZrizovatele %in% c(2, 5, 6)) %>% # Vyfiltrování pouze běžných a úplných škol
summarize(
PomerZakuSVP_Mean = mean(PomerZakuSVP), # Výpočet průměrného počtu žáků se SVP na školách
PomerZakuSVP_SD = sd(PomerZakuSVP), # Výpočet směrodatné odchylky pro město
ZaciCelkem = sum(ZaciCelkem),
ZaciSVP = sum(ZaciSVP),
NazevObce = first(MistoVyuky),
PocetSkol = n()
) %>%
filter(PocetSkol > 1) # Pouze města s více než jednou školní budovou
percentil_high <- quantile(souhrn_po_mestech$PomerZakuSVP_SD, 0.95)
mesta_nejvyssi_odchylka <- souhrn_po_mestech %>% filter(PomerZakuSVP_SD > percentil_high)
mesta_nejvyssi_odchylka <- mesta_nejvyssi_odchylka[order(-mesta_nejvyssi_odchylka$PomerZakuSVP_SD), ]
Města od 95. percentilu:
print(mesta_nejvyssi_odchylka[, c("NazevObce", "PomerZakuSVP_SD", "PocetSkol")])
## # A tibble: 12 × 3
## NazevObce PomerZakuSVP_SD PocetSkol
## <chr> <dbl> <int>
## 1 Žatec 0.333 5
## 2 Litvínov 0.203 6
## 3 Mladá Boleslav 0.184 10
## 4 Kamenice 0.154 2
## 5 Jihlava 0.151 12
## 6 Bohumín 0.143 6
## 7 Studénka 0.129 3
## 8 Kladno 0.124 19
## 9 Mnichovice 0.123 2
## 10 Děčín 0.113 12
## 11 Bílina 0.112 3
## 12 Sezimovo Ústí 0.111 2