Zdroje dat

load("m3.RData") # Podzimní sběr výkazu M3 2022

Příprava dat

spojene_m3_pri_vice_budovach <- m3 %>%
  group_by(KodObce, Izo) %>%
  mutate(
    ZaciSVP = sum(ZaciSVP),
    ZaciCelkem = sum(ZaciCelkem)
  ) %>%
  distinct(KodObce, Izo, .keep_all = TRUE)

rozsirene_m3 <- spojene_m3_pri_vice_budovach %>%
  mutate(
    PomerZakuSVP = ZaciSVP / ZaciCelkem
  )

souhrn_po_mestech <- rozsirene_m3 %>% 
  group_by(KodObce) %>%
  filter(OrganizaceSkoly == 1, DruhZrizovatele %in% c(2, 5, 6)) %>% # Vyfiltrování pouze běžných a úplných škol
  summarize(
    PomerZakuSVP_Mean = mean(PomerZakuSVP), # Výpočet průměrného počtu žáků se SVP na školách
    PomerZakuSVP_SD = sd(PomerZakuSVP), # Výpočet směrodatné odchylky pro město
    ZaciCelkem = sum(ZaciCelkem),
    ZaciSVP = sum(ZaciSVP),
    NazevObce = first(MistoVyuky),
    PocetSkol = n()
    ) %>%
  filter(PocetSkol > 1) # Pouze města s více než jednou školní budovou

Výpočet hranice horniho percentilu

percentil_high <- quantile(souhrn_po_mestech$PomerZakuSVP_SD, 0.95)
mesta_nejvyssi_odchylka <- souhrn_po_mestech %>% filter(PomerZakuSVP_SD > percentil_high)
mesta_nejvyssi_odchylka <- mesta_nejvyssi_odchylka[order(-mesta_nejvyssi_odchylka$PomerZakuSVP_SD), ]

Města od 95. percentilu:

print(mesta_nejvyssi_odchylka[, c("NazevObce", "PomerZakuSVP_SD", "PocetSkol")])
## # A tibble: 12 × 3
##    NazevObce      PomerZakuSVP_SD PocetSkol
##    <chr>                    <dbl>     <int>
##  1 Žatec                    0.333         5
##  2 Litvínov                 0.203         6
##  3 Mladá Boleslav           0.184        10
##  4 Kamenice                 0.154         2
##  5 Jihlava                  0.151        12
##  6 Bohumín                  0.143         6
##  7 Studénka                 0.129         3
##  8 Kladno                   0.124        19
##  9 Mnichovice               0.123         2
## 10 Děčín                    0.113        12
## 11 Bílina                   0.112         3
## 12 Sezimovo Ústí            0.111         2

Vykreslení dat