Pro článek na webu Českoho rozhlasu: https://www.irozhlas.cz/zpravy-domov/nejrychleji-netolerance-roste-v-obcich-do-dvou-tisic-obyvatel-a-mezi-ucni-ve_1801170600_jab. Konkrétně jde o graf “vedle koho byste nebydleli - podle politické strany”.

Graf na první pohled ukazuje rozdíly mezi průměrnými preferencemi voličů SPD a ANO, téměř všechny v “očekávaném” směru.

Voličů SPD ale bylo ve vzorku relativně málo, takže je potřeba se zajímat, jestli rozdíly nejsou jen statistický šum, neboli jestli bychom je nemohli v datech (výběru) pozorovat, i kdyby v populaci ve skutečnosti žádný rozdíl neexistoval.

Vycházím z informace, že ve vzorku bylo 34 voličů SPD a 204 voličů ANO.

Kód níže počítá interval spolehlivosti na hladině 95 % pro rozdíl mezi podílem voličů ANO a podílem voličů SPD, kteří odpověděli kladně. Výpočet je pro srovnání všech možných podílů u dvou stran, s krokem po 0.05.

p <- seq(0.1, 1, 0.05)

spd <- expand.grid(podilSPD = p, podilANO = p) %>% # kombinace podilu negativnich u obou stran
  mutate(pocetANO = 204,
         pocetSPD = 34,
         stderrSPD = sqrt(podilSPD*(1-podilSPD)/pocetSPD),
         stderrANO = sqrt(podilANO*(1-podilANO)/pocetANO)) %>% 
  mutate(rozdil = podilSPD - podilANO,
         stderr_rozdilu = sqrt(stderrSPD^2 + stderrANO^2),
         confint95_rozdilu = 1.96*stderr_rozdilu,
         rozdilvetsinezconfint95rozdilu = abs(rozdil) > confint95_rozdilu) %>%  
  mutate_all(round, 3)

V grafu níže se po najetí myši ukážou data a výsledky statistického testu pro danou kombinaci podílů kladných odpovědí mezi voliči SPD a ANO.

Obecně rozdíly menší než cca 20 procentních bodů nejsou statisticky významné na běžné hladině 95 %, tj. nemůžeme si na této hladině být jistí tím, že by se v datech takový rozdíl neukázal, i kdyby v populaci žádný nebyl.

Konkrétně u většiny charakteristik zmiňovaných v textu (“vůči drogově závislým, alkoholikům, exkriminálníkům a psychicky nemocným jsou [voliči SPD] mírně tolerantnější než voliči ostatních stran”) není rozdíl statisticky významný; naopak významné nejspíš budou ty odpovědi, kde voliči SPD výrazně vybočují v opačném směru: nechuť bydlet vedle cizinců, lidí jiné barvy pleti nebo jiného náboženství.

Text ale mluví o srovnání mezi voliči SPD a voliči ostatních stran, zatímco zde (pro přehlednost) srovnáváme voliče SPD a ANO. Srovnání se všemi stranami by vyžadovalo další práci s daty nad rámec toho, co je patrné z článku, ale základní výsledek by se nezměnil, protože voličů SPD je ve vzorku málo, proto je i nespolehlivý odhad podílu jejich voličů, kteří by nechtěli bydlet vedle členů té či oné menšiny.

V tabulce je možné najít, u kterých kombinací podílů mezi voliči těchto dvou stran můžeme na hladině spolehlivosti 95 % říct, že se od sebe podíly statisticky významně liší.