Pro článek na webu Českoho rozhlasu: https://www.irozhlas.cz/zpravy-domov/nejrychleji-netolerance-roste-v-obcich-do-dvou-tisic-obyvatel-a-mezi-ucni-ve_1801170600_jab. Konkrétně jde o graf “vedle koho byste nebydleli - podle politické strany”.
Graf na první pohled ukazuje rozdíly mezi průměrnými preferencemi voličů SPD a ANO, téměř všechny v “očekávaném” směru.
Voličů SPD ale bylo ve vzorku relativně málo, takže je potřeba se zajímat, jestli rozdíly nejsou jen statistický šum, neboli jestli bychom je nemohli v datech (výběru) pozorovat, i kdyby v populaci ve skutečnosti žádný rozdíl neexistoval.
Vycházím z informace, že ve vzorku bylo 34 voličů SPD a 204 voličů ANO.
Kód níže počítá interval spolehlivosti na hladině 95 % pro rozdíl mezi podílem voličů ANO a podílem voličů SPD, kteří odpověděli kladně. Výpočet je pro srovnání všech možných podílů u dvou stran, s krokem po 0.05.
p <- seq(0.1, 1, 0.05)
spd <- expand.grid(podilSPD = p, podilANO = p) %>% # kombinace podilu negativnich u obou stran
mutate(pocetANO = 204,
pocetSPD = 34,
stderrSPD = sqrt(podilSPD*(1-podilSPD)/pocetSPD),
stderrANO = sqrt(podilANO*(1-podilANO)/pocetANO)) %>%
mutate(rozdil = podilSPD - podilANO,
stderr_rozdilu = sqrt(stderrSPD^2 + stderrANO^2),
confint95_rozdilu = 1.96*stderr_rozdilu,
rozdilvetsinezconfint95rozdilu = abs(rozdil) > confint95_rozdilu) %>%
mutate_all(round, 3)
V grafu níže se po najetí myši ukážou data a výsledky statistického testu pro danou kombinaci podílů kladných odpovědí mezi voliči SPD a ANO.
Obecně rozdíly menší než cca 20 procentních bodů nejsou statisticky významné na běžné hladině 95 %, tj. nemůžeme si na této hladině být jistí tím, že by se v datech takový rozdíl neukázal, i kdyby v populaci žádný nebyl.
Konkrétně u většiny charakteristik zmiňovaných v textu (“vůči drogově závislým, alkoholikům, exkriminálníkům a psychicky nemocným jsou [voliči SPD] mírně tolerantnější než voliči ostatních stran”) není rozdíl statisticky významný; naopak významné nejspíš budou ty odpovědi, kde voliči SPD výrazně vybočují v opačném směru: nechuť bydlet vedle cizinců, lidí jiné barvy pleti nebo jiného náboženství.
Text ale mluví o srovnání mezi voliči SPD a voliči ostatních stran, zatímco zde (pro přehlednost) srovnáváme voliče SPD a ANO. Srovnání se všemi stranami by vyžadovalo další práci s daty nad rámec toho, co je patrné z článku, ale základní výsledek by se nezměnil, protože voličů SPD je ve vzorku málo, proto je i nespolehlivý odhad podílu jejich voličů, kteří by nechtěli bydlet vedle členů té či oné menšiny.
V tabulce je možné najít, u kterých kombinací podílů mezi voliči těchto dvou stran můžeme na hladině spolehlivosti 95 % říct, že se od sebe podíly statisticky významně liší.