有名な話なので、ググると見つかると思うが、簡単なので自分で証明してみました。

定理

二値変数で一方のカテゴリに1、他方に 0 を割り当てて、1をとる比率を \(p\) とすると、この二値変数の分散は \(p(1-p)\) となる

証明

この二値変数を \(x_i \;(i = 1, \; 2, \; \ldots , \; N)\) とする。この分散を\(v^2\)とすると、 \[ \begin{align} v^2 &= \frac{\sum_{i = 1}^N (x_i - p)^2}{N}\\ &= \frac{ (0 - p)^2 + \cdots, \; + (0 - p)^2 \quad + \quad (1 - p)^2 + \cdots, \; + (1 - p)^2}{N} \end{align} \] である。\(Np\) 人が \(1\)\(N(1-p)\) 人が \(0\)をとるので、上の式は \[ \begin{align} v^2 &= \frac{N(1- p) (0-p)^2 + N p (1-p) ^2}{N} \\ & = \frac{N(1- p) p^2 + N p (1-p) ^2}{N} \\ & = (1- p) p^2 + p (1-p) ^2 \\ & = (1- p) p ( p + 1-p) \\ & = (1- p) p \end{align} \] となる。以上で証明終わり。