Considere \((X_1,X_2, \ldots, X_{17})\) uma amostra aleatória simples (AAS), cujo tamanho é \(n=17\), da distribuição normal com média \(\mu \in R\) e desvio padrão \(\sigma=2\). Sejam
\[ \begin{align} S^2=\frac{1}{n-1}\sum\limits_{i=1}^{n}(X_i-\overline{X})^2 \quad \text{e} \quad \overline{X}= \frac{1}{n}\sum\limits_{i=1}^{n}X_i \end{align} \] variância e média amostrais, respectivamente. Por meio de funções características (fc) ou por Função Geradora de Momentos (FGM), podemos mostrar que \[ \frac{(n-1)S^2}{\sigma^2} \sim \chi_{(n-1)}^{2}. \] Com isso, \[ E\bigg[\frac{(n-1)S^2}{\sigma^2}\bigg]=n-1 \quad \wedge \quad Var\bigg[\frac{(n-1)S^2}{\sigma^2}\bigg] =2(n-1) \quad \implies \quad E[S^2]=\sigma^2 \quad \wedge \quad Var[S^2]=\frac{2\sigma^4}{n-1}. \] Agora, pela desigualdade de Jensen, segue que \[ E[S]=E[\sqrt{S^2}]\leq \sqrt{E[S^2]} = \sqrt{\sigma^2}=2, \]
ou seja, \(E[S] \leq 2\).
Utilizando série de Taylor, obtemos boa aproximação tanto para esperança como para variância. De fato, sejam \(g:R_+ \to R\) uma função contínua de classe \(C^2\) e \(X\) uma variável aleatória. Por série de Taylor,
\[ E[g(X)]\cong g(E[X])+ \frac{Var[X]}{2}g^{"}(E[X])\quad \wedge \quad Var[g(X)]\cong \big(\;g^{'}(E[X])\;\big)^2 \;Var[X]. \] No nosso caso, temos \(X=S^2\) e a função contínua de classe \(C^2\), \(g:R_+\to R\), é definida por \(g(y):=\sqrt{y}\).
Como \[ \begin{align} g^{'}(y)=\frac{1}{2\sqrt{y}} \quad \wedge \quad g^{"}(y)=-\frac{1}{4y^{3/2}}, \quad y>0, \end{align} \]
então
\[ \begin{align} E[S]=E[\sqrt{S^2}]&\cong g(E[S^2])+ \frac{Var[S^2]}{2}g^{"}(E[S^2])\\ &=\sqrt{2^2} +\frac{2\times 2^4}{2\times(17-1)}\bigg(-\frac{1}{4\times (2^2)^{3/2}}\bigg)\\ &=2-\frac{1}{4\times 8}\\ &=1,96875 \quad (\;< 2\;), \quad \text{e}\\\\\\ Var[S]= Var[\sqrt{S^2}]&\cong \big(\;g^{'}(E[S^2])\;\big)^2\;Var[S^2]\\ &=\bigg(\frac{1}{2\sqrt{2^2}}\bigg)^2 \frac{2\times 2^4}{(17-1)}\\ &=\frac{2}{4\times 2^2}\\ &=0,125. \end{align} \]
### Variância e Média de S simuladas
set.seed(240124)
m <- 1e6 ; n <- 17
mat_dados <- replicate(m, rnorm(n,0,2))
S2 <- apply(mat_dados,2,var)
var_S <- ( (m-1)/m ) * var(sqrt(S2))
media_S <- mean(sqrt(S2))
setNames( c(media_S,var_S), c("E[S]","Var[S]") )
## E[S] Var[S]
## 1.9686706 0.1232902
Conclusão: No item, afirma-se que \(E[S]=2\); logo o item está incorreto.