Soit \(X_1, . . . ,X_n\) un \(n\)-échantillon de loi \(X \sim N(50, 15)\). \(E(X) = 50\) et \(Var(X) = 15^2 = 225\)
\[\overline{X}_n = \frac{1}{n} \sum_{i=1}^n X_i = \frac{X_1+ \cdots +X_n}{n}, \quad \text{moyenne empirique de l'échantillon}\]
Dans le cas où \(n=16\), on a prouvé en cours que \(\overline{X}_n \sim N(50, 15/4)\)
Comparons les lois théoriques \(N(50, 15)\) (rouge) et \(N(50, 15/4)\) (bleu)
On va vérifier ce résultats à l’aide de simulations
Les 200 premières simulations
Histogrammes des séries M et X
Nous avons démontré en cours que l’intervalle est \(I = [43.83, 56.17]\)
On va maintenant répondre grace à la simulation précédente.
Nous avons 50000 moyennes. Nous allons demander au logiciel de nous calculer les quantilles empriques d’ordre 0.05 et 0.95
Loi de \(\overline{X}_n\) pour \(n=1, 2, \dots, 16\)
Relation entre la taille de l’échantillon et la variance dans nos simulations
Si on prend le logarithme des deux quantités
On obtient l’équation la droite de régression avec la formule appris en 1ère année
On a donc :
\[\ln(\sigma^2(\overline{X}_n)) = 5.42 - \ln(n)\] Ainsi
\[ \begin{equation} \begin{aligned} \sigma^2(\overline{X}_n) &= e^{5.42- \ln(n)}\\ \sigma^2(\overline{X}_n) &= e^{5.42} \times \frac{1}{n} \\ \sigma^2(\overline{X}_n) &= \frac{225.9}{n} \end{aligned} \end{equation} \]
On a donc montrer empiriquement que:
\[\sigma^2(\overline{X}_n) = \frac{225.9}{n} \approx \frac{\sigma^2(X)}{n} = \frac{225}{n}\] Ce qui est bien le résultat du cours.