Soit \(X_1, . . . ,X_n\) un \(n\)-échantillon de loi \(X \sim N(50, 15)\). \(E(X) = 50\) et \(Var(X) = 15^2 = 225\)

1. Rappeler les hypothèses satisfaites par les variables \(X_1,X_2, . . . ,X_n\) puis calculer \(E(\overline{X}_n)\) et \(Var(\overline{X}_n)\).Quelle est la loi de \(\overline{X}_n\) dans le cas où \(n = 16\) ?

\[\overline{X}_n = \frac{1}{n} \sum_{i=1}^n X_i = \frac{X_1+ \cdots +X_n}{n}, \quad \text{moyenne empirique de l'échantillon}\]

Dans le cas où \(n=16\), on a prouvé en cours que \(\overline{X}_n \sim N(50, 15/4)\)

Comparons les lois théoriques \(N(50, 15)\) (rouge) et \(N(50, 15/4)\) (bleu)



On va vérifier ce résultats à l’aide de simulations


Les 200 premières simulations


Histogrammes des séries M et X




2. Dans le cas où n = 16, déterminer le plus petit intervalle contenant \(\overline{X}_n\) avec une probabilité 0.9.

Nous avons démontré en cours que l’intervalle est \(I = [43.83, 56.17]\)




On va maintenant répondre grace à la simulation précédente.

Nous avons 50000 moyennes. Nous allons demander au logiciel de nous calculer les quantilles empriques d’ordre 0.05 et 0.95



On va illustrer les résultats de l’exercice pour \(n =1, 2, \dots, 16\)


Loi de \(\overline{X}_n\) pour \(n=1, 2, \dots, 16\)





Relation entre la taille de l’échantillon et la variance dans nos simulations



Si on prend le logarithme des deux quantités


On obtient l’équation la droite de régression avec la formule appris en 1ère année

On a donc :

\[\ln(\sigma^2(\overline{X}_n)) = 5.42 - \ln(n)\] Ainsi

\[ \begin{equation} \begin{aligned} \sigma^2(\overline{X}_n) &= e^{5.42- \ln(n)}\\ \sigma^2(\overline{X}_n) &= e^{5.42} \times \frac{1}{n} \\ \sigma^2(\overline{X}_n) &= \frac{225.9}{n} \end{aligned} \end{equation} \]

On a donc montrer empiriquement que:

\[\sigma^2(\overline{X}_n) = \frac{225.9}{n} \approx \frac{\sigma^2(X)}{n} = \frac{225}{n}\] Ce qui est bien le résultat du cours.