EXERCICE 1

Albert et Bernard se rendent au stand de tir pour viser une cible. Albert achète 10 cartouches. Il atteint la cible avec une probabilité 0.2. Bernard achète 20 cartouches. Il atteint la cible avec une probabilité 0.1. On supposera tous les tirs indépendants.

1. Donner les lois du “nombre de tirs qui atteignent la cible” pour Albert et pour Bernard.

SOLUTION 1.1. Soit \(A\) et \(B\) le “nombre de tirs qui atteignent la cible” pour Albert et Bernard,respectivement. On a \(A\) suit une loi Binomiale \(\mathcal{B}(10,0.2)\) et \(B\) suit une loi Binomiale \(\mathcal{B}(20,0.1)\).

2. Calculez la probabilité qu’Albert atteigne entre 3 et 5 fois la cible.

SOLUTION 1.2. On trouve

round(pbinom(5,10,0.2)-pbinom(2,10,0.2),4)
## [1] 0.3158

3. Calculez la probabilité que Bernard atteigne au moins 5 fois la cible.

SOLUTION 1.3. On cherche \(\Pr(B\geq 5)=1-\Pr(B\leq 4)\). On trouve

1-round(pbinom(4,20,0.1),4)
## [1] 0.0432

4. Calculez la probabilité que Bernard atteigne exactement 5 fois la cible.

SOLUTION 1.4. On trouve

round(dbinom(5,20,0.1),4)
## [1] 0.0319

5. (*) Calculez la probabilité qu’Albert et Bernard atteignent le même nombre de fois la

cible.

SOLUTION 1.5. On veut calculer \[\Pr(A=B)=\sum_{x=0}^{10}\Pr(A=x,B=x).\] Comme les variables sont indépendantes, on a \[\Pr(A=B)=\sum_{x=0}^{10}\Pr(A=x)\Pr(B=x).\] Soit

dbinom(0:10,10,0.2)%*%dbinom(0:10,20,0.1)
##           [,1]
## [1,] 0.2187767

6. Calculez la probabilité que Bernard atteigne plus de fois la cible qu’Albert.

SOLUTION 1.6. On veut calculer \[\Pr(B>A)=\sum_{x=0}^{10}\sum_{y=x+1}^{20}\Pr(A=x)\Pr(B=y),\] que l’on peur réecrire \[ \Pr(B>A)=\sum_{x=0}^{10}\Pr(A=x)\sum_{y=x+1}^{20}\Pr(B=y). \]

dbinom(0:10,10,0.2)%*%pbinom(0:10,20,0.1,lower.tail = FALSE)
##           [,1]
## [1,] 0.3860422

6.bis Quelle est la probabilité que Albert touche plus de fois la cible que Benard.

SOLUTION 1.6 bis

1-0.3860422-0.2187767
## [1] 0.3951811

7. Quel nombre de cartouches (au lieu de 20) Bernard doit-il acheter s’il veut atteindre plus de fois la cible que André dans plus de 50% des cas ?

SOLUTION 1.7.

dbinom(0:10,10,0.2)%*%pbinom(0:10,26,0.1,lower.tail = FALSE)
##           [,1]
## [1,] 0.5123731

Réponse 26 cartouches

SOLUTION 1.7. Graphiquement

On déclare une fonction qui calcule la proba que \(B\) touche plus souvent la cible que \(A\) en fonction de \(n\) le nombre de cartouches

Prob=function (n)
{pr=dbinom(0:10,10,0.2)%*%pbinom(0:10,n,0.1,lower.tail = FALSE)
return(pr)}
res=c()
for (n in 1:100)
{
res=c(res,Prob(n))
}
plot(1:100,res)

# EXERCICE 2 Le nombre de roses produites par un rosier suit une loi de poisson de moyenne 20. ### 1. Quelle est la probabilité qu’un rosier produise entre 18 et 23 roses ? SOLUTION 2.1.

ppois(23,20)-ppois(17,20)
## [1] 0.4904644

2. Quelle est la probabilité qu’un rosier produise plus de 22 roses ?

SOLUTION 2.2.

ppois(22,20,lower.tail = FALSE)
## [1] 0.2793887

3. Vous avez acheté 10 rosiers (leurs productions sont supposées de même loi et indépendantes). Quelle est la probabilité qu’ils produisent au total plus de 220 roses ?

SOLUTION 2.3.

ppois(220,200,lower.tail = FALSE)
## [1] 0.07530144

EXERCICE 3

La durée de vie d’une ampoule LED suit une loi normale de moyenne 5000 heures et d’écart-type 300 heures.

1. Quelle est la probabilité qu’une ampoule prise au hasard dure plus de 5500 heures ?

SOLUTION 3.1.

pnorm(5500,5000,300,lower.tail = FALSE)
## [1] 0.04779035

2. Quelle est la probabilité qu’une ampoule prise au hasard dure entre 4500 et 5200 heures ?

SOLUTION 3.2.

pnorm(5200,5000,300)-pnorm(4500,5000,300)
## [1] 0.6997171

3. Complétez la phrase suivante : “1% des ampoules durent moins de 4302 heures”.

SOLUTION 3.3.

qnorm(0.01,5000,300)
## [1] 4302.096

EXERCICE 4

Le fichier Exercice4.xlsx contient des données sur le temps en heures mis pour la livraison d’un colis. ### 1. Estimer par intervalle de confiance avec un niveau de confiance de 99% le temps moyen de livraison d’un colis.

SOLUTION 4.1.

library(readxl)
Exercice4 <- read_excel("Exercice4.xlsx")
head(Exercice4)
## # A tibble: 6 x 1
##   Temps
##   <dbl>
## 1   6.9
## 2   6.9
## 3   7.3
## 4   7  
## 5   7  
## 6   6.8
TTEST=t.test(Exercice4$Temps,conf.level = 0.99)
TTEST$conf.int[1:2]
## [1] 6.840485 6.978182

2. Peut-on conclure avec un niveau de significativité de 1% qu’en moyenne, un colis est livré en moins de 7 heures ?

SOLUTION 4.2.

On veut tester \(H_0:\mu =7\) contre \(H_1:\mu <7\). On effectue un test de student unilatéral à gauche.

TTEST2=t.test(Exercice4$Temps,mu=7,alternative = "less")
TTEST2$p.value
## [1] 0.0004197577

Comme la p-value vaut 4/10000 qui est bien inférieur à 1%, on rejette \(H_0\). On peut en inférer qu’il y a un niveau de preuve suffisante pour conclure à la rapidité moyenne de la livraison (moins de 7 heures).

EXERCICE 5

Une boutique de luxe veut estimer le nombre de clients hebdomadaire en fonction du nombre de publicités hebdomadaire parues dans les magazines de mode. Le fichier Exercice5.xlsx contient les données de 26 semaines où l’on a observé ces deux variables.

On veut estimer le modèle \[ \text{Clients}=\beta_0+\beta_1\times \text{Publicites}+\varepsilon. \] ### 1. Donnez les coefficients de la régression linéaire envisagée.

SOLUTION 5.1.

Exercice5 <- read_excel("Exercice5.xlsx")
head(Exercice5)
## # A tibble: 6 x 2
##   Publicites Clients
##        <dbl>   <dbl>
## 1          5     353
## 2          6     319
## 3          3     440
## 4          2     332
## 5          4     172
## 6          2     331
LM=lm(Clients ~ Publicites,data=Exercice5)
b0=LM$coefficients[1]
b1=LM$coefficients[2]
b0
## (Intercept) 
##    296.9197
b1
## Publicites 
##   21.35597

2. Donnez et interprétez le coefficient de détermination.

SOLUTION 5.2.

SLM=summary(LM)
SLM$r.squared
## [1] 0.08521063

Avec ce modèle, on explique uniquement 8.5% de la variance totale.

3. Donnez une estimation de l’écart-type des erreurs.

SOLUTION 5.3.

SLM$sigma
## [1] 132.9601

4. Représentez la droite de régression à l’aide d’un graphique.

SOLUTION 5.4.GGPLOT

library(ggplot2)
ggplot(Exercice5,aes(Publicites,Clients))+geom_point()+geom_smooth(method='lm')
## `geom_smooth()` using formula 'y ~ x'

### 5. Donnez une estimation par intervalle de confiance à 95% du nombre de clients si 5 publicités sont publiées une semaine donnée.

SOLUTION 5.5.

round(predict.lm(LM,new=data.frame(Publicites = 6),interval = "prediction"))
##   fit lwr upr
## 1 425 140 710